Mysql表结构优化
选择合适的数据类型
数据类型的选择,重点在于合适二字,如何确定选择的数据类型是否合适?
1.使用可以存下你的数据的最小的数据类型。
2.使用简单的数据类型,int要比varchar类型在Mysql处理上简单。
3.尽可能的使用not null定义字段。
4.尽量少用text类型,非用不可时最好考虑分表。
表的范式化和反范式化
范式化:
范式化是指数据库设计的规范,目前说到的范式化一般是指第三设计范式,也就是要求数据表中不存在非关键字段对任意候选关键字段的传递函数依赖则符合第三范式。
比如:
商品名称 | 价格 | 规格 | 分类 | 分类描述 |
---|---|---|---|---|
可乐 | 3 | 300ml | 饮料 | 碳酸饮料 |
雪碧 | 2.5 | 250ml | 饮料 | 碳酸饮料 |
上表中存在以下传递函数依赖关系:
商品名称——分类——分类描述
也就是说存在非关键字段“分类描述”对关键字段“商品名称”的传递函数依赖。所以不符合范式。
不符合第三范式要求的表存在下列问题:
1.数据冗余:(分类,分类描述)对于每一个商品都会进行记录。
2.数据的插入异常、更新异常、删除异常。(对一个数据操作需要修改其他相关的所有数据)
解决方法是拆分表。
反范式化:
反范式化是指为了查询效率的考虑把原本符合第三范式的表适当的增加冗余,已达到优化查询效率的目的,反范式化是一种以空间来换取时间的操作。
表的拆分
表的垂直拆分:
所谓的垂直拆分,就是把原来一个有很多列的表拆分成多个表,这解决了表的宽度问题。通常垂直拆分可以按一下原则进行:
1.把不常用的字段单独存放到一个表中。
2.把大字段独立存放到一个表中。
3.把经常一起使用的字段放在一起。
表的水平拆分:
表的水平拆分是为了解决单标的数据量过大的问题,水平拆分的表每一个表的结构都是一致的。
方法:对id进行hash运算,如果要拆分成4个表,则使用mod(id,4)取模,把不同的数据存到4个表中。
前后台业务由于时效性不一样,可以把前后台的查询分开。