良好的逻辑设计和物理设计是高性能的基石,应该根据系统将要执行的查询语句来设计Schema,这往往需要权衡各种因素。例如,反范式的设计可以加快某些类型的查询,但同时可能使另一些类型的查询变慢。比如添加技术表和汇总表时一种很好的优化查询的方式,但这些表的维护成本可能会很高。MySQL独有的特性和实现细节对性能的影响也很大。
选择优化的数据类型
MySQL支持的数据类型非常多,选择正确的数据类型对于获得高性能至关重要。不管存储哪种类型的数据,下面几个简单的原则都有助于做出更好的选择。
① 更小的通常更好:
一般情况下,应该尽量使用可以正确存储数据的最小数据类型。更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处理时需要的CPU周期也更少。
但是要确保没有低估需要存储的值的范围,因为在schema中的多个地方增加数据类型的范围是一个非常耗时的操作。如果无法确定哪个数据类型是最好的,就选择你认为不会超过范围的最小类型。
② 简单就好:
简单数据类型的操作通常需要更少的CPU周期。例如,整形比字符操作代价更低,因为字符集和校对规则(排序规则)使字符比较比整形比更复杂。
③ 尽量避免NULL:
很多表都包含可以为NULL的列,即使应用程序并不需要保存NULL也是如此,这是因为可为NULL是列的 默认属性。通常情况下最好指定为NOT NULL,除非真的需要存储NULL值。
如果查询中包含可为NULL的列,对MySQL来说更难优化,因为NULL的列使得索引、索引统计和值比较都更复杂。可为NULL的列会使用更多的存储空间,在MySQL里也需要特殊处理。当可以为NULL的列被索引时,每个索引记录需要一个额外的字节,在MyISAM里甚至还可能导致固定大小的索引变成可变大小的索引(例如只有一个整数列的索引)。
通常可以把NULL的列改为NOT NULL带带的性能提升比较小,所以调优时没有必要受限在现有schema中查找并修改这种情况,除非确定这会导致问题。但是,如果计划在列上建立索引,就应该尽量避免设计成可为NULL的列。
当然也有例外,例如InnoDB使用单独的位(bit)存储NULL值,所以对于稀疏数据(很多值为NULL,只有少数行非NULL)有很好的空间效率。但这一点不适用与MyISAM。
在为列选择数据类型时,第一步需要确定合适的大类型数字、字符串、时间等。这通常是很简单的,但是我们会提到一些特殊的不是那么直观的例子。
下一步是选择具体类型。很多MySQL的数据类型可以存储相同类型的数据,只是存储的长度和范围不一样、允许的经度不同,或者需要的无力空间(磁盘和内存空间)不同。相同大类型的不同子类型数据有时也有一些特殊的行为和属性。
例如,DATATIME和TIMESAMP列都可以存储相同类型的数据:时间和日期,精确到秒。然而TIMESTAMP只使用DATATIME一半的存储空间,并且会根据时区变化,具有特殊的自动更新能力。另一方面,TIMESTAMP允许的时间范围要小得多,有时候他的特殊能力也会成为障碍。——芝麻代理
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31561243/viewspace-2632762/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/31561243/viewspace-2632762/