MySQL学习 - 数据类型的选择-优快云博客

博客围绕MySQL数据库展开，介绍了数据类型选择原则，如整数、实数、字符串等类型特点及选择建议，还提及枚举、日期时间类型。同时给出表设计建议，包括避免的问题、范式与反范式的优缺点及使用场景，以及对视图使用的探讨。

TINYINT / SMALLINT / ... / BIGINT 消耗的存储空间逐渐变大
在它们前面加上 UNSIGNED 标志能进一步将存储能力加大一倍
涉及整数计算最好使用 64 位的 BIGINT
INT(11) 这种写法大部分情况下都没什么意义
- INT(11) 存储能力 = INT(1)
- INT(11) 计算能力 = INT(1)
- 在Mysql一些客户端中，有时候INT(11)会只显示11字符

VARCHAR(变长) - 存储的时候仅消耗一些必要的空间，但是会额外消耗1~2字节记录长度
- 最好不要总是更新VARCHAR
  - 假设变长了，可能导致内存页内没有更多空间存储
  - 假设变短了，可能出现一个无法被利用的内存碎片
- 字符串长度波动幅度非常大的时候用，能占到便宜
CHAR(定长)
- MD5这样的定长度值
- 因为长度不会变，因此内存利用效率更高
VARCHAR & CHAR 具体是如何存储的这要看存储引擎怎么决定
一些行为诸如TRIM是由MYSQL数据库决定的
如果真的按照你说的，VARCHAR只做必要的开销，那么VARCHAR(5) == VARCHAR(200)吗
- 不是，用内存临时表排序的时候会带出很差的表现

假设现在有三种字符串A/B/C，在使用ENUM的情况下实际存储的时候会变成1/2/3。在对这一列进行排序的时候，也是按照1/2/3的方式进行排序的。
不好的地方:
- 排序的时候需要使用FILED( )来指定排序，否则就会按照1/2/3排序
- 因为ENUM的candidate是固定的，因此但凡想要做出一些修改，最大的可能就是ALTER TABLE
- 因为实际存储的时候是按照1/2/3存储的，因此转换存在一些开销，好在大部分时候这个映射表并不大，因此开销也不是很大
好的地方:
- 假设某个属性成为了主键的一部分，面临一些做联表的可能，在联表的时候，做过ENUM映射的表，联的时候会比单纯的字符串快很多
- 在使用 SHOW TABLE STATUS 展示表当前状态的时候使用ENUM会比使用字符串 data_length 更低

标识符有点像一个键，可以用来唯一的确定一列
最好的选择是使用整数类型作为标识符。与之相对的是避免使用字符串作为标识符，因为它们会很消耗空间，大部分时候也挺慢
避免使用UUID - MD5 - SHA1等随机字符串作为索引，这些值会随意分布在很大空间内，从而导致INSERT SELECT 变慢
- 所谓的 "随意分布" / "很大空间" 是指我们在索引生成以后，SHA1随机生成的新值很有可能会插入其中，变慢。带来的其他影响则包含: 页的中间插入 -> 页分裂 / 磁盘随机写入行为
- 完全随机字符串会导致 -> 内容写入到内存块完全随机的地方上，逻辑上相邻的行事实上相距非常远，从而导致SELECT变慢
- 内存访问上有一种说法叫 "局部性原理"，内存里总是有一小片很"热"，总是被访问，这种时候我们选择缓存这一小片，下次访问缓存就很有可能直接拿到想要的数据，整体是快的不行。现在随机数来了，所有地方都是一样"热"，我缓存哪儿？我缓存哪儿对我都没有明显的好处

(接下来可能会反复补充设计表的一些东西)

包含有太多列
枚举映射表太长
过多使用NULL, 尽量避免使用null
- 你可以使用一些符号代替 -1,0 都可以
- 但是使用NULL也代表一定是坏事，如果你的表里有太多不可能发生的数字本身也不好

使用范式
- 好处:
  - 如果没有范式这种东西，表内有太多冗余的信息，你不能说他们是错误信息，只是太多余，然而在你尝试更新一个字段的时候，哪怕你忘记更新其中一处，这些冗余信息就会变成错误信息
  - 使用范式的情况下更新属性通常更清爽也更快
  - 范式化的表通常更小，因此能直接把整表塞进内存，查询很快
- 缺点:
  - 查询全量信息的时候，面临联表，噩梦
使用反范式
- 好处: 无需关联，快
总结
- 实际上纯范式化的数据库 & 纯反范式化的数据库都只是理论上的说说，生产环境下我认为应该还是酌情，以及结合数据库测试的表现来说
  - 例如你现在有user + message 表，其中有个字段叫做 account_name_chinese，按照范式这个字段只应该在user表里出现，但是message也会经常需要它，你可以在数据库的测试中的表现下，酌情使用
  - 但是像现在针对这个字段的更新，你需要更新两张表，这也是你需要考量的点，你会不会经常更新它？你能接受一次更新两张表吗？
  - 避免这种问题，使用trigger解决这种麻烦事 ( 什么是 trigger )