大数据3V Volume(海量) velocity(速度快) variety(多样化)
表是二维表
Table/Relation (表)
•列(Column):一个属性,有明确的数据类型
例如:数值类型(e.g., int, double),字符串类型(varchar),
类别类型(有些像程序语言中的enum)
必须是原子类型,不能够再进一步分割,没有内部结构
•行(Row):一个记录(tuple, record)
表是一个记录的集合
记录之间是无序的
•通常是一个很瘦长的表
几列到几十列
成千上万行,很大的表可以有亿/兆行
Key (键)
•特殊的列
•有什么用?
取值是唯一的
唯一确定一个记录
• Primary key (主键)
唯一确定本表中的一个记录
• Foreign key (外键)
是另一个表的Primary key
唯一确定另一个表的一个记录