Azure 表服务与 ADO.NET 数据服务深度解析
1. Azure 表服务特性
在各类论坛、书籍以及博客中,常能看到一些“专家”建议通过反规范化来提升性能,但鲜有人解释其背后的原因。其实原理很简单,不同表中的数据通常存储在磁盘的不同文件中,有时甚至存储在不同的机器上。规范化意味着数据库连接时必须将多个表加载到内存中,这需要从多个位置读取数据,从而影响性能。Azure 表服务性能出色的原因之一,就是其数据默认采用反规范化存储。
如果能接受极短时间的数据不一致,可进行异步写入或将写入操作移至工作进程。实际上,所有主流的 Web 2.0 网站(如 Flickr)都会频繁运行工具来检查和修复数据一致性问题。
Azure 表服务还有以下特性:
- 无架构 :固定架构有一定优势,它能像安全网一样,用灵活性换取安全性,可尽早捕获代码中数据类型不匹配的错误。但处理半结构化数据时,这个“安全网”就成了阻碍。修改表结构来添加或更改列非常困难,有时甚至无法实现。而 Azure 表没有架构,同一表中的实体可以有完全不同的属性或不同数量的属性。和反规范化一样,开发者需要确保更新操作符合正确的架构。
- 无分布式事务 :习惯使用事务来维护数据一致性和完整性的人,可能会对没有事务的情况感到担忧。但在任何分布式存储系统中,跨机器的事务都会影响性能。和规范化一样,开发者需要自行维护一致性并运行脚本来确保这一点。像 Facebook 和 Flickr 等大型服务在扩展时早已摒弃了事务,这是基于云的存储系统必须做出的基本权衡。不过,虽然 Azure 表服务不支持分布式事务,但支持“实体组事务”,可将同一分区中实体的请