大数据:计算机智能与效率的新征程
1. 计算机数据处理的权衡
在计算机领域,一个领域的优势往往伴随着其他领域的代价。以数据存储和处理为例,存储大量数据会导致处理时间变长;而存储较少的数据虽能加快处理速度,但结果可能缺乏足够的信息。
比如,一个计算机程序分析商店的历史销售数据以预测未来销售情况。若仅能获取季度销售数据,处理速度会很快,但数据可能不够详细,无法为定价或布局决策提供有价值的见解。相反,若分析按分钟记录的销售数据,虽能获得更精细的数据和更好的见解,但处理时间会更长,甚至可能需要分块处理。
2. 大数据让计算机更智能高效
2.1 伦敦出租车司机与计算机数据存储
伦敦持证出租车司机能将查令十字街六英里内的伦敦地图存储在记忆中,这是因为在拥挤的街道上,他们需要快速做出导航决策,没有时间进行缓慢的计算和重新计算。同样,处理大量数据的计算机系统也会将数据存储在一个存储系统中,有时全部存储在内存中,有时分布在多个物理系统中。
2.2 计算机内存扩展的挑战与选择
人类可以通过锻炼增加大脑海马体的体积,从而改善记忆功能。但计算机无法去健身房增加内存,它有三种选择:添加更多内存、在内存中交换数据、压缩数据。
添加内存成本高昂,且速度越快的内存越贵。例如,随机存取存储器(RAM)比磁盘内存快 100,000 倍,但价格约贵 100 倍。此外,添加内存还会带来芯片数量限制、电力和散热等问题。
交换数据的方法是依次加载所需信息,但如果要寻找跨多天、多周或多年的模式,频繁交换数据会花费大量时间,使模式难以发现。
压缩数据是利用数据的冗余性,通过压缩
超级会员免费看
订阅专栏 解锁全文
1116

被折叠的 条评论
为什么被折叠?



