大数据算法学习笔记(2):大数据算法

本文深入探讨了大数据问题求解过程及算法设计方法,包括访问数据时间优化、内存使用、并行处理和人参与计算等策略,同时阐述了大数据算法与传统算法的区别,并详细介绍了时间空间复杂度、I/O复杂度、结果质量分析等关键概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

大数据上问题求解问题的过程:

1、可计算否?(图灵机模型)

2、能行可计算否?(利用现有的资源在时间约束内完成)

3、算法设计与分析

4、用计算机语言实现算法。

5、构建一个面向大数据的软件系统


大数据算法:

定义:在给定的资源约束下,以大数据为输入,在给定时间约束内可以生成满足给定约束结果的算法。

与传统算法区别:可以不是精确算法、内存算法、串行算法、仅在电子计算机上运行(有人参与)

不仅是云计算、MapReduce、大数据分析与挖掘的算法。


大数据的特点与大数据算法:

数据量大:缩减数据量、设计合理的存储结构;速度:降低时间复杂度。

难度:
1、访问全部数据时间过长:读取部分数据  (时间亚线性算法)
2、数据难于放入内存计算:将数据存储到磁盘上、仅基于少量数据进行计算。(外存算法、空间亚线性算法)
3、单个计算机难以保存全部数据,但是计算需要整体数据:并行处理(并行算法)
4、计算机计算能力不足或知识不足:人来帮忙(众包算法)



大数据的算法设计技术:


1、精确算法设计方法:DP、贪心……
2、并行算法
3、近似算法
4、随机算法
5、在线算法/数据流算法
6、外存算法
7、面向新型体系结构的算法
8、现代优化算法:模拟退火、蚁群、遗传等


大数据的算法分析

1、时间空间复杂度
2、I/O复杂度
3、结果质量(近似比、competitive ratio)
4、通讯复杂性

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值