姓名:刘小瑜 班级:电气卓越1701 学号:201701019
一.课程总结
在上本课程之前,我对于人工智能和大数据的了解基本上只是局限于媒体报道,知道它在日常生活中有着很广泛的应用,但是对于其原理和实现过程并没有去深究。经过老师深入浅出的讲解以及自己通过互联网的学习之后,对于人工智能以及大数据了解的更为深入。
人工智能方面,我印象最深的就是深度学习。我课后在网上自己也看了吴恩达的深度学习课程,自己也通过互联网学习了一些相关的理论。发现深度学习是通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。【5】其数学原理本质上其实可以认为是把数字运算向量化,变为了矩阵运算。它的应用十分广泛,其中最主要的有图像处理,语音识别和自然语言处理等领域。
关于大数据技术,IBM公司提出大数据的5V特点:大量、高速、多样、低价值密度、真实性。综合课堂内容和所查资料,我认为大数据技术就是通过高效的数据存储结构和先进的并行数据处理技术来实现对大量、多样、高速生成的数据的管理和利用。其中Google提出的大数据技术“三宝”—— Google File System,Google Bigtable和Mapreduce为大数据的管理和利用注入了新的动力,提供了新思路。
总的来讲,《大数据与人工智能》这门课程让我学到了很多关于大数据和人工智能背后的原理、思想,自己感觉收获颇丰,感谢向老师的辛勤付出!
二.Google大数据三大论文读后感
读完Google大数据三大论文之后,对于大数据的原理了解更加深入的同时也不禁感慨大数据系统设计的复杂性。其中大数据系统处理数据的并行性和分布式储存给我留下了较深的印象。
第一篇论文讲的是一个文件系统Google File System。Google GFS文件系统是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。与传统文件系统相比,GFS文件系统提出了一种完全不同的设计思路。主要有四条:第一,组件失效被认为是常态事件,而不是意外事件;第二,以通常的标准衡量,google的文件非常巨大,因此很多设计的假设条件和参数都需要重新进行调整;第三,绝大部分文件的修改是采用在文件尾部追加数据,而不是覆盖原有数据的方式;第四,应用程序和文件系统API的协同设计提高