第八界中国云计算大会,简单回忆
1,关于机器学习
(1)同一个深度学习算法做同一件事,可以做得很好,但是不可以形成模块化,事实上一人也不可能只做一件事。
(2)开发通用的深度学习算法,让同一算法可以做多件事情,发现可以实现模块化。
研究人的大脑行为的有很多,没有人把人的大脑和身体一块结合起来研究
利用模拟的线虫做加强深度学习,训练神经网络。
神经元在线虫和随机分布,改变虫的形态发现:
(1)正常的虫子发现运行的点有对称性。
(2)向左或向右呈半圆形的虫子运行的点对称性更好。
伯明翰大学的教授从机器学习+深度学习+生物神经网络三个方面说明了从林法则,强者更容易变强。
4,自然语言处理
用友分享了特定领域的语音识别技术,一直和百度的通用识别做对比,明显讲的有问题,结果一结束被主持反驳。
5,大数据提升企业竞争力
大数据研究的基础是数据,特别是精确的数据才有价值。
企业决策要依赖数据。
总结:
1,国家已经出现了数据版权保护相关的政策。
2,(1)部分人通过北航教授关于阿乐法狗的分析讲解,对人工智能的发展持乐观的态度,认为由于引入了30W落点棋谱+3000W胜负棋谱的阿乐法狗占用小李子的事实说明人工智能将来会代替人类。
(2)部分人不这么认为,认为这狗虽然占胜了人类,但是分体会不到胜利的喜悦。
个人认为人工智能&机器人将逐渐在某些高危领域,高度重复化的工作域,将会替代很多人类的工作,即人不想干的以后机器就可以干了。
一些开源的好东西。
1,KUDU
应用场景:实时数据分析,数据报表,读写数据操作。
2,kylin
开源的分布式数据分析引擎
支持SQL
支持,管理界面,任务监控,增量更新
3,pinot
https://github.com/linkedin/pinot
http://blog.youkuaiyun.com/cjfeii/article/details/46742005
分布式实时OLAP数据分析平台
类sql,不支持join
支持多种数据源,kafka,hadoop
自动数据过期
4,DRUID
一个用于大数据实时处理的开源分布式系统