SSDS2015参会心得

       ShanghaiTech Symposium on Data Science (SSDS) 2015是由上海科技大学举办的。上科大马毅老师邀请了一堆大牛来讲座。会议免注册费,组织得非常不错。在此感谢举办方上科大和组织者们。

       参会第一感受就是英语太重要了。会议中演讲者和提问者都是用英语表述。报告中,对那些我熟悉点背景的报告,还能听懂一些。如果没有一点背景知识或者报告者带点地方口音,那就完全follow不上了。提问也是,每到提问环节,都是那几个受邀的报告者互相提问了解问题。我觉得原因应该是参会几乎全部都是国内的学生,大家都不喜欢提问。更可能原因是语言障碍,有问题但是都不知道怎么用英语表达。印象中也就Rene Vidal报告后有一个学生样的哥们挤牙膏样提了一个关于bidirectional RNN的问题(没有别的意思,大家英语都不流利)。这一点需要加强,毕竟以后英语交流的场合会更多。

        第二个感受就是DL在机器学习上没有CV和NLP那么大火。Optimization和Representation等这些问题好多人也在挖。以前对机器学研究者了解不多,就知道几个搞DL。这一次会议后,猛地又了解到了几个大牛和他们各自的研究方向。比如Stephen Boyd,John Wright等。

        再就是自己的机器学习太薄弱了。听这些报告都是前面introduction还行,深入到后面就开始摸不着头脑了。后面的一年这个急需加强。

       这一次也了解到不少有趣的东西。Stephen Boyd的报告Convex Optimization: from Real-Time Embedded to Large-Scale Distributed就挺好玩的。另一个关于Large-Scale Distributed报告貌似挺火的(大数据的关系),还有一个报告也是这个主题。这个报告提及的AMDD算法(http://stanford.edu/~boyd/admm.html)和CVX系统(http://cvxr.com/cvx/)以后可以了解下。

      山世光老师关于Face Recognition的Tutorial也很精彩。 其中有一个Face verification[应该是Duplicate identity checking]很有意思,就是给两个人脸图片,让机器来判断是不是同一个人。以前就知道这个可以反恐,山老师举例子讲也可以做到去鉴别是否一个人有多个护照(人名可以瞎编,但是人脸是identical)。百度和微软都推出的测测你和哪个明星脸像估计就是个方向的小应用。同时,微软上次推出的句向量工具包Sent2vec也就是这个思路,不过是放在自然语言处理上了。这个我也觉得有大用途。在舆情监控上,网民喜欢把一些敏感事件人名地名换一下,但是事情主题还是没有变,不知道是不是可以用这个进行“语义”相似度判定。Face alignment也挺有意思的,好像中文叫做人脸校准,以后有机会了解下。

       朱军老师的报告有一个data-parallel,graph-parallel和model-parallel。目前还不清楚这个是讲什么的,改天研究研究。

        总之,这次机会挺难得的,发现了自己的不足,以后的学习中需要对这些不足进行加强。希望以后听这种报告更加自如。 

          


关于Matrix Factorization的博客

  1. http://www.flickering.cn/%E6%95%B0%E5%AD%A6%E4%B9%8B%E7%BE%8E/2015/01/%E5%A5%87%E5%BC%82%E5%80%BC%E5%88%86%E8%A7%A3%EF%BC%88we-recommend-a-singular-value-decomposition%EF%BC%89/
  2. http://jinzb.name/v.aspx?i=1842
  3. http://maider.blog.sohu.com/303848412.html
  4. http://www.tuicool.com/articles/RV3m6n#0-tsina-1-43560-397232819ff9a47a7b7e80a40613cfe1
  5. http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html
  6. http://blog.jqian.net/post/pca.html
  7. http://www.mathworks.com/moler/eigs.pdf


标题基于Python的汽车之家网站舆情分析系统研究AI更换标题第1章引言阐述汽车之家网站舆情分析的研究背景、意义、国内外研究现状、论文方法及创新点。1.1研究背景与意义说明汽车之家网站舆情分析对汽车行业及消费者的重要性。1.2国内外研究现状概述国内外在汽车舆情分析领域的研究进展与成果。1.3论文方法及创新点介绍本文采用的研究方法及相较于前人的创新之处。第2章相关理论总结和评述舆情分析、Python编程及网络爬虫相关理论。2.1舆情分析理论阐述舆情分析的基本概念、流程及关键技术。2.2Python编程基础介绍Python语言特点及其在数据分析中的应用。2.3网络爬虫技术说明网络爬虫的原理及在舆情数据收集中的应用。第3章系统设计详细描述基于Python的汽车之家网站舆情分析系统的设计方案。3.1系统架构设计给出系统的整体架构,包括数据收集、处理、分析及展示模块。3.2数据收集模块设计介绍如何利用网络爬虫技术收集汽车之家网站的舆情数据。3.3数据处理与分析模块设计阐述数据处理流程及舆情分析算法的选择与实现。第4章系统实现与测试介绍系统的实现过程及测试方法,确保系统稳定可靠。4.1系统实现环境列出系统实现所需的软件、硬件环境及开发工具。4.2系统实现过程详细描述系统各模块的实现步骤及代码实现细节。4.3系统测试方法介绍系统测试的方法、测试用例及测试结果分析。第5章研究结果与分析呈现系统运行结果,分析舆情数据,提出见解。5.1舆情数据可视化展示通过图表等形式展示舆情数据的分布、趋势等特征。5.2舆情分析结果解读对舆情分析结果进行解读,提出对汽车行业的见解。5.3对比方法分析将本系统与其他舆情分析系统进行对比,分析优劣。第6章结论与展望总结研究成果,提出未来研究方向。6.1研究结论概括本文的主要研究成果及对汽车之家网站舆情分析的贡献。6.2展望指出系统存在的不足及未来改进方向,展望舆情
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值