原文:https://blog.youkuaiyun.com/g11d111/article/details/77164074
问题目标:根据问题内容,定位已经被回答过的类似问题
问题类型:聚类(Cluster);自然语言处理(NLP)
问题特点:避免用户问重复的问题,也节省答题人的时间。
问题目标: 预测文章的哪部分是全球读者更喜欢的(有意愿点击的)
问题类型: 推荐系统(Recommendation System);自然语言处理(NLP)
问题特点: 文本相似度分析,新闻热度分析。
⑳ TalkingData Mobile User Demographics
问题目标:根据用户的手机使用情况,地理位置等信息对用户做画像
问题类型:用户画像(User portrait);聚类(Cluster)
问题特点:特征维数多且不同尺度;聚类分析。
⑮ Microsoft Malware Classification Challenge (BIG 2015)
问题目标:基于文件内容和特点对恶意软件进行分类
问题类型: 分类问题(Classification)
问题特点:神经网络(NN)
㉞ The Big Data Combine Engineered by BattleFin
问题目标: 根据新闻和情感数据分析来预测短期股价的变化
问题类型: 回归问题(Regression);时间序列分析(Time-Series Analysis)
问题特点: 情感分析;金融数据。