数据科学:从理论到实践的全面解析
数据科学的多元灵感来源
在数据科学的探索之路上,有许多宝贵的灵感源泉。
一方面,《The Quant Shop》节目是一个有趣的参考。对冲基金的量化分析师们通过预测明日价格来获取财富,这引发了我们对价格预测的思考。例如,我们能否利用黄金和石油的历史价格数据准确预测其未来价格?构建成功的价格模型还需要哪些其他信息?该节目每集30分钟,它能让我们更深入地了解八个特定挑战,还可能激发我们去应对自己的预测挑战。
另一方面,Kaggle(www.kaggle.com)为数据科学家提供了一个竞争平台。新的挑战会定期发布,包含问题定义、训练数据以及隐藏评估数据的评分函数。排行榜会展示最强竞争者的分数,获胜者还会在赛后访谈中分享建模秘诀,这有助于提升我们的建模技能。不过要注意,Kaggle呈现的是经过精心定义的问题,数据收集和清理的艰巨工作已为我们完成,它可能会让我们对数据科学产生一种过于美好的错觉。但无论如何,它仍是获取灵感和新项目数据的好地方。例如,以下是一些Kaggle挑战:
|挑战名称|链接|
| ---- | ---- |
|泰坦尼克号沉船谁幸存了?|https://www.kaggle.com/c/titanic|
|特定出租车要去哪里?|https://www.kaggle.com/c/pkdd-15-predict-taxi-service-trajectory-i|
|给定出租车行程需要多长时间?|https://www.kaggle.com/c/pkdd-15-taxi-trip-time-prediction-ii|
数据科学中的智慧与经验
在数据
超级会员免费看
订阅专栏 解锁全文
5238

被折叠的 条评论
为什么被折叠?



