数据处理与评分排名:从基础到实践
数据处理相关内容
在数据处理领域,激励机制是推动人们不断进步的有效手段。就像拿破仑为士兵设立各种勋章和装饰,人们往往会为了这些“荣誉”付出更多努力。在一些游戏设计中,如FoldIt,其主要设计原则是将领域的技术性抽象到评分函数中。玩家无需真正理解分子动力学等复杂问题,只需知道某些操作能使分数上升,而另一些则会使分数下降。在游戏过程中,玩家会逐渐建立起对该领域的直觉,从而产生专家可能都想不到的设计。
以下是一些数据处理相关的练习,涵盖了编程、数据来源、数据清洗等多个方面:
1. 编程练习
- 选择Python、R、MatLab、Wolfram Alpha/Language中的一种编程语言,花两小时熟悉它,然后写一篇短文,谈谈对其以下特性的印象:
- 表达能力
- 运行速度
- 库函数的广度
- 编程环境
- 对算法密集型任务的适用性
- 对一般数据处理任务的适用性
- 选择两种主要的数据科学编程语言,编写程序解决以下任务,并比较哪种语言更适合每个任务:
- 打印“Hello World!”
- 从文件中读取数字并按排序顺序打印
- 读取文本文件并统计总单词数
- 读取文本文件并统计不同单词的总数
- 读取数字文件并绘制其频率直方图
- 从网页下载页面并进行数据抓取
- 简单使用Python、R和Matlab,比较喜欢哪种语言,并分析它们的优缺点。
- 构建一个包含n个人身高的数据集,其中p%的身高以英尺为单位记录,其余以米为单位记录。使用统计测试来判断该分布是否与
超级会员免费看
订阅专栏 解锁全文
1368

被折叠的 条评论
为什么被折叠?



