《CS PhD Journey》Chapter 1 — Fall 2017
文章目录
前言
在开学之前,CS学院有一个orientation。在参加orientation的路上,发现自己被一群印度人包围了。这里印度人真多,CS学院80%以上的印度人。上午的orientation是MS和PhD一起,下午是MS和PhD分开。下午的时候,我看到了大部分的CS PhD,得知我这一届来自大陆的CS PhD有11个人,印度人(以及长得像印度人的巴基斯坦人等)加起来大概有二十来个,总共有四十多个人。在orientation上获取的重要数据:大概只有50%的CS PhD会最终毕业拿到doctor学位,大概有50%的CS PhD会更换最初分配的导师。
第二周开始上课,我选了三门课:CSE519 Data Sciences Fundamentals, CSE548 Analysis of Algorithms, CSE591 Topics in Computer Sciences (Smart Energy Computing)
CSE519 Data Science Fundamentals
Data Science (DS) 是非常火的一个方向,我也比较感兴趣,于是选了DS。老师是Steven Skiena,德高望重的一个老师。除了知道几个常见的机器学习(ML)算法之外,DS我几乎是零基础,这注定了这门课将会较为艰难。首先,我Python几乎不会,然而DS的作业和项目都要用Python。老师建议的编程环境是Jupyter Notebook,没有用过。还好这些东西上手都比较快。
总共有三次作业(20%),一个大Project(50%),期末考试(30%),额外奖励(10%)。
第一次作业是看DS项目视频,写感想。视频是Fall 2014 Data Science的学生做的大Project的录像,30分钟。通过看视频,大概了解DS的项目是怎么一回事了,学生遇到了什么问题,是怎么解决的。
第二次作业是Kaggle上的房地产项目。Kaggle给了一个三百万行、五十几列的CVS文件作为数据,一行就是一个房屋,一个房屋有五十几个特征(五十几列)。预测的房屋的价格和真实值的误差的对数。我按照作业的要求一步一步做,前面几个简单的问题一一解决,但是在deadline的前一天,最重要的问题(调用ML算法,得到结果,分析结果)还没有做,而且该如何做我还没有头绪。最后一天晚上,熬夜赶due。幸好抱上了大腿AWZW,他是ZXX请来的外援。AWZW给我提供了一些关键代码,最后涉险过关了。
第三次作业还是Kaggle上的房地产项目,在第二次作业的基础之上,增加了一些问题。这一次是团队合作。我找了ZXX和韩国妹子THNL三个人组队。由于这次作业的deadline和CSE548