如何学习机器学习的一点心得

本文分享了一位学习者的机器学习自学经验,包括阅读科普材料、跟踪领域专家、关注重要会议、观看在线课程、阅读专业教材及经典论文,并强调了实践的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

结合自己的学习经历,总结一下如何学习机器学习。我自己的学习过程其实是非常混乱和痛苦的,一个人瞎搞现在也不知道入没入门。希望能对其他想自学机器学习而找不到方向的人有一点点帮助。

一、可以读读一些科普性的,综述性的东西。

南京大学周志华教授写的科普文章《机器学习和数据挖掘》还不错,对机器学习和数据挖掘的区别说的挺好。另外对机器学习的历史和前景做了说明。文章最后也给出了领域内比较重要的会议和期刊。

吴军写的数学之美(浪潮之巅也很赞)可能确切的说应该是搜索、自然语言处理、机器学习的一个综合性科普,但是机器学习本来就和这些领域有着很大的关联的,所以说对学习机器学习的人来说也是一个不错的入门科普。

 

二、可以了解下领域里面的牛人。曾经听香港科技大学的杨强教授在一个讲座上讲过这么一件事,他说如果面试一个学生,一个好的方法就是问他这个领域有哪些牛人,每个牛人的代表性工作是什么,这样可以检验一个人是否真正喜欢并关注这个方向。我觉得说得挺有道理。网上有人总结了一些牛人,当然这些总结都是个人观点,随便看看了解一下就行了。(注:下面的链接不一定是原始出处)

http://blog.sina.com.cn/s/blog_56f7cc3a0100qktd.html   (国外的)

http://blog.sina.com.cn/s/blog_6a6b58ce01017jy3.html  (国内的)

http://blog.youkuaiyun.com/yihaizhiyan/article/details/6795073 (这个有一些是机器视觉里的)

 

三、可以了解下领域的重要会议,前面提到的周的文章有提到,网上也有各种版本的分析,列两个

http://blog.youkuaiyun.com/blow_jj/article/details/2415305 (人工智能和机器学习的)

http://taoo.iteye.com/blog/1052495               (数据库和数据挖掘的)

 

四、可以系统的上一下机器学习的课程,StandfordAndrew Ng的机器学习课程很赞,网上有他的公开课视频,上他的课真是如沐春风,浑身通畅。

课程主页:

http://cs229.stanford.edu/  (里面有讲义,最好打印出来对照视频看)

网易公开课有中文字幕翻译的视频:

http://v.163.com/special/opencourse/machinelearning.html

这是在coursera项目中的版本,好像比网易的内容要多,起码多的有推荐算法的部分

https://class.coursera.org/ml/lecture/preview/index

 

五、可以系统的读一本机器学习的教材,系统的学习很重要。口碑最好的,我自己感觉写的最好的是Christopher M. Bishop写的《pattern Recognition and Machine Learning》

 

六、对一些重要的经典的文章可以拜读一下,下面的这个资料列表可以参考

http://www.newsmth.net/bbsanc.php?path=%2Fgroups%2Fsci.faq%2FNLP%2F1%2FM.1225371502.h0

 

在学习的过程中,手头有一本统计的参考书是必要的,当然还有利器google,不懂的概念随时可以查。

 

七、其实学习机器学习最重要的就是实践了,实践出真知。

                                                                                                                  ==================

                                                                                                                   by lcj ,2012 -10 -14                

### 山东大学软件学院机器学习期末考试资料与复习 对于山东大学软件学院的机器学习课程,期末考试准备可以从多个方面入手。根据以往的经验总结和学生反馈,可以采取以下策略来有效备考。 #### 1. 获取官方提供的复习材料 从往年的经验来看,教师通常会提供一些指导性的复习资料[^1]。这些资料不仅包含了重要的理论概念,还涵盖了历年的典型题目及其解答方式。因此,优先获取并仔细研读这类由学校或授课教师发布的正式文档是非常必要的。 #### 2. 关注实验部分的重要性 值得注意的是,在最终的成绩构成中,实验占据了相当大的比重—达到了总评分数的60%[^2]。这意味着除了传统的笔试外,平时完成的质量也直接影响着整体表现。所以应当重视每一次实践作业的机会,认真对待每一个细节,并确保提交的作品具有原创性和高质量。 #### 3. 掌握核心知识点 针对具体的考点分布情况,应该重点理解各类算法的工作机制、应用场景以及它们之间的对比分析等内容。例如,在处理分类问题时能够熟练运用不同的评估指标;了解如何通过调整参数优化模型性能等实际操作技能也是不可或缺的一部分。 #### 4. 利用社区资源交流心得 最后但同样重要的一点是积极参与同学间的讨论互动。可以通过加入专门的学习小组或是利用网络平台分享各自遇到的问题及解决方案。这种互助式的探索有助于加深记忆印象的同时还能拓宽视野范围。 ```python # 示例代码用于展示决策树构建过程中信息增益计算的方法 def calculate_information_gain(data, attribute): total_entropy = compute_total_entropy(data) weighted_avg_entropy = sum( (len(subset) / len(data)) * compute_subset_entropy(subset) for subset in split_data_by_attribute(data, attribute) ) return total_entropy - weighted_avg_entropy def main(): dataset = load_dataset() # 假设有一个加载数据集函数 outlook_info_gain = calculate_information_gain(dataset, 'Outlook') humidity_info_gain = calculate_information_gain(dataset, 'Humidity') if __name__ == "__main__": main() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值