推荐几个机器学习算法及应用领域相关的中国大牛

本文介绍了多位在中国人工智能领域有着卓越贡献的学者,包括李航、周志华、杨强等,涉及信息检索、机器学习、数据挖掘等多个方向。

李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习。近年来,主要与人合作使用机器学习方法对信息检索中排序,相关性等问题的研究。曾在人大听过一场他的讲座,对实际应用的问题抽象,转化和解决能力值得学习。


周志华:http://cs.nju.edu.cn/zhouzh/,是南京大学的杰青,机器学习和数据挖掘方面国内的领军人物,其好几个研究生都进入了美国一流高校如uiuc,cmu等学习和深造。周教授在半监督学习,multi-label学习和集成学习方面在国际上有一定的影响力。另外,他也是ACML的创始人。人也很nice,曾经发邮件咨询过一个naive的问题,周老师还在百忙之中回复了我,并对我如何发邮件给了些许建议。


杨强:http://www.cse.ust.hk/~qyang/,香港科技大学教授,也是KDD 2012的会议主席,可见功力非同一般。杨教授是迁移学习的国际领军人物,曾经的中国第一位acm全球冠军上交的戴文渊硕士期间就是跟他合作发表了一系列高水平的文章。还有,杨教授曾有一个关于机器学习数据挖掘有意思的比喻:比如你训练一只狗,若干年后,如果它忽然有一天能帮你擦鞋洗衣服,那么这就是数据挖掘;要是忽然有一天,你发现狗发装成一个老太婆消失了,那么这就是机器学习。


李建中:http://db.hit.edu.cn/jianzhongli/,哈工大和黑大共有教授,是分布式数据库的领军人物。近年来,其团队在不确定性数据,sensor network方面也发表了一系列有名文章。李教授为人师表,教书育人都做得了最好,在圈内是让人称道的好老师和好学者。


唐杰:http://keg.cs.tsinghua.edu.cn/jietang/,清华大学副教授,是图挖掘方面的专家。他主持设计和实现的Arnetminer是国内领先的图挖掘系统,该系统也是多个会议的支持商。


张钹: http://www.csai.tsinghua.edu.cn/personal_homepage/zhang_bo/index.html  清华大学教授,中科院院士,。现任清华大学信息技术研究院指导委员会主任,微软亚洲 研究 院技术顾问等。主要从事人工智能、 神经网络 、遗传算法、智能机器人、 模式识别 以及智能控制等 领域 的研究工作。在过去二十多年中,张钹教授系统地提出了问题求解的商空间理
论。近年来,他建立了神经与认知计算研究中心以及多媒体信息处理研究组。该研究组已在图像和视频的分析与检索方面取得一些重要研究成果。

刘铁岩:http://research.microsoft.com/en-us/people/tyliu/ MSRA研究主管,是learning to rank的国际知名学者。近年逐步转向管理,研究兴趣则开始关注计算广告学方面。


王海峰:http://ir.hit.edu.cn/~wanghaifeng/ 信息检索,自然语言处理,机器翻译方面的专家,ACL的副主席,百度高级科学家。近年,在百度主持研发了百度翻译产品。


何晓飞: http://people.cs.uchicago.edu/~xiaofei/  浙江大学教授,多媒体处理,图像检索以及流型 学习 的国际领先学者。

朱军:http://www.ml-thu.net/~jun/ 清华大学副教授,机器学习绝对重量级新星。主要研究领域是latent variable models, large-margin learning, Bayesian nonparametrics, and sparse learning in high dimensions. 他也是今年龙星计划的机器学习领域的主讲人之一。


吴军:http://www.cs.jhu.edu/~junwu/ 腾讯副总裁,前google研究员。著名《数学之美》和《浪潮之巅》系列的作者。


张栋:http://weibo.com/machinelearning 前百度科学家和google研究员机器学习工业界的代表人物之一。


戴文渊: http://apex.sjtu.edu.cn/apex_wiki/Wenyuan_Dai  现百度凤巢ctr预估组leader。前ACM大赛冠军,硕士期间一系列transfer learning方面的高水平论文让人瞠目结舌。
### 机器学习算法概述 机器学习是一门研究如何让计算机利用经验自动改进性能的技术科学。它涵盖了多种类型的算法,每种算法都有其特定的应用场景和优势。以下是几种常见的机器学习算法及其典型应用场景。 #### 分类算法 分类算法用于预测输入数据属于哪个类别。这类算法广泛应用于多个领域,例如医疗诊断、垃圾邮件过滤和客户细分等。一些常用的分类算法包括支持向量机(SVM)[^1]、决策树(Decision Trees)和随机森林(Random Forests)[^2]。 ```python from sklearn.svm import SVC model = SVC() model.fit(X_train, y_train) predictions = model.predict(X_test) ``` #### 回归算法 回归算法主要用于连续数值的预测问题,比如房价预测或股票价格走势估计。线性回归是最基本的形式之一,而更高级的方法则有岭回归(Ridge Regression)和支持向量回归(SVR)[^1]。 ```python from sklearn.linear_model import LinearRegression regressor = LinearRegression() regressor.fit(X_train, y_train) y_pred = regressor.predict(X_test) ``` #### 聚类算法 当没有明确标签时,聚类技术可以帮助发现数据中的自然分组结构。K均值(K-Means)是一种简单有效的无监督学习方法;然而,在处理大规模或者高维度的数据集中,EM算法可能提供更加稳健的结果尽管它的计算成本较高[^3]。 #### 关联规则学习 这种类型的学习寻找项目之间的有趣关系,常被零售业用来做市场篮子分析。“如果顾客买了面包,他们也很可能会买牛奶。”就是这样一个例子。Apriori 和 FP-Growth 是两种流行的相关挖掘技术[^5]。 #### 自动编码器与深度学习模型 对于那些涉及大量非结构性数据的任务来说,像自编码器这样的深层架构能够捕捉到非常复杂的特征表示形式,并且已经被成功部署到了诸如降噪、图像重建等领域之中。另外还有专门针对序列建模设计出来的LSTM单元以及Transformer框架等等,则进一步推动了自然语言处理(NLP)方向的发展进程[^4]。 --- ### 总结 以上仅列举了几大主流分支下的部分代表作而已实际上还有很多其他种类值得探索尝试。选择合适的工具取决于具体业务需求以及可用资源情况等因素综合考量之后再做出决定最为明智
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值