分类问题。分类电子邮件。
垃圾邮件举个例子。
分析两个对ipad评价是好是坏的过程。
这是两种数据,结构数据就像表格那种,已经分类好了。非结构数据,就是文本,特征需要自己提取。
这个就是文本的情况下提取特征的方法。
其实每个词代表的信息量是不一样的。像一般的常用词的话,信息量就低。想is ,a,i,am等
网页分类。问题就是提炼出主题,特征就是文本,网址,连接,图像等
树状分类法,其实是一个很好的方法。
辅助的知识,可以提高搜索引擎的搜索能力。
这是一个例子。
几个性能指标的定义。
最后搜索的结果。这里面两个引擎a和引擎b的差别有什么差别不知道。
这里涉及到的是网页的几种排名。
网页搜索的一些问题。网页质量,搜索一次10亿个结果,真的全有效吗?
网页排名,或者是排序上的一些方案。
下一步就是训练,不断调节参数,网页。
测试排序的质量。最大似然估计吗?
这里就是一串的计算过程了。这些式子就比较熟悉了。
这里就是不同的训练方法的结果了。这个产生结果,我不是很明白。
这里就是很多机器学习的挑战了。
我能力有限,但是我努力的学习。这里就是最后一堂了,了解了很多,后面就要开始我对重要算法的详细学习了。