FPGA机器学习之龙星计划机器学习第十九堂

本文探讨了文本分类的基本原理及应用实例,包括垃圾邮件识别、产品评价分析等,并介绍了从非结构化数据中提取特征的方法及其在网页分类中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

分类问题。分类电子邮件。

垃圾邮件举个例子。

分析两个对ipad评价是好是坏的过程。

这是两种数据,结构数据就像表格那种,已经分类好了。非结构数据,就是文本,特征需要自己提取。

这个就是文本的情况下提取特征的方法。

其实每个词代表的信息量是不一样的。像一般的常用词的话,信息量就低。想is ,a,i,am等

网页分类。问题就是提炼出主题,特征就是文本,网址,连接,图像等

树状分类法,其实是一个很好的方法。

辅助的知识,可以提高搜索引擎的搜索能力。

这是一个例子。


几个性能指标的定义。

最后搜索的结果。这里面两个引擎a和引擎b的差别有什么差别不知道。

这里涉及到的是网页的几种排名。

 

网页搜索的一些问题。网页质量,搜索一次10亿个结果,真的全有效吗?

网页排名,或者是排序上的一些方案。

下一步就是训练,不断调节参数,网页。

测试排序的质量。最大似然估计吗?

这里就是一串的计算过程了。这些式子就比较熟悉了。

这里就是不同的训练方法的结果了。这个产生结果,我不是很明白。

这里就是很多机器学习的挑战了。

微笑我能力有限,但是我努力的学习。这里就是最后一堂了,了解了很多,后面就要开始我对重要算法的详细学习了。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值