隐马尔可夫模型:从用户行为分析到词性标注
1. 决策树与数据分类
决策树是一种强大的数据分类工具,可用于进行分层分类,尤其在某些属性能很好地确定分割点时非常有用。例如,决策树和随机森林在蘑菇可食用性分类方面表现出色。不过,要记住,千万不要在野外使用这种方法来对蘑菇进行分类,最好找真菌学家帮忙。
2. 隐马尔可夫模型概述
直觉在我们的很多行为中起着重要作用。比如,我们凭直觉知道某些单词往往属于特定的词性,或者如果用户访问了注册页面,那么她成为客户的概率就会更高。但如何围绕直觉构建一个模型呢?隐马尔可夫模型(HMMs)擅长利用观测值和对状态工作方式的假设来找到给定系统的隐藏状态。
HMMs可以是有监督的,也可以是无监督的,由于它们依赖于马尔可夫模型,所以也被称为马尔可夫模型。HMMs在不需要在模型中构建大量历史信息的情况下表现良好,并且在为分类添加局部上下文方面也很有效。与朴素贝叶斯分类不同,朴素贝叶斯分类依赖大量历史数据来确定用户是否为垃圾邮件发送者,而HMMs可用于预测模型随时间的变化。
3. 使用状态机跟踪用户行为
销售漏斗是一个描述客户交互不同层次的概念。人们最初是潜在客户,然后会过渡到更活跃的状态。潜在客户就像“潜水者”,他们可能只访问网站一两次,通常不会有太多互动;用户喜欢浏览网站,偶尔会进行购买;客户则非常活跃,已经购买过东西,但通常不会在短时间内大量购买,因此会暂时回到用户状态。
假设我们有一个在线商店,经过分析发现,访问网站的潜在客户中有15%会注册,5%会立即成为客户。当访客已经是用户时,他有5%的概率会取消账户,15%的概率会购买东西。如果访客是客户,他只有2%的概率会取消账
超级会员免费看
订阅专栏 解锁全文
277

被折叠的 条评论
为什么被折叠?



