SQL Server 2005数据挖掘算法

最新推荐文章于 2020-07-26 21:18:18 发布

原创最新推荐文章于 2020-07-26 21:18:18 发布 · 1.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#sql server #数据挖掘 #算法 #网络 #comments #产品

数据仓库/数据挖掘专栏收录该内容

3 篇文章

订阅专栏

本文介绍了多种数据挖掘算法，包括决策树、关联规则、朴素贝叶斯、顺序簇化、时间序列、神经网络和文本挖掘。每种算法都有其独特的应用场景，如预测消费者行为、分析文本数据等。

模型	描述
决策树	决策树算法将基于培训集中的值计算输出的几率。例如，20-30 岁年龄组中每年收入超过 60,000 美元，且有自己的房子的人比没有自己房子的 15-19 岁年龄组的人更可能需要别人提供整理草坪的服务。以年龄、收入和是否有房子等信息为基础，决策树算法可以根据历史数据计算某个人需要整理草坪的服务的几率。
关联规则	关联规则算法将帮助识别各种元素之间的关系。例如，在交叉销售解决方案中就使用了该算法，因为它会记录各个项之间的关系，可以用于预测购买某个产品的人也会有兴趣购买何种产品。关联规则算法可以处理异常大的目录，经过了包含超过五十万种商品的目录的测试。
Naïve Bayes	Naïve Bayes 算法用于清楚地显示针对不同数据元素特定变量中的差异。例如，数据库中每个消费者的 Household Income（家庭收入）变量都会不同，可以作为预测未来购买活动的参数使用。此模型在显示特定组间的差异方面尤为出色，如那些流失的消费者和那些未流失的消费者。
顺序簇化	顺序簇化算法用于根据以前时间的顺序分组或簇化数据。例如，Web 应用程序的用户经常按照各种路径浏览网站。此算法可以根据浏览站点的页面顺序对用户进行分组，以帮助分析消费者并确定是否某个路径比其他路径具有更高的收益。此算法还可以用于进行预测，例如预测用户可能访问的下一个页面。请注意，顺序簇化算法的预测能力是许多其他数据挖掘供应商所无法提供的功能。
时间序列	时间序列算法用于分析和预测基于时间的数据。销售额是最常见的使用时间序列算法进行分析和预测的数据。此算法将发现多个数据序列所反映出来的模式，以便企业确定不同的元素对所分析序列的影响。
神经网络	神经网络是人工智能的核心。它们旨在发现数据中其他算法没有发现的关系。神经网络算法一般比其他算法更慢，但它可以发现各种并不直观的关系。
文本挖掘	文本挖掘算法出现在 SQL Server Integration Services 中，用于分析非结构化的文本数据。利用此算法，各个公司可以对非结构化数据进行分析，如消费者满意度调查中的“comments”（注释）节。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。