数据挖掘 理论和实际----理论如何联系实际, 实际如何利用理论

本文探讨了数据挖掘、人工智能理论与实践的结合,强调了在大规模数据处理中面临的挑战,如计算复杂性和抽样方法,并讨论了不同角色(理论研究者、程序员、业务人员)在实施过程中的观点差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

前言: 

     上午把钱都买了权证(580013)(还有我现在还是学生,也没多少钱...)... 就短短的20分钟就-10%..  心凉啊... 想想最近都做什么了, 估计大多时间用在股票上了, 不顾正业也快一个月了..  什么是正业? 我也不知道..  起码这个blog是做算法的....

----------------------------------------------------------------------------------------------------

      理论与实际... 我的数学算法与股市的联系估计近期不会有什么实质性的东西... 就说说 数据挖掘,人工智能的理论与实际的结合..

     在我看来数据挖掘=统计方法+计算机(数据库)+业务知识....

现在BI似乎是很火, 但我看来那也不过只是报表系统加上了简单的统计分析.. 不过这样的进展是不错的... 但有也有被人夸大的地方..就那统计中的 协方差..相关系数的计算 的计算复杂性是多少?你算个10000X10000数据的协方差..相关系数的计算复杂度是多少? 可以试试..  但是电信数据挖掘什么的, 说数据是每天是***万.. 你怎么算不知道.. 如果连这样的 最基本的统计量都算不了 又何谈你那是智能.. (智能有高低.. 与以前的相比确实智能了).. 减少数据量的方法是做抽样.. 但是怎么抽又是一个问题.. 还有抽了要检验对不对又是一个问题.  可能在实际中 问题是一个套一个.. 或者一个套多个..似乎是一个系统了... 

理论与实际:我以前做过理论 后来也做了实际的东西..当然这个中的转化是很难的... 

做理论的人对一个数据说:做个先做个回归,在来个误差分析. 在他们眼中这些很easy. matlab一个命令就ok,但是数据如果上十万,matlab就死了,他们的学术论文中的例子不过就是十几*几百 如果多了 数据表要几十业,每页版面也便宜.. 所以在他们很自然的认为.. 计算不是问题, 我以前也这样.. 后来算了一下 自己SB了.. 一个月后才体会..

做实际的人Coder: 算法的程序理论和逻辑复杂..他们心想这不是我们做的还不如去用各种成熟的工具搭个网站挣钱来的快..何必费力做这个..

业务人员:他们认为计算机是最神奇的,想要什么就能出什么,就会提出个种***的要求, 还要马上能用.. 他们不想想这个能实现不?

现在也突然决的interface的重要性..

interface 那种能理论联系实际又能联系业务.. 似乎做到这样真的很难

稀少的才有价值... 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值