前言:
上午把钱都买了权证(580013)(还有我现在还是学生,也没多少钱...)... 就短短的20分钟就-10%.. 心凉啊... 想想最近都做什么了, 估计大多时间用在股票上了, 不顾正业也快一个月了.. 什么是正业? 我也不知道.. 起码这个blog是做算法的....
----------------------------------------------------------------------------------------------------
理论与实际... 我的数学算法与股市的联系估计近期不会有什么实质性的东西... 就说说 数据挖掘,人工智能的理论与实际的结合..
在我看来数据挖掘=统计方法+计算机(数据库)+业务知识....
现在BI似乎是很火, 但我看来那也不过只是报表系统加上了简单的统计分析.. 不过这样的进展是不错的... 但有也有被人夸大的地方..就那统计中的 协方差..相关系数的计算 的计算复杂性是多少?你算个10000X10000数据的协方差..相关系数的计算复杂度是多少? 可以试试.. 但是电信数据挖掘什么的, 说数据是每天是***万.. 你怎么算不知道.. 如果连这样的 最基本的统计量都算不了 又何谈你那是智能.. (智能有高低.. 与以前的相比确实智能了).. 减少数据量的方法是做抽样.. 但是怎么抽又是一个问题.. 还有抽了要检验对不对又是一个问题. 可能在实际中 问题是一个套一个.. 或者一个套多个..似乎是一个系统了...
理论与实际:我以前做过理论 后来也做了实际的东西..当然这个中的转化是很难的...
做理论的人对一个数据说:做个先做个回归,在来个误差分析. 在他们眼中这些很easy. matlab一个命令就ok,但是数据如果上十万,matlab就死了,他们的学术论文中的例子不过就是十几*几百 如果多了 数据表要几十业,每页版面也便宜.. 所以在他们很自然的认为.. 计算不是问题, 我以前也这样.. 后来算了一下 自己SB了.. 一个月后才体会..
做实际的人Coder: 算法的程序理论和逻辑复杂..他们心想这不是我们做的还不如去用各种成熟的工具搭个网站挣钱来的快..何必费力做这个..
业务人员:他们认为计算机是最神奇的,想要什么就能出什么,就会提出个种***的要求, 还要马上能用.. 他们不想想这个能实现不?
现在也突然决的interface的重要性..
interface 那种能理论联系实际又能联系业务.. 似乎做到这样真的很难
稀少的才有价值...