
DA
文章平均质量分 81
muriyi
这个作者很懒,什么都没留下…
展开
-
别老扯什么Hadoop了,你的数据根本不够大
原文引自http://geek.youkuaiyun.com/news/detail/2780本文原名“Don’t use Hadoop when your data isn’t that big ”,出自有着多年从业经验的数据科学家Chris Stucchio,纽约大学柯朗研究所博士后,搞过高频交易平台,当过创业公司的CTO,更习惯称自己为统计学者。对了,他现在自己创业,提供数据分析、推荐优化咨询服务,他的邮转载 2016-10-13 08:27:53 · 435 阅读 · 0 评论 -
kaggle初体验
前期通过了解相关的SOC安全框架,明确大规模的数据处理、挖掘是其中最为关键的环节,也是SOC深度应用的关键,这里离不开海量数据的分析与机器学习。如Cisco开放的OpenSoc开源框架中,在Storm中就需要自己编写分析引擎和机器学习方法,来进一步针对实际业务优化分析结果。为此,特别留出一部分时间对于数据分析、机器学习进行了一个粗的了解,顺道参加了kaggle的Santander Product R原创 2016-12-19 20:25:38 · 572 阅读 · 0 评论