
Bigdata
文章平均质量分 94
yeasy
Make the world better!
展开
-
网络天然是大数据的,大数据天然是网络的
The network is naturally bigdataing, while bigdata is inherently networking.--yeasy@blog用英文表达似乎更加准确一些。计算机科学发展了半个世纪,而网络的出现极大推动了计算机相关技术的爆发式进步。计算机或网络领域所研究的典型问题,往往都是追求高性能、精确、准确,而大数据技术则往往提供一原创 2014-05-22 11:00:12 · 1243 阅读 · 0 评论 -
用 mongodb + elasticsearch 实现中文检索
而 elasticsearch 可以很好的支持各种语言的全文检索,但我们暂时又不想切换到 elasticsearch 作为后端数据库。当然,可以在 web 应用中存储数据的时候,再主动写一份到 elasticsearch,但这无疑污染了原有的业务逻辑。在 IT 行业,只要有需求的地方,必然早已有了一堆好用或者不好用的开源轮子。幸运地是,现在已经有了一些转换方案,可以将 mo原创 2015-08-21 21:24:06 · 21132 阅读 · 1 评论 -
用 Docker 搭建 Spark 集群
简介Spark 是 Berkeley 开发的分布式计算的框架,相对于 Hadoop 来说,Spark 可以缓存中间结果到内存而提高某些需要迭代的计算场景的效率,目前收到广泛关注。熟悉 Hadoop 的同学也不必担心,Spark 很多设计理念和用法都跟 Hadoop 保持一致和相似,并且在使用上完全兼容 HDFS。但是 Spark 的安装并不容易,依赖包括 Java、Scala、HD原创 2015-09-22 15:38:26 · 14183 阅读 · 2 评论 -
网络大数据分析 -- 使用 ElasticSearch + LogStash + Kibana 来可视化网络流量
简介ELK 套装包括 ElasticSearch、LogStash 和 Kibana。 其中,ElasticSearch 是一个数据搜索引擎(基于 Apache Lucene)+分布式 NoSQL 数据库;LogStash 是一个消息采集转换器,类似 Syslog,可以接收包括日志消息在内的多种数据格式,然后进行格式转换,发送给后端继续处理;Kibana 是一个 Web 前段,带有强大原创 2015-04-28 10:35:03 · 17266 阅读 · 1 评论 -
欧盟《一般数据保护条例》(GDPR)你需要知道的
欧盟《一般数据保护条例》(General Data Protection Regulation,GDPR)将于 2018 年 5 月 25 日起正式施行,该法案虽然旨在加强对欧盟境内相关居民和个体信息和隐私数据的保护,但从整个信息产业来看,是一次历史性的突破。欧洲再次走到了世界的前列。从此,个人数据(在部分地区)的保护将有法可依。发展过程2012 年 1 月首次提出法案草案,先后经过 2014 年...原创 2018-04-29 09:24:49 · 12327 阅读 · 0 评论 -
数据科技的若干发展趋势
数据科技(Data Science and Technology)在近二十年来越来越受重视,盖因大部分问题都直接来自业界的真实需求。甲骨文 Open World 大会(9.15~9.19)刚刚在旧金山谢幕。来自全球各地的科技巨头和行业客户齐聚一堂,探讨了包括分布式账本、智能技术、物联网等热门话题,以及可能对数据科技产生的深远影响。分布式账本作为社会学实验,比特币、以太坊等公共账本已经...原创 2019-09-21 03:39:47 · 852 阅读 · 0 评论