
设计模式、软件架构
文章平均质量分 81
beck_zhou
互联网搜索引擎技术研发(自然语言处理、机器学习、数据挖掘、个性化推荐、大数据等算法方向);
移动互联网产品经理
展开
-
Google的十个核心技术
本篇将主要介绍Google的十个核心技术,而且可以分为四大类:1.分布式基础设施:GFS,Chubby和Protocol Buffer。2.分布式大规模数据处理:MapReduce和Sawzall。3.分布式数据库技术:BigTable和数据库Sharding。4.数据中心优化技术:数据中心高温化,12V电池和服务器整合。分布式基础设施GFS由于搜索引擎需要处理转载 2011-10-20 20:19:52 · 2173 阅读 · 0 评论 -
自然语言分析、文本分析、全文索引,搜索引擎相关资源汇总
日常工作中经常要查找这方面的相关文章,做个索引,并不断更新,以便日后查找。 盘古分词:http://pangusegment.codeplex.com/ LingPipe 自然语言处理工具包的博客 Google (谷歌)中国的博客网志 博客园搜索引擎团队博客 Blogs about: Text Analysis Lucene 源码剖析 The Porter S转载 2011-11-16 21:31:35 · 1703 阅读 · 0 评论 -
ssd-cache 不错的kv系统总结
Table of Contents1 需求1.1 why1.2 具体需求2 index3 ssd 特性3.1 成本3.2 接口3.3 比较典型的ssd参数3.4 小结4 现有系统调研4.1 基于redis修改4.1.1 redis-vm4.1.2 redis-storage4.1.3 小结4.2 单机存储引擎4.2.1 LevelDB原创 2015-04-27 18:59:31 · 8950 阅读 · 0 评论