
文章平均质量分 72
wbj0110
这个作者很懒,什么都没留下…
展开
-
Google的十个核心技术(转)
本篇将主要介绍Google的十个核心技术,而且可以分为四大类:1.分布式基础设施:GFS,Chubby和Protocol Buffer。2.分布式大规模数据处理:MapReduce和Sawzall。3.分布式数据库技术:BigTable和数据库Sharding。4.数据中心优化技术:数据中心高温化,12V电池和服务器整合。分布式基础设施GFS由于搜索引擎需要...原创 2013-11-27 12:16:07 · 604 阅读 · 0 评论 -
使用Java调用谷歌搜索(转)
search-demo托管于github search-demo演示了如何利用Java来调用百度搜索和谷歌搜索,更多细节请到github上查看search-demo 自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻...原创 2014-03-19 08:53:28 · 234 阅读 · 0 评论 -
Google Search Appliance 抓取时间表
在指定要抓取的网址并配置了用于抓取的服务器之后,可以通过抓取并编制索引 > 抓取时间表页选择抓取模式,对于预定抓取模式,可以指定抓取您的服务器的次数。抓取模式Search Appliance 具有以下抓取模式:持续抓取。 如果您想让抓取工具自动查找更新内容并编制索引,请选择该模式预定抓取。 如果您想精确控制所有抓取的时间和持续时间,请选择该模式。 当出现以下情况时,...原创 2013-09-25 08:55:34 · 192 阅读 · 0 评论 -
15个网站设计和开发的Chrome插件
1.Speed TracerSpeed Tracer is a tool to help you identify and fix performance problems in your web applications. It visualizes metrics that are taken from low level instrumentation points inside...原创 2013-09-24 09:03:50 · 217 阅读 · 0 评论 -
Google Chrome Frame 谷歌浏览器框架
一句话:Google Chrome Frame 让IE仅剩下皮囊。微软这回要哭了,Google最新发布的Chrome Frame可以将IE 的Trident内核替换成WebKit,是IE一下子有了两内核(浏览器也双核了,厚厚~)。Google在帮助其竞争对手改善其产品,微软的IE开发团队是不是会很尴尬?在运行插件之后,用户的IE浏览器将获得Chrome的性能和功能,拥有更快的JS解析...原创 2013-09-24 09:02:53 · 1930 阅读 · 0 评论 -
Google Search Appliance 有效网址格式规则
当您指定网站上应该或不应该抓取的网址时,或在建立基于网址的集合时,网址应符合下列有效格式。 有关详情,请参阅在 Search Appliance 文档网站上发布的 Constructing URL Patterns(构建网址格式)(仅提供英语版本)。1.任一包含主机/路径分隔斜线的网址子字符串http://www.google.cn/www.google.cn 上使用 ...原创 2013-09-23 09:36:10 · 3916 阅读 · 0 评论 -
Google Search Appliance 抓取与编制索引
在您开始抓取网络内容前,您需要指定一个或多个起始位置。 您可以通过指定要遵循的网址格式和要避免的网址格式来控制和优化抓取幅度。 如果要抓取指定的网址,那么这个网址必须符合仅跟踪和抓取以下格式的网址框中的“至少一个”网址格式,并且“不能”符合勿抓取以下格式的网址框中的任何网址格式。 请注意: 如果某个网址既符合仅跟踪和抓取以下格式的网址中的格式,又符合勿抓取以下格式的网址中的格式,将不...原创 2013-09-23 09:35:42 · 237 阅读 · 0 评论 -
Google Search Appliance 搜索日志
搜索日志记录了从索引获取信息的用户请求。 您可以生成并导出这一信息,然后将其输入喜欢的日志分析软件或报告软件。下面是搜索日志可提供的信息的一些示例:用户执行了哪些类型的查询?用户点击了用户界面的哪些部分?为用户提供服务的速度如何?用户得到所需结果了吗?您需要通过配置相关查询、关键字匹配、查询扩展或单一框功能帮助用户查找相关信息吗?您能够在设备中保留最多 100 ...原创 2013-09-22 08:55:29 · 170 阅读 · 0 评论 -
Google Search Appliance
来自Google的高科技,这看来去像是台服务器,其实远没有那么简单,这就是一个小型的Google,里面包含的Google的搜索算法等,你可以用它来做自己的站内搜索引擎,但更加有用的是你可以通过这台机器去研究Google蜘蛛的运行规律,去改变网页上的内容来达到最佳的SEO效果等。这一切,不是幻想,只要你有钱。 http://www.google.com/enterprise/search...原创 2013-09-21 14:31:56 · 193 阅读 · 0 评论 -
Google蜘蛛UA及IP
Google# UA “AdsBot-Google (+http://www.google.com/adsbot.html)”# UA “Googlebot-Image/1.0″# UA “Googlebot/2.1 (+http://www.googlebot.com/bot.html)”# UA “Googlebot/Test (+http://www.googlebot.com/bot....原创 2013-09-20 21:33:29 · 450 阅读 · 0 评论 -
Google Search Appliance 主机负载计划
抓取网址的数量上限您的许可指定了您可以抓取的网址的上限。 不过,如果您的网址尚未达到许可所规定的上限,您可以为想要抓取的网址指定较小的数量上限。 如果您输入的数字小于许可指定的总页数上限,您可以提高系统性能。 在您点击保存时间表和主机负载按钮后,系统最多比您指定数量多抓取约 10% 的内容。 系统抓取的网址要稍微多一些,这样在清除重复后,页数与您指定的上限将非常接近。请注意: 如果您将...原创 2013-09-09 10:03:36 · 127 阅读 · 0 评论 -
谷歌用户体验设计准则
谷歌的愿景 Googl用户体验团队致力于创建有用的(useful)、快速的(fast)、简单的(simple)、有吸引力的(engaging)、创新的( innovative)、适合大众的(universal)、有用的(profitable)、漂亮的(beautiful)、值得信赖的(trustworthy)、个性化的(personable)的应用。Google用户体验的十大准则...原创 2013-09-03 09:29:47 · 103 阅读 · 0 评论 -
Google背后的开源力量
[企业开源系列]系列专注于全球著名企业(包括国内企业)中的开源现状,探讨开源软件的力量,以使更多的开发者了解开源、贡献开源,打造更加和谐的国内开源生态。 本期先来了解Google背后的开源力量。 在企业使用开源和贡献开源方面,Google一直是行业的典范。一直以来,Google都在极力推广和倡导开源,并发布了一系列开源项目。这是因为Google从开源软件中尝到了甜头,如果没有开源软件,...原创 2013-10-28 09:25:17 · 189 阅读 · 0 评论