
7§网站采集器
文章平均质量分 86
dojava
这个作者很懒,什么都没留下…
展开
-
网站采集器系统设计(产品已实现)
文章来源:视采网站采集器1功能说明1.关键字生成关键子可以从关键字库、论坛中提取。人工可以直接输入关键字,并可以加入关键字库中。2.网址获取调用googleapi根据关键字在internet中检索,获取网址列表。人工可以直接添加或从网址库中选取网址列表。对于当前列表可以保存到网址库中,保存时注意过滤重复网址。3.采集任务设置系统根据采集任务进行自动化采集。任务设置包括采原创 2005-11-01 12:37:00 · 4544 阅读 · 1 评论 -
视采网站采集器技术方案
文章来源:视采网站采集器视采网站采集器技术方案pdf格式下载1概述1.1目的本文分析系统需求,说明系统结构和解决方案。 本文适合技术人员阅读和参考。1.2需求概述网站、企业、营销人员都有对信息的需求,不同的信息领域,不同信息使用者,信息的获取方法和获取途径大不相同。采集系统需要满足多样化的采集应用,以及适应未来的需求增长。 1.3系统需求1.3.1多样化的原创 2009-01-23 11:37:00 · 1488 阅读 · 0 评论 -
视采网站采集器产品白皮书
文章来源:视采网站采集器视采网站采集器产品白皮书pdf格式下载1概述1.1目的本文从技术的角度向用户介绍采集系统的系统结构、系统特性及功能特征。并分析采集系统所面对的市场行情和当前的用户需求。 本文适合用户以及技术人员阅读和参考。1.2产品简介视采网站采集器是一个开源的信息采集软件,它可用于网站信息采集、站内全文检索、软件系统数据交换、数据结构化处理等应用。原创 2009-01-23 11:32:00 · 1299 阅读 · 0 评论 -
DM视采网站采集器简介
文章来源:视采网站采集器DM视采网站采集器简介DM视采网站采集器是一款可视化的数据挖掘软件,它可用于网站采集,论坛采集,dedecms采集,动易采集,新云采集,论坛发帖,论坛顶贴,博客采集等。系统特点结构化采集系统对半结构化数据进行语义分析,根据语义规则智能提取复杂多变的数据。所见即所得用户在可视化的目标界面上指定所要采集的内容,并预览结果。原创 2009-01-23 11:31:00 · 1672 阅读 · 0 评论 -
金融危机来了,不能打工那就创业吧
我是做软件开发的。第一步走错,那就会错一辈子。自从进入第一家软件公司起,我的生活就是两点一线,家和公司。一天8小时全部贡献给了电脑,天天一个样,真是度年如日!一成不变的东西往往会让人不安,害怕真的到了那么一天,我们发生的改变,但我们却一无所有,我们真的不知道怎么去面对我们已老的父母,对你充满期待的妻子和嗷嗷待哺的孩子。生活总是那么无奈,命运总是那么弄人。你想要的上帝却给了别人,别人需要的上帝却给了原创 2009-01-12 11:52:00 · 912 阅读 · 0 评论 -
视采网站采集器功能设计
来源:视采网站采集器3 具体需求本章应包括软件开发者在建立设计时需要的全部细节。这是SRS中篇幅最大和最重要的部分。1. 根据本指南第4章所规定的准则(如可验证性、无歧义性等),对每一个需求细节作具体描述;2. 在SRS的前言、项目概述、附录部分的有关讨论中,要提供对任何一个具体需求交叉引用的背景;3. 具体需求分类的方法如下:原创 2006-07-25 16:48:00 · 2584 阅读 · 3 评论 -
视采网站采集器需求分析
来源:视采网站采集1 前言本章提供整个SRS综述。开源,注定了她属于全人类,并且永远永远的忠诚于抚育她的精英们。她是我们每个人的爱的结晶,展示我们自我的才华。开源也付给openWEBant一个特殊的意义,它的成功,也代表着中国开源的成功,它,也成为一种纽带,把中国的有志青年、爱心大使,紧紧的聚集在一起,展示我们中华英才的智慧和力量。用我们全身的力气喊出:"团结就是力量,奉献就是原创 2006-07-13 21:08:00 · 3315 阅读 · 3 评论 -
今天终于完成了eWebEditor的改写
此时是2005年12月2号14点零九分,刚刚完成eWebEditor的改写。该组件主要用于我开发的网站采集器系统中。改写工作共消耗我的2天的生命时间。eWebEditor是asp开发的,是个内嵌网页的可见及可得HTML编辑器,架构设计得很巧妙,结构高度可配置,并易于使用。将asp向java转换,使得我脑袋常常短路。一个面向过程的语言机制和一个面向对象的语言机制,两者天壤之别。惊叹eWebE原创 2005-12-02 15:53:00 · 2903 阅读 · 12 评论 -
网站采集器内核成功实现喽!!
今天是个值得喜庆的日子!也是个值得永远记住的日子!因为,今天诞生了一个伟大的事物--网站采集器!这个东东耗费了我99天的心血,正当我脑袋快要成为一团浆糊的时候,一个革命性的灵感出现,挽救了这个伟大的事物。我该怎样做才能平息我那快要蹦出的心,天啊!她能适应多中抓取规则,她能够以多线程并发抓取,她能够自动关联上下文,她能自动发布抓取结果,等等等...。这根本就是个奇迹!嘿!!!我可是她的诞原创 2005-11-18 17:52:00 · 2843 阅读 · 6 评论 -
视采网站采集器用户操作手册
文章来源:视采网站采集器1 产品简介DM视采网站采集器是一款可视化的数据挖掘软件,它可用于网站采集、论坛采集、文章采集、博客采集、dedecms采集、动易采集、新云采集、论坛发帖、论坛顶贴等。2 规则规则是用来定义数据采集的单元(数据字段)。如标题字段、链接字段等。并且描述这些字段是如何处理的。不同的单元规则是由不同的模块定义,并由该模块执行。这些定义和处理单元的模块叫做设计原创 2009-02-06 13:40:00 · 3142 阅读 · 1 评论