爬虫定制有偿

我想做一个搜索器总目标:制作一个小型搜索器,实现能够完成上述初步查询20000个生物品种的查询、筛选、整理工作。
搜索器的主要要求:
1、可以在至少200个网站(例如维基百科)按照指定的关键词或者字符(关键词由我方制定并且数量不限)进行搜索,搜索的层级不低于10层。指定的网站和关键词,可以主动由我方编辑查询人员自由设置。
2、可以在公共平台类似谷歌搜索这种搜索到相关信息后进行二次搜索。
3、搜索到网站后,能初步分析和判断,按关键字将内容进行归类;(按精确匹配或模糊匹配分),需要搜索某种产品的物化性质、结构式、应用、生产经营企业信息等,就要进行分析,进入下一层(有可能再进入下一层),把相关的所有信息全部保存下来。
4、可以按照我方要求,主动设置文件夹、word文件格式,并整理文件资料、存储独立文件,如照片、PDF文件和其它独立格式文件。
5、一周内可以达成6000个生物品种的查询筛选整理工作。
6.、从网站下载的信息需要是以word文件的格式下载保存,主要保存网站页面的文字信息。
7、在不同网站下载的同一品种资料可以统一横向对比筛选出不同的信息,主要查看的是植物、香料、香薰类的资料。
8、最终的目的是把不同网站的内容关于某一个品种的内容进行横向总结对比,把各个网站关于这个品种的内容收集到一个word文件里总结,并且筛选出其中不同的信息。                                         9.老板说这200个网站没法一下子就给完,因为我们也是在探索阶段,所以的边做边加,就你十天内可以做好框架和一些网址然后我们后续再加网站吗,而且我们只能付一成定金,最多只能给到2w,而且工期要十天内。

10.有一个excel表格含200左右个植物,需要你在维基百科做一个给老板看看,如果这个在老板那通过了可以直接达成合作。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值