- 博客(4)
- 收藏
- 关注
原创 有没有人接单,2000的单子
1.我们需要爬取三个网站的物种信息:https://www.worldplants.de/ 、https://www.worldfloraonline.org/ 以及https://www.gbif.org/植物界Plantae部分各物种的数据。4. https://www.worldplants.de/这个网址还需爬取各地区国家物种信息,按照地区国家进行分类来输出一个excel表格。5. GBIF有提供API数据,WFO有提供R包,结果出来之后请把数据包代码也发给我们,便于我们下次使用。
2024-12-05 16:05:41
208
原创 搜索器爬虫
1、可以在至少200个网站(例如维基百科但是目前网站名单不全只能提供10个左右,有很多是外网网址,我们公司在国内,自己有VPN没有服务器)按照指定的关键词或者字符(关键词由我方制定并且数量不限)进行搜索,搜索的层级不低于10层。8、最终的目的是把不同网站的内容关于某一个品种的内容进行横向总结对比,把各个网站关于这个品种的内容收集到一个word文件里总结,并且筛选出其中不同的信息。7、在不同网站下载的同一品种资料可以统一横向对比筛选出不同的信息,主要查看的是植物、香料、香薰类的资料。
2024-10-28 09:15:26
145
原创 搜索器爬虫
1、可以在至少200个网站(例如维基百科但是目前网站名单不全只能提供10个左右,有很多是外网网址,我们公司在国内,自己有VPN没有服务器)按照指定的关键词或者字符(关键词由我方制定并且数量不限)进行搜索,搜索的层级不低于10层。8、最终的目的是把不同网站的内容关于某一个品种的内容进行横向总结对比,把各个网站关于这个品种的内容收集到一个word文件里总结,并且筛选出其中不同的信息。7、在不同网站下载的同一品种资料可以统一横向对比筛选出不同的信息,主要查看的是植物、香料、香薰类的资料。
2024-10-25 14:53:33
138
原创 爬虫定制有偿
8、最终的目的是把不同网站的内容关于某一个品种的内容进行横向总结对比,把各个网站关于这个品种的内容收集到一个word文件里总结,并且筛选出其中不同的信息。3、搜索到网站后,能初步分析和判断,按关键字将内容进行归类;(按精确匹配或模糊匹配分),需要搜索某种产品的物化性质、结构式、应用、生产经营企业信息等,就要进行分析,进入下一层(有可能再进入下一层),把相关的所有信息全部保存下来。7、在不同网站下载的同一品种资料可以统一横向对比筛选出不同的信息,主要查看的是植物、香料、香薰类的资料。
2024-10-22 14:02:29
228
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人