
python
文章平均质量分 76
RWLinno
不经常逛优快云,合作请联系我邮箱rwlinno@gmail.com,个人主页:https://rwlinno.github.io/
展开
-
Graph Learning笔记 - 长尾分布问题
提出meta-tail2vec 方法来优化尾部节点嵌入问题对于尾部节点的嵌入问题,采用重建的回归模型来计算。对于网络的局部感知位置问题,提出删边和元学习的方法局部调整在公共数据集中进行大量实验,验证了meta-tail2vec的性能提升针对长尾效应提出Tail-GNN模型提出的概念,捕获节点与邻居的传递关系在五个公共数据集上进行实验,Tail-GNN取得了SOTA成绩提出Cold Brew方法解决SCS(孤立点Strict Cold Start)节点的噪声邻居问题。原创 2023-06-12 20:45:50 · 1160 阅读 · 0 评论 -
爬虫学习笔记04-分布式与协程
我们需要搭建一个分布式的机群,让其对一组资源进行分布联合爬取,提升爬取数据的效率。原创 2023-06-06 13:00:00 · 811 阅读 · 0 评论 -
爬虫学习笔记03-Scrapy框架
就是一个集成了很多功能并且具有很强通用性的一个项目模板。:爬虫中封装好的一个明星框架。功能:高性能的持久化存储,异步的数据下载,高性能的数据解析,分布式。原创 2023-06-06 12:00:00 · 832 阅读 · 0 评论 -
爬虫学习笔记02-基本模块
概念:Request是python中原生的一款基于网络请求的模块。特点:功能强大,简单便捷,效率极高。作用:模拟浏览器发请求。原创 2023-06-06 11:00:00 · 889 阅读 · 0 评论 -
爬虫学习笔记01-概念
通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。:门户网站可以通过制定相应的策略或者技术手段,防止爬虫程序进行网站数据的爬取。:爬虫程序也可以通过制定相关的策略或者技术手段,破解门户网站具备的反爬机制,从而获取门户网站的数据。:君子协议。规定网站内容中哪些可以爬取,哪些不可以被爬取。原创 2023-06-06 10:00:00 · 685 阅读 · 0 评论