
数据挖掘
文章平均质量分 65
qq_33643943
这个作者很懒,什么都没留下…
展开
-
网络爬虫入门1
网络爬虫包括了四大部分:url管理器,url下载器,url解析器,url输出器。最后由主程序调用者四个部分 首先来看 url管理器:主要功能是将未解析的url和已经解析过的url分开,以防重复解析 url_manager.py class UrlManager(): def __init__(self): self.new_urls=set() ...原创 2018-11-05 16:40:44 · 244 阅读 · 0 评论 -
kaggle项目之宠物收养的速度预测
第一天: 报名了kaggle 的一个项目,希望在处理数据方面有所提升。 宠物收养速度题目: 在机构给的数据之上,预测客户在看到信息后收养宠物的速度有多快 数据: https://www.kaggle.com/c/petfinder-adoption-prediction/data 数据包括了文本,数字和 图片。 拿到数据之后,开始看数据以及每个属性的描述,但是还是不知道怎么下手,看到...原创 2019-03-06 22:54:04 · 651 阅读 · 0 评论