
爬虫
文章平均质量分 59
Aunean
这个作者很懒,什么都没留下…
展开
-
猫眼字体处理
猫眼字体处理本次爬取猫眼的票房榜数据,打开检查工具可以看到,票房的数据都进行了加密1.首先查看网页的源代码,Ctrl+f 输入 woff//vfile.meituan.net/colorstone/f0a30a4dda64b4f8f344858115f54fc92296.woff可以选中这段复制到搜索框中回车,发现可以另存为一个文件,我们需要的就是这个,下载完直接打开发现是乱码,对此还需要处理。2. 使用re下载woff文件,并用TTFont库进行处理from fontTools.ttL原创 2021-09-18 16:54:58 · 355 阅读 · 0 评论 -
Scrapy存储json
Scrapy存储json1.使用终端指令行方式指令:scrapy crawl xxx -o filePath.文件类型 -s FEED_EXPORT_ENCODING=utf-8-s FEED_EXPORT_ENCODING=utf-8 解决中文乱码注意:持久化存储对应的文本文件类型只可以为 ‘json’, ‘jsonlines’, ‘jl’, ‘csv’, ‘xml’, ‘marshal’, ‘pickle’ 类型2.直接创建并写入 json 文件import osimport cod原创 2021-09-18 16:54:15 · 587 阅读 · 0 评论