python
额
Posierd
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
哔哩哔哩 后浪 弹幕 获取 保存 csv 并制作词云
'''' 找出真实的弹幕列表的url 保存 csv 文件 制作词云图 ''' import re import requests import csv # headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'} # url = 'https://api.bilibili.c原创 2020-05-13 19:41:03 · 2374 阅读 · 4 评论 -
解析网电影信息获取
''' 通过解析网获取电影 通过操作发现在 network 控制台中 文件名 .ts 结尾的文件为 视频文件(也就是电影某个小片段) 需要将这些全部获取下来 发现这个后缀的变化规律 .ts 后数字的变化 先拿当中的一个 ts 文件中的 url 来下载测试 发现命名为 .ts 的格式时也是可以进行播放的 为节省下载时间 了解一个新的知识点 进程池(内部需要创建多个来达到效果) 在同一个时...原创 2020-04-05 13:30:53 · 801 阅读 · 0 评论 -
豆瓣电子书
import requests import urllib.request from bs4 import BeautifulSoup import csv ''' 目标数据: 书名 作者 日期 价格 评分 评价人数 ''' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53...原创 2020-04-05 13:24:41 · 169 阅读 · 0 评论 -
豆瓣电子书知识点梳理
目标地址 知识点梳理: '''' 分析豆瓣图书获取数据及保存的方法 1. 网页分析 1.1 . url 参数 (例 小说) 将其 str 修改为 ASCII 编码 1.2 在 import urllib.request 或 import urllib.parse 导入: 例: key = "小说" key_ASCII = urllib....原创 2020-03-19 12:43:17 · 244 阅读 · 0 评论 -
爬取博客评论
目标地址 代码截图: 运行代码结果部分结果截图: —————————— END原创 2020-03-06 14:08:08 · 229 阅读 · 0 评论 -
博客标题爬取
目标地址 代码截图 运行代码结果截图: ——————END原创 2020-03-06 13:51:54 · 210 阅读 · 0 评论
分享