
python
文章平均质量分 60
qq_41858657
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
从0到1_批量下载视频
批量下载视频原创 2023-03-12 11:08:27 · 438 阅读 · 0 评论 -
PYTHON 连接oracle
https://www.cnblogs.com/zhichaoma/p/9448571.html基于windows用户(mac暂未尝试)一、下载instant client1.附链接:http://www.oracle.com/technetwork/topics/winx64soft-089540.html提示:需要有oracle的账号才能下载嗷!2.解压到某一位置并配置环境变量二、cmd加载包写在cmd里加载cx_Oracle包pip install cx_Oracle三、.原创 2021-05-16 21:12:48 · 466 阅读 · 1 评论 -
python 更改pip到python对应的版本
背景:前期将python版本同步至python3.7,而pip还是2.7坑:个人认为修改pip的版本很麻烦做法:简单粗暴,删掉pip,重装一次就匹配上了在这方面mac还真是有点麻烦呢,不过也可以做到双版本管理。...原创 2021-05-12 00:29:08 · 1701 阅读 · 0 评论 -
python BeautifulSoup用法介绍
文章目录1.选择解析器2.基本用法3选择器3.1 节点选择器3.1.1 选择元素1.选择解析器直接选择lxml,在lxml中有HTML和XML的功能,速度快,容错能力强。2.基本用法from bs4 import BeautifulSoupsoup = BeautifulSoup(html,'lxml') #BeautifulSoup对象初始化print(soup.prettify()) #把要解析的字符串按标准的缩进格式输出print(soup.titlte.st原创 2020-10-05 15:09:36 · 3410 阅读 · 0 评论 -
python matplotlib画图显示中文
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2020-09-30 19:29:57 · 172 阅读 · 0 评论 -
从主网页爬取子网页的内容(仅自用分析)
目标这次的目标是爬取北斗相关的新闻,利用图片来解释一些我们要做的事情从左边的网页信息中获取子网页的网址,然后从子网页的网址中获取文章文本信息。接下来我们看一下子网页的网址在原网页的哪里 大家有没有注意到上一张图的网址的后面跟这张图所指的网址是一样的。所以就是这里现在开始码代码,我使用的解析方法是beautifulsoup。加载包 import requestsfrom bs4 import BeautifulSoupimport numpy as np import pandas a原创 2020-09-30 19:24:51 · 2454 阅读 · 0 评论 -
爬取豆瓣金融类图书信息(仅分析自用)
第一步:寻找网址规律首先来展示一下原网页:可以看出网页地址有规律,start=0,start=20,start=40(是这样的规律,这部分只展示两页)。这样就可以获取所有的网页地址。第二步,爬取网页信息这里只爬取前20页信息urls=['https://book.douban.com/tag/金融?start='+str(i*20)for i in range(0,20)]#爬取多个页面for url in urls: headers={ 'User-Agent':'M原创 2020-09-30 09:37:04 · 243 阅读 · 0 评论 -
爬取x宝网页评论(仅作分析自用)
淘宝某一衣服网页的评论第一步:找评论的url找到网页确定网页第二步:爬取网页编写headers定义获得网页源码函数定义获取想要的评论信息函数定义存储网页评论函数开始爬取网页评论词云图做词云图基本词云图做图形词云图第一步:找评论的url我们先放一张界面图:找到评论,打开检查界面找到网页进行网页刷新,然后在检查界面的筛选器中筛选list,通常情况下,评论在list_detail界面中,如下图所示:确定网页点开这个网页,观察响应中是否有你想要的评论。然后去标头中找它的url和headers:原创 2020-09-25 09:08:34 · 1110 阅读 · 0 评论 -
爬取网页源码
以网页百度为例爬取网页源码:百度网页1.先载入包requestsimport requests2.定义表头headers ={ "Accept":"application/json,textjavascript,*/*;q=0.01","Accept-Language":"zh-CN,zh;q=0.9","Content-Type":"application/x-www-form-urlencoded;charset = UTF-8","User-Agent":"Mozilla/5.0 (原创 2020-08-14 17:12:36 · 1954 阅读 · 0 评论 -
Beautifulsoup爬取网页标题
既然是使用BeautifulSoup我们就来爬取BeautifulSoup官方文档的标题吧。也就是下面红框内的图片。网址:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id4接下来我们进行分步处理:①请求数据:r=requests.get("https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id4")text=r.text ②利用Beautifulsoup获取网页信息:soup=Bea原创 2020-08-10 17:02:57 · 2404 阅读 · 2 评论 -
python 下载url图片
##下载url图片函数import urllibimport urllib.requestdef get_image(url,stuNum): try: request = urllib.request.Request(url) response = urllib.request.urlopen(request) get_img = r...原创 2020-01-09 16:53:03 · 683 阅读 · 0 评论 -
python 拥有api后爬数据
import urllib,sysimport urllib.request as urllib2url = "http://api01.idataapi.cn:8000/hotel/idataapi?pageToken=560:WzAuOTQ1NjY2NTUsImlkYXRhYXBpIiwiODAxODYxNjUiXQ==&city=%E5%AE%81%E6%B3%A2&ap...原创 2019-12-31 16:49:26 · 465 阅读 · 0 评论 -
python 样本聚类
导入需要的包import pandas as pdimport numpy as npfrom pandas import DataFrame,Seriesfrom sklearn.cluster import KMeansfrom sklearn.cluster import Birch设置文件导入导出位置datafile = u'E:\\grade3作业\\多元实践\\newj...原创 2019-12-31 16:43:52 · 563 阅读 · 0 评论 -
python总结
PYTHON 显示图片负号plt.rcParams['axes.unicode_minus']=False两种删除数据框某一列或几列的方式第一种del df['KSRQ']del df['JSXX']del df['KCMC']第二种##删除无用列x=[1,2,3,6,8] JDYJD.drop(JDYJD.columns[x], axis=1, inplace=True)...原创 2019-12-31 16:39:34 · 134 阅读 · 0 评论 -
python 合并同一文件夹下三个表格
合并同一文件夹下三个表格##合并2016-2019文件#Folder_Path = r'E:\\xiangmu\\gaoshu\\jidian' #要拼接的文件夹及其完整路径,注意不要包含中文#SaveFile_Path = r'E:\\xiangmu\\gaoshu\\jidian' #拼接后要保存的文件路径#SaveFile_Name = r'stu_c...原创 2019-12-31 16:11:14 · 821 阅读 · 0 评论 -
python 取随机值
随机取值imort randomindex=random.sample(range(0,40),5)import numpy as npindex=np.random.randint(0,40,size=5)原创 2019-12-03 21:15:59 · 258 阅读 · 0 评论 -
excel和python 数据框中有条件的最大值
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://mp.youkuaiyun.com/mdeditor/103374630参考文件链接:https://blog.youkuaiyun.com/weixin_37855575/article/details/82288011————————————————详细介绍一下题目,考试中有重...原创 2019-12-03 19:29:21 · 1194 阅读 · 0 评论 -
python 文件及文件夹批量操作总结
python 文件夹批量操作删除一级文件夹下文件for i in os.listdir(path): ##用于返回指定的文件夹包含的文件或文件夹的名字的列表 path_file = os.path.join(path,i) ##连接两个或更多的路径名组件 if os.path.isfile(path_file): ##判断是否为文件 os....原创 2019-09-29 19:35:30 · 2529 阅读 · 0 评论