
Python
多读文献少吃饭
这个作者很懒,什么都没留下…
展开
-
codeforces crawl-demo
import requests,os,csv,refrom lxml import etreeclass codeforces(object): global prefix,syspath prefix = 'https://codeforces.com' syspath = "D:\\szs\\opyion" """ 请求主页 return: 分页链接 """ @staticmethod def index_page(x): content = reques原创 2021-05-12 15:02:20 · 173 阅读 · 0 评论 -
python 文件压缩(压缩一个文件夹下的所有文件)
直接代码:from zipfile import ZipFileimport osdef get_all_file_paths(directory): # 初始化文件路径列表 file_paths = [] for root, directories, files in os.walk(directory): for filename in files: #连接字符串形成完整的路径 filepath = os.原创 2021-04-29 16:24:38 · 2364 阅读 · 0 评论 -
python文本预处理+获取值
准备数据集**.csv代码示例:import requestsimport reimport pandas as pdfrom bs4 import BeautifulSoupimport nltkimport matplotlib.pyplot as pltfrom nltk.corpus import gutenbergimport numpy as npimport unicodedatafrom nltk.corpus import wordnetfrom nltk.ste原创 2021-04-28 16:52:51 · 230 阅读 · 1 评论 -
python超大型数据集分割
直接上源码import pandas as pdimport numpy as npimport glob,osimport openpyxlpath =r'001\信息.xlsx' #文件路径chunksize = 5000 #切分行数i = 0df = pd.read_excel(path,engine='openpyxl')print('切分总数',len(np.array_split(df, len(df) // chunksize)))for chunk in np.a原创 2021-04-28 16:47:22 · 423 阅读 · 0 评论 -
python+mysql实现自动化 新建表+导入mysql
setp1:导包import pymysql setp2:以你比较深厚的mysql基础功底,徒手写一个建表语句:setting = ' (序号 INT NOT NULL PRIMARY KEY auto_increment,主分类 VARCHAR(500),次分类 VARCHAR(500),方向分类 VARCHAR(300),主仓位 VARCHAR(500),基金名称 VARCHAR(500),代码 VARCHAR(500),风险收益比 VARCHAR(500),当前推荐度 VARCH原创 2021-04-28 15:52:58 · 682 阅读 · 0 评论 -
centos部署Flask项目 -----uwsgi启动
第一步:登录阿里云服务器在根目录下创建文件夹(个人习惯随意建)第二步:进入文件夹,输入python,查看是否有python环境,一般会默认带个python2.7,升级到3.6就行,没有的就加虚拟环境吧第三步:把Flask项目用ftp传到你建的文件夹,然后运行一下,看能否跑通,运行方式和线下一样(python ***.py runserver)第四步:能跑通的话pip install uwsgi 安装这个包和安装requirement.txt那些包,跑不通的话再调调第五步:在你的项目启动文件相同目原创 2021-04-23 22:57:25 · 433 阅读 · 0 评论 -
missing optional dependency ‘tables‘. use pip or conda to install tables
写入hd5文件报错:missing optional dependency ‘tables’. use pip or conda to install tables*解决方式:pip install tables==3.5.2*原创 2021-04-22 22:12:54 · 6865 阅读 · 3 评论 -
Pthon绘制动漫(附turtle方法介绍)
本文采用Python中的绘图turtle程序包 绘制动漫人物一、安装turtle使用pip进行安装的时候会返回错误:在网上查阅资料各种说法都有有的是升级两个包,有的是安装Visual C++ 14.0在这里我采用的是在公众号上找到的一种方法(亲测很好用~~)1,从网上下载 turtle 程序包,下载链接为:https://files.pythonhosted.org/packages/ff/f0/21a42e9e424d24bdd0e509d5ed3c7dfb8f47d962d9c04.原创 2020-08-05 10:56:47 · 1387 阅读 · 0 评论 -
Python集合(set)
Python集合可以使用大括号 { } 或者set()函数创建集合 注意:创建一个空集合必须用set()而不是 { },因为 { } 是用来创建一个空字典。集合对象是一组无序排列可哈希的值,集合成员可以做字典中的键。集合用in和not in操作符检查成员,以len()內建函数得到集合的基数(大小),用for循环迭代集合的成员。但是因为集合本身是无序的,不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值。set和dict一样,只是没有value,相当原创 2020-08-03 14:22:30 · 1014 阅读 · 0 评论 -
二维数组的高效查找(Python)
二维数组中的查找题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。import numpy as npdef number(array,data): if array == None: return False i = 0 rows...原创 2020-04-24 14:14:52 · 357 阅读 · 0 评论 -
Python数组排序的基本操作+小例子
数组的排序sort() 和 sorted()相对于sort()来说,sorted的应用更加广泛sorted() 作用于任意可迭代的对象而 sort() 一般作用于列表sort():x = [4, 6, 2, 1, 7, 9]x.sort()print(x)打印结果为 [1, 2, 4, 6, 7, 9] 从小到大排序sort()提供了两个可选参数,分别是 key和rever...原创 2020-04-24 10:07:53 · 1107 阅读 · 0 评论 -
Python实现HTML网址转换为pdf图片
该功能的实现主要依赖于Python中的pdfkit模块1.安装方式pip install PyPDF2 #Python下的PDF工具pip install requests #网络请求包pip install beautifulsoup4 #用于操作 html 数据pip install pdfkit #wkhtmltopdf 的Python封装包2.安装wkhtmltopdfs...原创 2020-04-23 14:16:46 · 500 阅读 · 0 评论 -
公众号历史文章爬虫
所需工具: python3.6 fidder抓包工具 Mysql数据库第一步: 1.登录手机版微信,搜索到所爬取的公众号、在电脑端打开历史消息 2.打开fidder抓包工具、清除session、准备抓包 3.打开公众号历史信息界面向下滑动、滑动到第二页出现带有json标识的网址第二步(点击json查看json数据是否和公众号文章符合)...原创 2020-04-23 11:39:20 · 730 阅读 · 0 评论