
Python入门基础
Be-real
VV:dpt521520
展开
-
python处理大数据的库
vaexpypi: pypi.org/project/vaex/vaex官方网站: vaex.io/docs/index.html原创 2022-12-08 19:36:22 · 464 阅读 · 0 评论 -
python3:使用bat一键打开指定文件夹下的jupyter notebook
新建一个.bat文件,在里面写入如下代码:d:#代码所在的盘D盘cd programme#programme是代码所在的路径,切换到这个路径下面jupyter notebook因为我的ipynb文件存储在D:\programme中,我想把D:\programme作为jupyter的工作根目录,所以前两行表示把当前目录切换为D:\programme...原创 2021-04-04 08:25:00 · 358 阅读 · 0 评论 -
python:根据文件大小删除文件
import os path = r'./data_out/'+ filename +'.xlsx' s = round(os.path.getsize(path)/float(1024),2) if s<10.0:#如果文件小于10KB os.remove(path)#则删除该文件原创 2021-02-24 09:21:02 · 910 阅读 · 0 评论 -
Python3:Dataframe对比两列元素是否完全相同及获取一个excel的所有sheetname
Dataframe对比两列元素是否完全相同。一一对比df[col].equals(df['a'])==True**加粗样式**#说明两列完全相同统计Dataframe某列值的种类及对应数量:df['a'].value_counts()#统计a列值的种类及每种对应的数量获取一个excel的所有sheetname:xl = pd.ExcelFile( path + f + hzm )#获取一个excel的所有sheetnamefor i in xl.sheet_names: print(i)原创 2021-02-19 09:21:07 · 2349 阅读 · 0 评论 -
python:日期转换计算大全
from datetime import datetimea = '2019'b = '6'c = '26'if __name__ == '__main__': cur_day = datetime(int(a), int(b), int(c)) next_day = datetime(2019, 7, 31) print((next_day - cur_day).days) # 1 print("ok")原创 2021-02-01 15:01:28 · 142 阅读 · 0 评论 -
python3:Python内置函数
eval():把一个字符串变成一个可用于计算的值,比如:我想合并df1和df2两个数据框,eval(‘df1’).to_excel()等价于df1.to_excel,for i in ['df1','df2']: eval(i).to_excel(excel_writer=writer,sheet_name=i,index=False)writer.save()writer.close()zip():返回一个元组的迭代器。x = [1, 2, 3]y = [4, 5, 6.原创 2020-11-18 19:00:41 · 178 阅读 · 0 评论 -
Python3:官方文档的链接
numpyhttps://www.numpy.org.cn/article/pandashttps://pandas.pydata.org/原创 2020-10-02 09:29:58 · 240 阅读 · 0 评论 -
Python3:字符串、list、字典、set、tuple的所有方法
中文官方文档链接1. Numpy是什么NumPy是一个功能强大的Python库,允许更高级的数据操作和数学计算。NumPy主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。这类数值计算广泛用于以下任务:机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码方面)和快速(在速度方面)计算。NumP原创 2020-09-16 21:54:57 · 240 阅读 · 0 评论 -
python3:直接赋值、浅拷贝、深拷贝的区别
转载自文章:http://blog.youkuaiyun.com/m0_38008539/article/details/95201503直接赋值相当于引用(别名),其父对象和子对象均指向指向同一个对象,所以a和b及里面的子列表,a与b任何一个改变都会随着改变。即直接赋值,无论做什么修改都会随着改变浅拷贝:a 和 b 是一个独立的对象,但他们的子对象还是指向统一对象(是引用).所以如果不是子列表再改变那么b不会随a变,只有a里面的子对象发生了改变b才会随着改变,可以看出,copy仅拷贝对象本身,不对其中的子对象转载 2020-09-14 23:45:56 · 271 阅读 · 0 评论 -
Python3:Tkinter图形化界面GUI——滚动抽奖器的实现
tkinter导入导入 tkinter 会自动导入 tkinter.constants ,所以,要使用 Tkinter 通常你只需要一条简单的 import 语句:import tkinter或者from tkinter import *滚动文字控件:tkinter.scrolledtexttkinter.scrolledtext 模块提供一个同名的类,实现了一个带有垂直滚动条的文字控件。使用 ScrolledText 类会比直接配置一个文本控件和滚动条简单。它的构造函数与 tkinter.Text原创 2020-09-14 23:10:54 · 1309 阅读 · 0 评论 -
Python3:np.linalg.norm()求范数
函数参数:x_norm=np.linalg.norm(x, ord=None, axis=None, keepdims=False)X:表示矩阵ord:范数类型ord=None:默认情况下,是求整体的矩阵元素平方和,再开根号(图中的ord=2按下面文字描述的为准)ord=2:|λE-ATA|=0,求特征值,然后求最大特征值得算术平方根(matlab在线版,计算ans=ATA,[x,y]=eig(ans),sqrt(y),x是特征向量,y是特征值)③axis:处理类型axis=1表示按行向量处理转载 2020-09-06 21:42:57 · 663 阅读 · 0 评论 -
Python3:生成词云图的代码
#可实现的代码#生成词云图代码,图片背景必须为纯白色或透明色import wordcloudimport numpy as npfrom PIL import Imageimport matplotlib.pyplot as pltdef show(obj): img = Image.open(r"D:\Users\DUANPT\Desktop\k.jpg") bg=np.array(img) wc=wordcloud.WordCloud( 'C:\Wi原创 2020-08-31 22:57:50 · 806 阅读 · 0 评论 -
Python3:pandas中的移动窗口函数rolling的用法
1.rolling.count()rolling.count():窗口内任何非NaN观测值的滚动计数。import pandas as pdimport numpy as nps = pd.Series([2, 3, np.nan, 10,3,4,6,9])s1 = s.rolling(4).count()print(s1)[OUT]:0 1.01 2.02 2.03 3.04 3.05 3.06 4.07 4.0dtype:原创 2020-08-16 15:50:30 · 12442 阅读 · 0 评论 -
Python3:Pandas中的Input和Output的函数解析
官方文档1. flat file1.1 pandas.read_tablepandas.read_table(filepath_or_buffer, sep='\t', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None,原创 2020-08-16 14:55:45 · 1787 阅读 · 0 评论 -
python3:Pandas库中的DataFrame中所有函数解读 - 中文官方文档解析
数据结构还包含标记的轴(行和列)。 算术运算在行和列标签上对齐。 可以看作是Series对象的类似dict的容器。语法结构:pandas.DataFrame(data=None, index: Optional[Collection] = None, columns: Optional[Collection] = None, dtype: Optional[Union[str, numpy.dtype, ExtensionDtype]] = None, copy: bool = False)param原创 2020-07-31 17:13:08 · 1140 阅读 · 0 评论 -
Python3:按某列ID合并两个Excel的数据(python实现)
按某列ID合并两个Excel的数据,首先两个excel中要有相同的一列值,才能将这两个表合并起来,合并代码如下:# -*- coding: utf-8 -*-"""Created on Fri Jul 17 16:50:20 2020"""#按行匹配两个excel中的数据,以左边的表为基准import pandas as pddatainfo1 = pd.read_excel(r'D:\Users\DUANPT\Desktop\datainfo1.xlsx')ort = pd.read_e原创 2020-07-17 17:13:40 · 5292 阅读 · 0 评论 -
Python3:list取并集、交集、补集(差集)的方法
list1与list2取两个list的交集:#第一种方法a=[2,3,4,5] b=[2,5,8] tmp = [val for val in a if val in b] print(tmp)#第二种方法,a与b可以换位置print(list(set(b).intersection(set(a))))[out]:[2,5]取两个list的并集:#a与b位置可互换a=[2,3,4,5] b=[2,5,8] print(list(set(a).union(set(b))原创 2020-07-14 20:07:08 · 1515 阅读 · 0 评论 -
Python3:Excel数据转成矩阵并计算该矩阵的特征值和特征向量
第一种实现方法(适用于已知协方差矩阵的情况):#Python实现将Excel的数值型数据转成矩阵,并计算其特征值和特征向量的计算方法import numpy as npimport pandas as pdimport xlrdfrom sklearn import preprocessingdef excel_to_matrix(path): table = xlrd.open_workbook(path).sheets()[0]#获取第一个sheet表 row = table原创 2020-06-21 18:02:51 · 5215 阅读 · 0 评论 -
Python3:自学Day1-6
Day01Day02Day03(1)函数input()的工作原理:使用函数input()时,Python将用户输入解读为字符串,所以若不做int()处理,就与数值作比较,则会报错age=input('how old are you:')age>=31#输出结果如下TypeError: '>=' not supported between instances of 'str' and 'int'#做int()处理之后的代码及结果如下age=int(input('how old原创 2020-06-09 22:24:12 · 238 阅读 · 0 评论 -
Python3:线性插补数据
插值填充:所谓的插值法就是通过两点(x0,y0),(x1,y1)估计中间点的值,假设y=f(x)是一条直线,通过已知的两点来计算函数f(x),然后只要知道x就能求出y,以此方法来估计缺失值。当然我们也可以假设f(x)不是直线,而是其他函数。import pandas as pddata = pd.read_csv(r'D:\Users\DUANPT\Desktop\voltage.csv',encoding= 'gb2312') #读取自己的文件,记得更改为自己的文件所在的路径,encoding='g原创 2020-06-09 14:28:55 · 3081 阅读 · 0 评论 -
Python:运算符总结
算术运算符:(1)+/-/*:两个对象相加/相减/两个操作数相乘(2)‘/’:两个操作数相除(总是浮点数)(3)%:返回除法(/)的余数(4)//:返回商的整数部分(5)**:返回幂逻辑运算符:(1)and x and y 逻辑与:如果 x 为 False,返回 false;否则返回 y 的计算值(2)or x or y 逻辑或:如果 x 是非 0,返回 x 的值;否则返回 y 的计算值(3)not not x 逻辑非:如果 x 为 False,返回 True;如果 x 为 True,返.转载 2020-06-07 12:03:24 · 330 阅读 · 0 评论 -
Python3:turtle库绘制绿色的大树代码实现+动态樱花图
画布(canvas)画布就是turtle为我们展开用于绘图区域,我们可以设置它的大小和初始位置设置画布大小的函数:turtle.screensize(canvwidth=None, canvheight=None, bg=None)参数分别为画布的宽(单位像素), 高, 背景颜色,如:turtle.screensize(800,600, “green”),turtle.screensize() #返回默认大小(400,300)turtle.setup(width=0.5, height=0.75,原创 2020-06-02 23:41:23 · 3566 阅读 · 0 评论 -
Python3:文本关联规则挖掘实现案例分析
import randomimport numpy as npclass Association_rules: def __init__(self,minSupport=0.2,minConfidence=0.5): ''' minSuport:最小支持度 minConfidence:最小置信度 dataset:数据集 count:存放frequent itemsets 以及 support associationRules:满足minConfidence的关原创 2020-06-02 22:35:07 · 2837 阅读 · 2 评论 -
Python3:turtle函数库的详细参数汇总 最全 没有之一
画笔的属性:turtle.pensize() #设置画笔的宽度turtle.pencolor() #没有参数传入,返回当前画笔颜色,传入参数设置画笔颜色,如"green", “red”,也可以是RGB 3元组turtle.speed(speed) #设置画笔移动速度,画笔绘制的速度范围[0,10]整数,数字越大越快画笔运动命令:turtle.forward(distance) #向当前画笔方向移动distance像素长度turtle.backward(distance) #向当前画笔相反方向移动原创 2020-05-31 22:35:31 · 8905 阅读 · 0 评论 -
Python:使用set函数去重且保证原来列表中元素顺序的方法
**set函数**set是集合,在集合中不能包含重复的元素,接收一个list作为参数在使用set()函数对列表中元素进行去重后,列表中的元素会变成乱序。如:list1=['毛刺','切刀','切刀磨损','异物','切刀表面缺陷']list2=['毛刺','切刀','切刀磨损']s=set(list1)s2=set(list2)print('s=',s)print('s2=',s2)#输出结果s= {'切刀磨损', '切刀表面缺陷', '异物', '切刀', '毛刺'}s2= {'原创 2020-05-14 08:51:38 · 2071 阅读 · 0 评论 -
Python:issubset函数用法举例
函数描述issubset() 方法用于判断集合的所有元素是否都包含在指定集合中,如果是则返回 True,不是则返回 False。具体语法如下判断集合A是否为集合B的子集z=A.issubset(B)具体案例运行如下代码f = open(r'D:\Users\DUANPT\Desktop/a.txt', "r")#导入数据r = f.read()#读取数据text = str(r.encode('utf-8'), encoding = "utf-8")#数据为中文需进行处理,否则会报错p原创 2020-05-13 20:04:24 · 9633 阅读 · 0 评论 -
Python:关键字in和not in配合条件用法
**if in和if not in**if x in list1 用于检查特定值x是否包含在列表list1中if x not in list2 用于检查特定值x是否不包含在列表list2中如果条件为真,则就会执行紧跟在if语句后面的代码list1=[1,2,3,4,5] #定义一个列表a=list1[3] #取列表中的第4个元素并赋值给变量aif a>3 in list1: #若a>3则执行语句print,若条件不满足则不输出值 print(a)#原创 2020-05-12 17:17:47 · 2918 阅读 · 0 评论 -
Python3:遇到的报错解决方法大全(持续更新)
今天运行下面这个代码def loadDataSet(): return [[1,3,4],[2,3,5],[1,2,3,5],[2,5],[1],[3],[2,3],[1,3],[1,2,3,4],[2,4]]报了这个错误:SyntaxError: invalid syntax File "<ipython-input-14-332fa655c8dd>", l...原创 2020-12-22 15:32:47 · 16619 阅读 · 3 评论 -
Python:Pandas中的.head函数和.shape函数的详细解释
在用Pandas读取数据或对数据做些处理之后,想要观察一下数据的时候,用head函数可以默认读取前5行的数据shape函数,返回的是元组hg.shape返回的是hg的行数和列数hg.shape[0]返回的是hg的行数,有几行hg.shape[1]返回的是hg的列数,有几列import pandas as pdfrom pandas import DataFrame#通过read_cs...原创 2020-05-06 11:24:25 · 32920 阅读 · 0 评论 -
Python3:字符串和数据结构
Python变量和简单的数据类型之字符串字符串除数字之外的字符都是字符串,在Python中字符串需要用单引号或双引号括起来,否则会出现错误。Print(hello)运行上述代码后会出现变量名不识别的错误 File "<ipython-input-4-1cd80308eb4c>", line 1, in <module> print(hello)Nam...原创 2020-05-06 09:17:33 · 265 阅读 · 0 评论