- 博客(16)
- 收藏
- 关注
原创 每日一题-数据分析
解析:数据治理是在管理数据资产过程中行使权力和管控,包括计划、监控和实施;数据管理是为了交付、控制、保护并提升数据和信息资产价值,在其整个生命周期中制订计划、制度、规程和实践活动,并执行和监督的过程。,A选项,数据治理保证数据是被管理的,B选项,数据管理管理数据以达到既定目标。C. 数据治理是总体视角的,数据管理是执行层面的。关于数据治理和数据管理以下说法正确的是( )B. 数据治理管理数据以达到既定目标。A. 数据管理保证数据是被管理的。D. 以上全是。
2024-02-19 15:17:19
7445
1
转载 pycharm 安装插件
pycharm 安装插件的方法主要有两种:file --> settings --> plugins --> Install JetBrains plugins… --> 搜索要安装的插件,点击安装file --> settings --> plugins -->Install plugins from disk… --> 选择下载好的插件安装(格式为.zip)我自己使用第二种方法安装了 IdeaVim 和 Markdown support
2021-07-14 14:23:19
1470
转载 pandas取文件中某几列
方法1df = pd.DataFrame(df,columns=[‘body’,‘predict’])方法2df = df[[‘predict’, ‘body’]]方法3df = df.loc[:, [‘predict’, ‘body’]]方法4df = df.iloc[:, [1,3]]方法5df = pd.read_excel(filename, header=0, usecols=[‘predict’,‘body’])————————————————...
2021-04-26 10:30:35
574
原创 pandas to_excel
1、pandas写入excel多级表头,采用笛卡尔积方法#写入header2多级表头array=[[875,76750,123,12356],[876,67543,124,98765],[877,98076,125,65432]]header2=pd.DataFrame(array,index=['1','2','3'])header2.columns=pd.MultiIndex.from_product([['jd','tb'],['销量','销售额']])header2.index.name
2021-04-24 11:15:52
1346
原创 pandas_readexcel
1、read_excel()参数usecols:指定只使用哪些列None:全部(默认)str:k=pd.read_excel('head.xlsx',sheet_name=2,header=1,usecols=['月份','销量','销售额'])#head=1代表表头从第二行开始
2021-04-24 11:07:08
265
1
原创 pandas-excel_1
1、read_excel()df=pd.read_excel('sheet_name.xlsx')#默认是取第一个sheetdf=pd.read_excel('sheet_name.xlsx',sheet_name='3月')#取sheet名为3月的sheetdf=pd.read_excel('sheet_name.xlsx',sheet_name=1)#取第二个sheet(默认下标从0开始计算)df=pd.read_excel('sheet_name.xlsx',sheet_name=[1,'3月
2021-04-04 23:21:26
91
原创 pandas3
一、约定引入import pandas as pdimport numpy as npfrom pandas import DataFrame,Series二、构造一个数据框n1=np.random.random((20,6))s1=DataFrame(n1)s2=DataFrame(n1,columns=['a','b','c','d','e','f'])三、缺失值的处理1、利用reindex()方法对指定轴上的索引进行修改(增加或删除)s3=s2.reindex(index=[1
2021-04-03 22:39:49
91
转载 random函数
#先保存下来1.np.random.random()函数参数np.random.random((100, 20))上面这个就代表生成100行 20列的浮点数,浮点数都是从0-1中随机。2.numpy.random.rand()函数用法numpy.random.rand(d0, d1, …, dn):生成一个[0,1)之间的随机浮点数或N维浮点数组。3.numpy.random.randn()函数用法:numpy.random.randn(d0, d1, …, dn):生成一个浮点数或N维浮
2021-03-30 08:57:22
172
原创 pandas(2)
import pandas as pdimport numpy as npfrom pandas import DataFrame,Seriesn1=np.random.random((20,6))s1=DataFrame(n1)print(s1)#output如下 0 1 2 3 4 50 0.210101 0.241955 0.417872 0.235394 0.131291
2021-03-25 08:54:29
168
1
原创 pandas(1)
最近几天学习了pandas的部分知识,总结如下:一、数据结构1、Series:一种类似于一维数组的对象,是由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成,仅由一组数据即可产生简单的Series2、DataFrame:一个表格型数据结构,含有一组有序的列,每类可以是不同的值类型(数值、字符串、布尔值等),DataFrame既有行索引也有列索引,可以被看成是由Series组成的字典。二、引入约定import pandas as pdfrom pandas import
2021-03-21 22:15:56
150
转载 Python的reshape的用法
numpy中reshape函数的三种常见相关用法:1、numpy.arange(n).reshape(a, b) 依次生成n个自然数,并且以a行b列的数组形式显示arr=np.arange(32).reshape((4,8))#out# arr= [[ 0 1 2 3 4 5 6 7]# [ 8 9 10 11 12 13 14 15]# [16 17 18 19 20 21 22 23]# [24 25 26 27 28 29 30 31]]2、mat (or
2021-02-24 09:00:06
748
原创 re模块match、search、findall区别及sub
1、match:是从开头匹配,若开头不满足,则返回null;2、search: 在整个字符串中去匹配,匹配到一个即停止;3、findall:在整个字符串中匹配所有符合的,且以列表形式得到子串。eg:findallstring='one1two2three3four4'pattern =re.compile('\d+')print (re.findall(pattern,string))返回:[‘1’, ‘2’, ‘3’, ‘4’]若改用search,则返回结果为1,因为匹配到第一个数字即停
2021-01-21 21:44:24
874
1
原创 正则表达式
用来匹配字符串语法说明实例匹配字符串一般字符匹配自身abcabc.匹配任意除换行符“\n”外的字符a.cabc\转义字符,使后一个字符改变原来的意思。如果字符串中有字符需要匹配,可以使用*或者字符集[]a.c a\ca.c, a\c[…]字符集。对应的位置可以是字符集中任意字符。字符集中的字符可以逐个列出,也可以给出范围,如[abc]或[a-c]。第一个字符如果是^则表示取反,如[^abc]表示不是abc的其他字符。所有的特殊字符在字符集中都失
2021-01-17 13:17:38
134
原创 插入数据库操作
步骤如下:1、连接数据库conn=pymysql.connect(host=’’,user=’’,passwd=’’,db=’’,charset=’’)2、创建操作游标,创建mysql的操作连接cursor=conn.cursor()3、写sql语句插入操作,方法有以下几个:(方法一) 用format: 注意项是若参数是字符串形式,则前面括号里需要引号,否则报错sql='insert into jy(uid,price,createtime) values ({0},{1},"{2}")'.
2021-01-15 19:03:04
1064
原创 数组的形状与计算
1、数组的形状t8=np.array([random.random() for i in range(10)])print(“t8=”,t8)t9=np.round(t8,2)print(“t9=”,t9)m5=np.arange(12)print(“m5=”,m5)print(m5.shape)t5=m5.reshape((12,1))print(t5)t6=m5.flatten()print(“t6=”,t6)2、数组的计算若相同位置,相应计算(广播机制);若有一维度相同,另一
2021-01-15 08:34:53
408
原创 ‘Cursor‘ object has no attribute ‘excute‘
一个未解决问题在做连接数据库插入操作时,用此方法试了很久,不清楚为什么一直报错,代码如下:sql='insert into jy(uid,price,createtime) values (%s,%s,"%s") ' % ('1',1.28,'2020-01-09')print (sql)cursor.excute(sql)目前还不清楚原因,也没查出来合理解释,留此记录,以后继续深究。...
2021-01-15 08:33:55
5014
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人