自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 numpy task 02

副本与视图 在numpy中,尤其是在做数组运算或数组操作时,返回结果不是数组的副本就是视图 在numpy中,所有复制运算不会为数组和数组中的任何元素创建副本 numpy.ndarray.copy()函数创建一个副本。对副本进行修改,不会影响到原始数据,物理内存不在同一位置。 import numpy as np x = np.array([1, 2, 3, 4, 5, 6, 7, 8]) y = x y[0] = -1 print(x) # [-1 2 3 4 5 6 7 8] print

2020-10-23 18:01:22 171

原创 Numpy task01

ndarray 大数据容器 执行数学运算 容器内所有的元素必须是相同类型的 构成: 一个shape(一个表示各维度大小的原件)和 dtype(一个用于说明数组数据类型的对象) 创建ndarry

2020-10-20 20:24:57 324

原创 数据清理、转换、合并、重塑

dataframe合并 # - merge 默认做的是inner链接,取得数据之间的交集 df1 = DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)}) df2 = DataFrame({'key': ['a', 'b', 'd'], 'data2': range(3)}) df1 key data1 0 b 0 1 b 1 2 a 2 3 c 3 4 a 4 5 a 5 6 b 6 df2 ke

2020-09-10 16:56:29 457

原创 复习数据分析task01 pandas入门

pandas series dataframe ##Series 3. 由一组数据和一组与之相关的数据标签(即索引)组成 obj = Series([4, 5, -5, 3]) obj 0 4 1 7 2 -5 3 3 #表现形式极为索引在左,值在右边 #如果需要表现获取数组表现形式和索引对象 #用values获取数值 obj.values orray([4, 7, -5, 3]) #用index获取索引对象 obj.index Int64Index([0, 1, 2, 3]) #series对每

2020-09-02 17:18:08 370

原创 数据分析建模和评估

# sklearn模型算法选择路径图 Image('sklearn.png') ''' 任务一:切割训练集和测试集 这里使用留出法划分数据集 将数据集分为自变量和因变量 按比例切割训练集和测试集(一般测试集的比例有30%、25%、20%、15%和10%) 使用分层抽样 设置随机种子以便结果能复现 ''' from sklearn.model_selection import train_test_split X = data y = train['Survived'] X_train, X_test,

2020-08-28 20:34:09 448

原创 数据可视化

#引入约定 import matplotlib.pyplot as plt #matplotlib 图像保存在figure对象里 #创建新的figure fig = plt.figure() #其中figsize用于确保图片保存时的纵横比 #绘图需要创建一个或多个 subplot axi = fig.add_subplot(2, 2, 1) axi = fig.add_subplot(2, 2, 2) axi = fig.add_subplot(2, 2, 3) #代码意思图像是2*2 大小,选中的是第

2020-08-26 10:40:43 139

原创 数据重组

1.groupby机制 第一步,数据包含在pandas对象中,可以是Series、DataFrame或其他数据结构 第二步,根据你提供的一个或多个键分离到各个组中注:分离操作是在数据对象的特定轴向上进行的。 第三步,函数就应用到各个组中,产生新的值 第四步,所有函数的应用结果联合为一个结果对象 2.分组键可是多种形式,并且键不一定是完全相同的类型 (1)与需要分组的轴向长度一致的值列表或值数组 (2) DataFrame的列名的值 (3)可以将分组轴向上的值和分组名称相匹配的字典或Series (4) 可

2020-08-23 22:25:00 2356

原创 数据清洗

第二章第一节数据清洗 第一部分数据处理 第二部分 特征观察与处理

2020-08-21 22:39:17 171

原创 数据分析task1

数据加载 1.1 导入numpy和pandas import numpy as np import pandas as pd 1.2 载入数据 #使用相对路径载入数据-相对路径就是以当前文件为基准进行一级级目录指向被引用的资源文件 df = pd.read_csv('train.csv') #使用绝对路径载入数据-绝对路径就是文件的真正存在的路径,是指从硬盘的根目录(盘符)开始,进行一级级目录指向文件。 df = pd.read_csv('D:\学习\动手学数据分析-组队学习版\第一单元项目集合/tr.

2020-08-19 22:05:44 222

原创 task 04

#将以数指定年,月,日的日期打印出来 months = [ 'January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'Novemer', 'December' ] #一个列表,其中包含数1-31对应的结尾 endings = ['st', 'nd',

2020-07-28 23:42:47 113

原创 task03异常处理

task03异常处理 try/expect while True: try: x = int(input("请输入一个数字: ")) break except ValueError: print("您输入的不是数字,请再次尝试输入!") ''' try 语句按照如下方式工作 首先,执行 try 子句(在关键字 try 和关键字 except 之间的语句)。 如果没有异常发生,忽略 except 子句,try 子句执行后结束。

2020-07-25 21:56:13 168

原创 task02 条件循环结构

task 02: 条件循环结构 1.掌握基本的条件,循环语句的使用 2.掌握assert断言break,continue,pass,等语句的使用 3.熟悉推导式的用法 引入 # Fibonacci series: 斐波纳契数列 # 两个元素的总和确定了下一个数 a, b = 0, 1 while b < 10: print(b) a, b = b, a+b 1 1 2 3 5 8 ''' 第一行包含了一个复合赋值:变量 a 和 b 同时得到新值 0 和 1。最后一行再次使用了

2020-07-23 22:17:11 268

原创 Task01: 变量、运算符、数据类型及位运算

1.1 Task01: 变量、运算符、数据类型及位运算 理论部分:1. 了解变量类型,运算符,数据类型 2. 了解位运算 1.1 task01: 变量、运算符、数据类型以及位运算 1 基本语法 1.1 注释 1.1.1 单行 #开头 1.1.2 多行注释 ‘’’ ‘’’ 或者“”” ””” 1.2 行与缩进 1.2.1 缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数(坚持使用4个空格的缩进) 1.3 多行语句 Eg:total = [‘item_one’, ‘item_two’,

2020-07-22 23:43:03 186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除