- 博客(7)
- 收藏
- 关注
原创 【python基础】多方法实现1-100累加求和
以下给出五种解题角度(for循环、while循环、列表推导式、reduce函数、递归函数)③列表推导式(直接利用sum函数)
2023-04-01 18:30:20
7064
2
原创 动手学数据分析 TASK5 数据建模与模型评估
第三章:数据建模与模型评估前言一、关键词概要二、内容复现(一) 数据建模1.数据载入及预设2.模型选择与sklearn算法(1)sklearn简介3.数据集划分4.模型搭建(1)创建基于线性模型的分类模型(逻辑回归)(2)创建基于树的分类模型(决策树、随机森林)5. 输出模型预测结果(二)模型评估1.交叉验证2.混淆矩阵3.ROC曲线参考文章前言经过前面的两章的知识点的学习,我们除了可以对数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作,该过程可以统称为数据的预处理。这一章我们要做的就
2021-08-27 01:48:28
712
原创 动手学数据分析 TASK3 数据重构
本篇是用于记录第二章的第二小节,旨在实现数据重构,通过对数据整体的结构的变换调整、以达到分析不同层次、群体画像数据的目的。主要包括数据的合并和数据的属性方面聚合运算groupby等用法。开始前,导入numpy、pandas包和数据#导入基本库import numpy as npimport pandas as pd第二节 数据重构数据的合并2.4.1 载入数据观察数据间关系left_up = pd.read_csv("data/train-left-up.csv")left_down =
2021-08-21 18:30:19
312
原创 动手学数据分析 TASK2 数据清洗及特征处理
本篇主要解决数据清洗和数据的特征处理问题,数据清洗包括缺失值、重复值的处理、字符串数据转换等,此项过程为数据分析的前序环节起铺垫作用。2 第二章:数据清洗及特征处理知识概要 缺失值和重复值的观察与处理 数据的分箱处理 文本变量转换数据加载import numpy as npimport pandas as pddf = pd.read_csv('train.csv')2.1 缺失值观察与处理2.1.1 缺失值观察(1)查看每个特征缺失值个数>>>df.isn
2021-08-19 23:04:08
329
原创 动手学数据分析 TASK1 数据加载及探索性数据分析
该博文用于记录学习过程的要点,通过kaggle网站上泰坦尼克的任务为例实现数据分析全流程,同时熟悉Jupyter Notebook的基本操作1 第一节:数据载入及初步观察1.1 载入数据数据集来源: https://www.kaggle.com/c/titanic/overview下载得到’ train ’ ’ gender_submission '和 ’ test_1 '三份文件任务一:导入python库import numpy as npimport pandas as pdimport
2021-08-17 20:45:25
339
原创 Rsutdio读取R文件时中文注释出现乱码
Rsutdio读取R文件时中文注释出现乱码我下的是R最新版4.0.3,在用Rstudio读取已写好的R文件时,出现乱码,咨询后得知需要将编码改为utf-8,小小地记录一下。设置时,依次选择Tools-Global Option-Code-Saving在Default text encoding一栏修改为UTF-8即可选择完成,依次点击OK即可,再重新打开已有R文件...
2021-03-09 20:37:25
1922
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人