python入门技能—文件读取及查看数据

最新推荐文章于 2021-04-14 18:31:14 发布

原创最新推荐文章于 2021-04-14 18:31:14 发布 · 535 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据

机器学习，数据挖掘专栏收录该内容

19 篇文章

订阅专栏

本文介绍了如何使用Python中的Pandas库来读取并初步处理CSV格式的数据集，包括读取文件、查看基本信息、统计数据以及删除不必要的列。

1.读取文件

data_train = pd.read_csv("E:/KaggleT/train.csv")

2.查看数据

data_train.info()

data_train.describe()

#查看特征内部的关系。看看男女各有多少人      
data_train.Sex.value_counts()  #男的比女的多

#丢掉没用的列

data_train = data_train.drop(['Ticket'],axis=1)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

NorthFish北海有鱼

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

篇一：数据探索性分析步骤

twlve的博客

04-23

3214

目录一.数据的总体了解 1.1 维度：data.shape 1.2 类型等基本信息：data.info() 1.3 统计信息：data.describe() 二.数据的深入了解 2.1 数据类型 2.1.1分类数据 2.1.2数值数据 2.2 数据分布： 2.2.1分类数据的分布 2.2.2离散型数据的分布 2.2.3连续型数据的分布三.数据的特殊了解 3.1 缺失值 3.2 唯一值四.数据的关系了解 4.1特征变量与特征变量之间 4.2特征变量与目标变量之间一

Python数据分析高薪实战第五天文件数据的读取和查看

fegus的博客

05-04

995

11 文件处理：如何读取多种文件（cvexcel）的数据？从今天开始，我们进入了一个新的部分：使用 pandas 进行数据处理。在上一个模块我们学习了爬虫技术，并学会了怎么将数据从网页中抓取出来保存成 csv 数据集。在有了数据集之后，接下来我们就开始学习怎么把数据集的内容加载到 Python 中。虽然我们在上一个模块学过简单的读取 csv 的文件内容。但是存在两个问题：只能读取 csv 文件，但数据分析的数据除了可能来自 csv，也可能来自 Excel，甚至可以来自 html 的表格。

参与评论您还未登录，请先登录后发表或查看评论

机器学习-2.0数据探索

weixin_41175904的博客

04-08

817

机器学习-数据分析

利用python将数据集分为train_data和test_data

wakaka1226的博客

09-20

9140

在图像分类时将收集到的分类好的数据进行随机打乱按比例生成训练集和测试集下面是代码 import os import random import shutil def data_random_split(current_dir,ratio_train): ''' 将当前文件夹中文件按一定比例分成train和test连个列表，列表存放文件名 ''' data_li...

info函数与describe函数

白炎灵的博客

03-05

5185

info()函数与describe()函数一，info()函数功能：给出样本数据的相关信息概览：行数，列数，列索引，列非空值个数，列类型，内存占用使用格式：dat...

Python入门文件读写.md

09-27

文件读写是编程中的一项基本操作，尤其在Python语言中，文件操作简单易学，非常适合初学者入门。文件读写通常包括以下几个主要步骤：打开文件、读取或写入文件内容、关闭文件。在Python中，处理文件主要通过内置函数...

Python从入门到精通

11-03

本书在这一部分详细介绍了Python进行文件读写操作的各种方法，让读者能够理解并掌握文件的打开、读取、写入和关闭等操作。随着内容的深入，本书还探讨了Web开发方面的知识。Web开发已经成为现代编程中不可忽视的一...

Python入门精要

最新发布

11-05

在字符串操作、集合处理、异常管理和文件读写等方面，本书提供了大量的实践示例，这些都是进行Python编程中非常实用的技能。通过这些示例，读者可以学习如何操作文本数据、处理集合数据结构、应对程序运行中的各种...

精选资源

精品课件 Python从入门到精通第13章文件及目录操作（共26页）.ppt

10-17

通过学习这些知识点，开发者能够熟练地在Python环境中处理文件和目录，实现数据的存取和管理，这对于任何项目都是必不可少的基础技能。在实际开发中，这涵盖了从简单的日志记录到复杂的数据存储和备份等各种应用场景...

精选资源

python入门教程大全.pdf 精心整理

04-11

【Python入门教程】系列涵盖了多个基础到进阶的Python知识点，包括了数据导入、网络爬虫、基础语法、错误处理、面试准备、模板库、服务器配置、数据结构、类型操作、异常处理、字符串处理、爬虫开发、应用场景、编码...

train data

01-23

图像训练数据，用于对模型进行训练的数据，可以用于机器学习

data_train.zip

11-16

知网期刊公开的文艺、计算机、体育类文章，用于文本分类学习研究

python中info的用法_在Python中使用data.info（）显示所有信息

weixin_39654823的博客

11-29

1751

data_train.info(verbose=True)RangeIndex:85529entries,0to85528Datacolumns(total110columns):ID int64COD_INSEE float64COD_IRIS float64C1 objectC2 objectC3 o...

python - 数据集处理

rojyang的博客

02-13

753

数据集：训练集、测试集、验证集训练集：用来训练与拟合模型验证集：当通过训练集训练出多个模型，使用验证集数据纠偏或比较预测测试集：模型泛化能力的考量 train_test_split是交叉验证中常用的函数，功能是从样本中随机的按比例选取train data和test data，形式为： X_train,X_test, y_train, y_test = cross_validation...

python中info的用法_使用Python中的data.info()显示所有信息

weixin_29867607的博客

03-02

1万+

我会显示我的数据框的所有信息，其中包含来自熊猫的.info()超过100列，但它不会：data_train.info()RangeIndex: 85529 entries, 0 to 85528Columns: 110 entries, ID to TARGETdtypes: float64(40), int64(19), object(51)memory usage: 71.8+ MB我希望它像...

对智慧海洋数据进行数据分析

sjjsaaaa的博客

04-14

1570

数据分析数据获取地址：链接：https://pan.xunlei.com/s/VMX5JAhFN7ZmPaaCVsHQEVkrA1 提取码：hmtz 一、数据详情 1.导入相关库 #coding:utf-8 #导入warnings包，利用过滤器来实现忽略警告语句。 import warnings warnings.filterwarnings('ignore') import numpy as np import pandas as pd from matplotlib import pyplot a

python-按比例将子文件划分为train data和test data

博客

01-24

9569

python-按比例将子文件划分为train data和test data 程序目的：将data划分为测试集和训练集：原始数据存放位置:./data/danzi/ 测试集位置:./data/danzi-test/ 训练集数据存放位置:./data/danzi-train/ 按照0.7：0.3划分测试集和训练集程序步骤： 1.读取所有data 2.打乱数据 3.对

Pandas中的info()函数与describe()函数