删除pandas中产生的Unnamed:xx列

最新推荐文章于 2024-07-02 17:44:15 发布

原创最新推荐文章于 2024-07-02 17:44:15 发布 · 6.9k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #python

遇到的问题专栏收录该内容

11 篇文章

订阅专栏

博客主要讲述Python使用pd.read_csv读文件时，df中多出Unnamed:38列的问题，指出这是生成csv文件采用默认参数导致。给出两种解决方案，一是to_csv时设置index=False，或加上index=True, index_label='id'；还提及用pandas处理数据产生Unnamed:0列的解决办法，测试环境为Python3.6.5和3.7。

python在使用 pd.read_csv(xxx, sep='\t' ) 读文件时，

结果df中多出了一列 Unnamed:38，本来38个字段又多了一个，变成39个字段。

看起来就很烦。

第39列Unnamed：38，这是我们不想需要的数据，产生原因是我们在生成csv文件的时候，采用的是默认参数，我们可以在生成csv时候，可以使用下面参数解决这一个问题。

to_csv()时候，设置index=False。或者加上 index=True, index_label="id"

解决方案一：

pd.read_csv(path, index_col=0)

pd.to_csv(path, index=False)

解决方案二： (方案一对我遇到的环境是无效的，因此我采用了方案二)

用pandas处理数据是，产生了 Unnamed:0 列，解决方案如下：

df.loc[ : , ~df.columns.str.contains("^Unnamed")]

如果不对的话就换成

newdf = df.loc[ : , ~df.columns.str.contains('Unnamed')]

所测试环境为 python3.6.5 python3.7

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CCESARE

关注关注

6
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

删除pandas中产生的Unnamed列

CJW的博客

03-23

1万+

在数据处理，如果不注意：pandas会自己帮忙加上行和列的名称。这是由于pandas中to_excel生成的数据是各种拼接之后的最终数据（默认index=True,column=True）解决办法： # -*- coding: utf-8 -*- import pandas as pd inputFile = '../data/test.xlsx' # 输入的数据文件 outputFile...

数据分析三剑客：Numpy、Pandas、Matplotlib（你想看的这里都有，超详细版本）

Yuka_bro

10-30

1058

写在前面的话：一直以来，笔者都非常想尝试将所学的知识体系化从而搭建出一名数据分析师应该具备的知识框架与数据处理能力，三剑客将是这条路的起点，本文为笔者原创，耗费近一周左右的私人时间，原创不易，希望读者盆友们多多指正，时间有限，文中出现的错误也希望大家指正，最后，本文的源码跟数据集笔者已放至微信公众：天玄小屋，有需要的盆友可自便。

1 条评论您还未登录，请先登录后发表或查看评论

pandas 合并表格时出现unnamed列，和顺序被打乱的问题

景霄之上的博客

06-28

2689

pandas 合并表格sheet Sorting because non-concatenation axis is not aligned.

pandas 中读取和写入csv文件时候出现Unnamed，解决方案

热门推荐

数据轨迹的专栏

09-12

2万+

在读取csv文件的时候，默认会自动添加新的一列，Unnamed。解决方案： read_csv（）时候，设置index_col=0即可。在写入csv文件的时候，默认会自动加入新的一列，Unnamed,解决方案： to_csv()时候，设置index=False。或者加上index=True, index_label="id"...

【Python-Pandas】删除未命名列Unnamed

写代码的犄角旮瘩

03-04

1423

问题起源：由于在上一步中的to.csv函数中，我没有设置删除索引，导致输出的tsv文件中自带了未命名的一列索引，如图：但是这个索引在我的实验中，并不需要(严谨一点，目前不需要)。所以，我希望能够在不改变原来数据类的情况下，删除这个未命名列。

如何删除pandas中产生的Unnamed:0列

u013310037的博客

11-28

8326

原文链接解决方案一： pd.read_csv(path, index_col=0) 或 pd.to_csv(path, index=False) 解决方案二：用pandas处理数据是，产生了 Unnamed:0 列，解决方案如下： df.loc[ : , ~df.columns.str.contains("^Unnamed")] 如果不对的话就换成 df.loc[ : , ~df.col...

python使用pandas模块介绍以及使用，dataframe结构，Series结构，基本数据操作,DataFrame运算，pandas画图，存储，缺失值处理，离散化，合并

weixin_55579895的博客

10-12

7372

目录1 pandas介绍1.1 Pandas介绍1.2 为什么使用Pandas1.3 案例：在numpy当中创建的股票涨跌幅数据形式1.4 DataFrame1.4.1 DataFrame结构1.4.2 DatatFrame的常用属性和方法 1 pandas介绍 1.1 Pandas介绍面板数据（三维数据）分析计量经济学（数据分析80% 跑计量20%）以Numpy为基础，借力Numpy模块在计算方面性能高的优势基于matplotlib，能够简便的画图独特的数据结构 1.2 为什么使用Pa

小项目-数据处理篇：pandas进行工作相关数据清洗

泛泛之素

01-01

4501

1、去重工作地址，获取地址坐标（高德） 2、去重公司，获取公司情况 3、工作筛选，由于智联上爬取的工作，好多事工作内容里有python，只用python谢谢脚本啥的，实际标题上找的是java啊，php啊，这样的工作要删掉 4、剔除数据异常值，过大过小，NA值 5、工作根据，工作，公司情况，工作内容，技能要求等进行评分，目的是找到适合我的工作

DAY 1 Pandas基础

Youdef

04-20

298

前面的文件读取、常用基本函数、排序等知识点制作了思维导图。大纲五、问题与练习【问题一】 Series和DataFrame有哪些常见属性和方法？ # Series属性 s.values #values index dtype name属性在声明、访问时可使用 # Series方法 s.to_frame() # 将Series数据转换成DataFrame格式 ## DataFrame属性 d...

使用matlab工具写此代码 from pathlib import Path import re import numpy as np import pandas as pd from typing import Dict, List, Tuple, Optional %---------------------- 配置参数 ---------------------- BASE_DIR = Path("附件/附件 3")% 如果基础文件夹不同，请修改 BEFORE_DIRNAME = "姿势调整前" AFTER_DIRNAME = "姿势调整后" %时间归一化目标长度 TARGET_LEN = 200 % 选择度量方式: "mse" (时间上的平均欧氏距离) 或 "dtw" (动态时间规整) METRIC = "dtw" % 输出保存位置 OUT_DIR = Path("analysis_outputs") OUT_DIR.mkdir(parents=True, exist_ok=True) %用于解析"运动者<id>第<attempt>次"的正则表达式（支持.csv/.txt等） NAME_RE = re.compile(r"运动者(\d+)第(\d+)次", re.IGNORECASE) %---------------------- 工具函数 ---------------------- def robust_read_table(fp: Path) -> pd.DataFrame: """ 尝试读取关键点表格，支持灵活的分隔符：逗号、制表符或多个空格。保持表头名称不变。 """ % 先尝试逗号分隔；失败则使用正则表达式分隔符 try: df = pd.read_csv(fp) if df.shape[1] <= 2: raise ValueError("使用逗号分隔时列数太少，尝试正则表达式分隔符。") except Exception: df = pd.read_csv(fp, sep=r"[,\s\t]+", engine="python") %如果存在明显的未命名索引列，则删除 drop_cols = [c for c in df.columns if str(c).lower().startswith("unnamed")] if drop_cols: df = df.drop(columns=drop_cols) return df def get_keypoint_columns(df: pd.DataFrame) -> List[Tuple[str, str]]: """ 基于表头模式（如"0_X"、"0_Y"）返回关键点索引的(x_col, y_col)有序对。如果表头使用例如"0-X"或"0X"，可以在此扩展。 """ xy_pairs = [] %按索引收集 by_index = {} for col in df.columns: s = str(col).strip() %匹配数字后跟下划线和X/Y的模式 m = re.match(r"(\d+)[_\-]?[xX]$", s) if m: idx = int(m.group(1)) by_index.setdefault(idx, {})["x"] = s continue m = re.match(r"(\d+)[_\-]?[yY]$", s) if m: idx = int(m.group(1)) by_index.setdefault(idx, {})["y"] = s continue # 也接受"0_X"、"0_Y"的精确匹配 m = re.match(r"(\d+)_([XY])$", s) if m: idx = int(m.group(1)) axis = m.group(2).lower() by_index.setdefault(idx, {})[axis] = s continue # 按索引构建有序列表 for idx in sorted(by_index.keys()): cols = by_index[idx] # 确保同时有x和y坐标 if "x" in cols and "y" in cols: xy_pairs.append((cols["x"], cols["y"])) # 如果没有找到任何关键点对，抛出错误 if not xy_pairs: raise ValueError("无法检测到类似'0_X'、'0_Y'的关键点列。请检查表头。") return xy_pairs # 可以在这里继续添加其他函数，如线性重采样、空间归一化等 def linear_resample(arr: np.ndarray, target_len: int) -> np.ndarray: """ 将形状为(T, D)的数组线性重采样为(target_len, D)。 """ T, D = arr.shape if T == target_len: return arr.copy() old_idx = np.linspace(0, 1, T) new_idx = np.linspace(0, 1, target_len) out = np.empty((target_len, D), dtype=float) for d in range(D): out[:, d] = np.interp(new_idx, old_idx, arr[:, d]) return out

最新发布

09-06

% 删除未命名列 colNames = table2array(varfun(@iscellstr, df, 'OutputFormat', 'cell')); for i = 1:length(colNames) if startsWith(lower(colNames{i}), 'unnamed') df.(colNames{i}) = []; end end end...

解决用Pandas处理csv,excel文件多出unnamed列问题

alzy133的博客

05-26

1万+

用read_csv, read_excel, to_csv, to_excel的时候会多出unnamed列，开始查到的方法是添加属性： df = pd.read_csv('data.csv', index_col=0) df = df.to_csv('data.csv', index=False) 但是上面的代码对我这个无效，后来在stackoverflow上查到可以直接删除包含unname的字段，虽然感觉方法笨一点但是是有效的。 data = data.loc[:, ~data.columns.str

解决问题：pandas读取或者写入csv文件会多出现一列----Unnamed:0

小马哥的博客

03-22

1万+

注意：读取或者写入pandas文件时出现新的一列 'Unnamed:0' 解决方案1： read_csv（）时候，设置index_col=0即可。 pd.read_csv(path,index_col=0) 解决方案2： to_csv()时候，设置index=False。或者加上index=True, index_label=“id” df.to_csv(path,index=Fals...

python中删除unnamed_python-删除包含NaN,NaT和nans的任何列的行

weixin_36212959的博客

01-14

645

目前,我的数据如下：df_all.head()Out[2]:Unnamed: 0 Symbol Date Close Weight0 4061 A 2016-01-13 36.515889 (0.000002)1 4062 AA 2016-01-14 36.351784 0.0001122 ...

python中删除unnamed_使用pandas写入CSV时删除“unnamed:#”

weixin_39574869的博客

12-23

719

如果使用header=None读取CSV，则空单元格将填充NaN，而不是{}：df = pd.read_table('data', sep='\s*[|]\s*', header=None)# 0 1 2 3 4 5# 0 2015-06-29 NaN 2015-06-28 NaN 2015-06...

pandas（一）：read_csv解决第一列Unnamed问题

Trisyp的博客

08-24

3908

read_csv常用

pandas存储csv文件后后再读取去除第一列的Unnamed: 0

qq_33740989的博客

07-02

1074

方法1：读取 CSV 文件时使用参数，将第一列作为索引。方法2：存储 CSV 文件时使用参数，不包含索引列。这两种方法都可以避免读取 CSV 文件时出现 “Unnamed: 0” 列。

Pandas -- 不选择Unnamed字段的列

MarkAdc的博客

07-29

3055

前言 pandas读取的表格如果某字段名称没有值那么代码输出会显示为Unnamed…(str类型）示例下方图片为excel文件部分截图可以清晰的看到第一个字段是没有名称的用pandas读取 import pandas as pd path = "./files/demo.xlsx" df = pd.DataFrame(pd.read_excel(path, engine="openpyxl")) print(df.columns.to_list()) 输出字段名称解决方案

关于pandas中的 unnamed的出现一项

weixin_45948229的博客

04-01

1175

关于pandas中的 unnamed的出现一项直接在后面加 index_col = 0 即可完美解决这样的就是告诉用第一列来做索引

pandas删除列'Unnamed: 0'

05-29

要删除 Pandas 数据帧（DataFrame）中的列，可以使用 DataFrame 的 `drop()` 方法，指定要删除的列名和 `axis=1` 参数。对于你的情况，可以像这样删除 "Unnamed: 0" 列： ``` data.drop('Unnamed: 0', axis=1, inplace=True) ``` 其中，`inplace=True` 表示在原数据帧上进行修改。如果你不想修改原数据帧，可以省略该参数。