创建空的dataframe并逐个添加np.ndarray

最新推荐文章于 2024-05-15 15:16:25 发布

原创最新推荐文章于 2024-05-15 15:16:25 发布 · 1w 阅读

4 ·

CC 4.0 BY-SA版权

python相关专栏收录该内容

5 篇文章

订阅专栏

本文介绍如何使用Python的pandas库将多个numpy数组逐条添加到一个初始为空的DataFrame中。首先创建一个带有指定列名的空DataFrame，然后通过循环遍历计算出的numpy数组，并将其转换为DataFrame形式后追加到初始DataFrame中。

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

偶尔会遇到需要将元素一个一个添加到一个初始为空的dataframe中，今天刚好碰到这种情况，下面写一下方法。

刚开始import那些就不提了。

创建空dataframe：

colname=['a','b','c']
test=pd.DataFrame(columns=colname)

就创建了名为test的空dataframe，其中列名分别为'a','b','c'

现在假设我计算出了n个形状为(3,)的np.ndarray，３个元素分别对应a, b, c的值，要把这n个array依次填进dataframe里，那么

for i in range(n):
    data = # np.ndarray的计算步骤
    df_i = pd.DataFrame([data], columns=colname) # 这个[]很重要
    test = test.append(df_i) # 这个=很重要，和list不一样

就添加好了。

您可能感兴趣的与本文相关的镜像

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

monchin

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python中构造出一个空的DataFrame，并在循环中不断往dataframe里面添加内容

微信公众号（年更选手）：数据闲逛人 | Github开源项目：数分/数挖study路线 https://github.com/jc-dian/python_data_analysis

04-20

6013

这是管培期间的一个学习任务里面其中解决问题用到的方法关键是下面的result.loc()巧妙地利用len()获取dataframe数据长度 import pandas as pd import numpy as np # 构造表格2数据 data = pd.DataFrame({'product_num':['A','B'], 'kk_big_category':['美妆','食品'], 'kkv_big_catego

将循环结果写入到新建的dataframe中

qq_32649321的博客

03-01

4243

想要将循环的结果写入到新建的dataframe中，实现方法： path = r'./1.xlsx/' df_reg = pd.DataFrame(columns=('ID','cof','intercept','score')) # to save reg result for i in os.listdir(path): df = pd.read_excel(os.path.join(path,i)) fitting_data = df[(df['filter']==0)]

参与评论您还未登录，请先登录后发表或查看评论

把一个array添加到datafram最后一列

Miss_Leoli的博客

07-14

2602

场景：我有一个dataframe，记为next_prob 还有一个np.array，记为tag（tag的长度就是df的记录数）想实现，把tag依次对应着添加到datafram最后一列，效果如下：方法：一条语句next_prob[123] = tags即可，其中123是要添加的位置，加不加引号都可以。 ※ list添加到df最后一列也是一样的做法 ...

Python中DataFrame转换成ndarray

m0_61165991的博客

04-20

3883

今天用pandas读入csv数据之后想转换成ndarray，在网上找到的方法如下： import pandas as pd data = pd.read_csv('/Users/ada/data/wine.csv',sep=';') data = data.values 问题解决了，开心～还有一个小问题就是怎么索引array里的列： data[...,0:10] 前面加上三个点点就可以啦，这样就是数据的1-10列。顺便再学习一下ndarray转换成DataFrame方法如下： import pan

python学习笔记之pandas导入numpy数组

weixin_44773892的博客

01-30

1337

python学习笔记之pandas导入numpy数组新手楼主前几天用pandas将CSV文件导入numpy数组的时候，遇到了一个问题，每次首行都会被去掉，后来发现是一个常识性的问题，首行会作为表头不被导入数组，CSV文件如下：代码如下： import numpy as np import pandas as pd xxx= pd.read_csv("1234.csv") zzz = x.loc[:, :].to_numpy() print(zzz) 结果如图：为CSV添加表头（首行）之后如下：

Pandas创建一个空DataFrame，并逐行插入数据

热门推荐

imlpf的专栏

07-02

10万+

#创建一个空的Dataframe result =pd.DataFrame(columns=('idx','degree','weight','diameter')) #将计算结果逐行插入result,注意变量要用[]括起来,同时ignore_index=True，否则会报错，ValueError: If using all scalar values, you must pass an inde...

Python 创建一个空的DataFrame，并按行写入数据

xxmbby的博客

11-19

5519

Python 创建一个空的DataFrame，并按行写入数据

这段代码：def evaluate_attributes(y_true, y_prob, y_conf, prob_threshold, conf_threshold): """ 通用的属性识别性能评价函数。 Args: y_true (np.ndarray): 真实标签, shape (N, C), -1 代表未知。 y_prob (np.ndarray): 预测的属性概率, shape (N, C)。 y_conf (np.ndarray): 预测的置信度, shape (N, 1) 或 (N, C)。 prob_threshold (float): 属性概率阈值。 conf_threshold (float): 置信度阈值。 Returns: pd.DataFrame: 包含每个子属性 Precision, Recall, F1-Score 的报告。 """ y_pred = np.full_like(y_prob, -1, dtype=int) #处理二元属性 binary_indices = [v['idx'] for k, v in ATTRIBUTE_MAPPING.items() if isinstance(v['idx'], int)] # 提取二元属性对应的数据 binary_prob = y_prob[:, binary_indices] # 根据 y_conf 的形状，正确提取置信度 binary_conf = y_conf if y_conf.shape[1] > 1 else y_conf[:, 0:1] # 应用二元属性的预测逻辑 ##################这里是大于等于和小于等于 cond_predict_1 = (binary_conf >= conf_threshold) & (binary_prob >= prob_threshold) if prob_threshold!=0.5: cond_predict_0 = (binary_conf >= conf_threshold) & (binary_prob <= (1-prob_threshold)) else: cond_predict_0 = (binary_conf >= conf_threshold) & (binary_prob < (1-prob_threshold)) binary_pred = np.select([cond_predict_1, cond_predict_0], [1, 0], default=-1) y_pred[:, binary_indices] = binary_pred # --- 处理互斥多分类属性 (lower_body) --- multi_class_slice = ATTRIBUTE_MAPPING['lower_body']['idx'] # 提取下装类型对应的数据 multi_class_prob = y_prob[:, multi_class_slice] # 根据 y_conf 形状，正确提取并计算该组的置信度 if y_conf.shape[1] > 1: # 逐属性置信度：取该组的平均值 multi_class_conf = np.mean(y_conf[:, multi_class_slice], axis=1) else: # 全局置信度 multi_class_conf = y_conf.flatten() # 筛选出置信度达标的样本 confident_samples_mask = multi_class_conf >= conf_threshold if np.any(confident_samples_mask): confident_probs = multi_class_prob[confident_samples_mask] # 找到最大概率及其索引 max_probs = np.max(confident_probs, axis=1) argmax_indices = np.argmax(confident_probs, axis=1) # 在置信度达标的样本中，再次筛选出最大概率也达标的样本 #################裤子判断标准为大于等于 passes_prob_thresh_mask = max_probs >= prob_threshold # passes_prob_thresh_mask = max_probs >= 0 # 获取最终要更新的样本的索引 final_update_indices = np.where(confident_samples_mask)[0][passes_prob_thresh_mask] final_argmax_indices = argmax_indices[passes_prob_thresh_mask] # 创建 one-hot 预测结果并更新到 y_pred # 只有在 final_update_indices 中的样本才会被更新（从-1变为0或1） final_predictions = np.zeros((len(final_update_indices), 3), dtype=int) final_predictions[np.arange(len(final_update_indices)), final_argmax_indices] = 1 y_pred[final_update_indices, multi_class_slice] = final_predictions：中所有类别的概率阈值和置信度阈值是统一的，能否修改为不同类别使用不同的阈值。

10-21

下面给出修改后的函数代码，并添加详细注释。 </think>### 为不同类别设置独立阈值：解决方案与代码实现您提出了一个关键改进点：将统一的概率阈值和置信度阈值改为不同类别使用不同阈值。这在实际应用中非常重要...

11-04

if isinstance(self.chemical_data, np.ndarray): return np.nanmean(self.chemical_data, axis=0) elif isinstance(self.chemical_data, pd.DataFrame): return self.chemical_data.mean().values else: ...