df.describe()输出数据不以科学计数法类型输出

最新推荐文章于 2024-04-28 20:44:40 发布

不会代码的single

最新推荐文章于 2024-04-28 20:44:40 发布

阅读量719

点赞数 2

文章标签： python

本文链接：https://blog.youkuaiyun.com/weixin_57462692/article/details/124932414

版权

今天用一个pandas处理数据时，有一个任务要求是处理异常值，利用df.describe()函数查看数据统计量的时候发现输出的数据有的是用科学计数法带e的方式输出,显示是这样的：

之前做的案例里面没有出现过这样的情况，又结合到老师给的文档里说（包括但不限于：数据格式、数值范围等类型异常值），但是不明白是不是数据格式这种类型异常值，但是这样输出的数据看着真的不好看，于是在网上查找了一下可以用这个：

np.set_printoptions(suppress=True)
pd.set_option('display.float_format', lambda x: '%.2f' % x)

引用到代码里面后显示：

问题解决

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

不会代码的single

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python数据科学基础教程

AI天才研究院

08-01

2875

Python数据科学，是指利用Python进行数据科学分析、处理及可视化的一门编程语言。数据准备与预处理：如何进行数据导入、清洗、特征工程等操作；数据探索与可视化：数据量、数据分布、相关性、缺失值分析、变量分布等；数据建模：包括线性回归、逻辑回归、决策树、随机森林等模型构建及评估；模型结果的评估：包括交叉验证、验证集评估、调参等；可视化结果展示：包括散点图、箱线图、直方图等；深度学习框架应用：基于TensorFlow、PyTorch或PaddlePaddle等工具实现深度学习模型训练。

pandas大总结（宝典）---看这篇就够了

qq_43115961的博客

09-18

1511

pandas大总结（宝典）---看这篇就够了

参与评论您还未登录，请先登录后发表或查看评论

pandas将df保存为excel，如何避免长数据序号被保存为科学计数法？解答各种坑

liatan的博客

05-01

7193

describe不要科学计数法

Caiqiudan的博客

08-14

2363

**.apply(lambda x: format(x,'f')

pandas中describe()不采用科学计数法

soohoo

08-17

4275

在pandas中，我们采用pandas中的函数describe()来查询数据的统计信息 data.describe() 对于浮点数，describe()查询到的信息往往会用科学计数法显示为了直观显示数字，不采用科学计数法显示 # 查看数据统计信息 import numpy as np import pandas as pd np.set_printoptions(suppress=True) #pd.set_option('display.float_format', lambda x:'%.f'%x

dataframe.describe（）禁止使用科学计数法

u013250861的博客

01-27

798

所做的是，它只是将每一行格式化为常规格式。我写这个答案的原因是，我心里有。对于整个DataFrame（如@databyte所建议）想法，那就是在我们的常规格式中，它也更易于比较。

Python不使用科学计数法输出数据的实现方法

北极熊在南极_whl的博客

12-26

6527

本文主要介绍在利用Python进行科学计算的时候，怎么让计算出来的数据不以科学计数法的方式输出，而是以常规类型输出。通常情况下，当小数点后面第四位或第三位或第二位或第一位是非零数字时，python在输出时会以常规格式输出数据；当小数点后面第五位或第五位以后才是非零数字时，python在输出时会以科学计数法的方式输出数据。详见下面的例子。以上就是今天要讲的内容，本文仅仅简单介绍了如何使python输出结果不以科学计数法的形式输出。

[工作必备]pandas数据分析处理52个常用技巧

python技巧分享

04-22

4646

pandas工具包类似于python中的excel, 在excel中的筛选、排序、计算、透视、vlookup、分类汇总等操作用python如何实现呢? 本文精心整理的pandas数据处理与分析的51个技巧, 100多个知识点这么多技巧除了收藏, 如何掌握呢, 请看文末! 技巧1: 导入工具包 # pandas 和numpy是两个基础的工具包 import numpy as np import pandas as pd # matplotlib seaborn是作图工具包 import matplo.

数据科学库学习--pandas常用数据类型，loc方法，pandas缺失值处理

WslWslYYX的博客

10-02

546

数据科学库--第四天pandas的常用数据类型 pandas的常用数据类型 pandas是基于numpy数组构建的，但二者最大的不同是pandas是专门为处理表格和混杂数据设计的，比较契合统计分析中的表结构，而numpy更适合处理统一的数值数组数据。pandas数组结构有一维Series和二维DataFrame。 1.Series 一维，带标签数组 2.DataFrame 二维，Series容器创建一个Series 例一： import pandas as pd t = pd.Series([1, 2,

房地产数据分析(python)

Eliauk_qiminghao的博客

04-28

934

new_hourseType_count['其它']=hourseType_count[hourseType_count

pandas describe 计数不起作用统计分析注意事项

qq_45910851的博客

07-18

264

使用describe 分析时要注意数据类型，以下是个经典的，想统计长度的代码，就是因为长度值的类型为int64，所以调用describe时，不会计算 mean，min，max，4分位数。所以要改一下数据类型。

pandas避免显示问题，设置不显示科学计数法

qq_34120015的博客

07-25

1555

pandas避免显示问题，设置不显示科学计数法

【Pandas总结】第三节 Pandas 的显示设置（总结所有常用显示设置）

weixin_47139649的博客

09-09

1万+

本文总结所有Pandas 常用的显示设置，相信对后续Pandas的使用会有很大帮助；

使用pandas GroupBy获取每个组的统计信息（例如计数，均值等）？

xfxf996的博客

06-05

7998

I have a data frame df and I use several columns from it to groupby : 我有一个数据框df ，我从中使用了几列到groupby ：

Pandas.Series.describe() 统计学描述详解含代码含测试数据集随Pandas版本持续更新

数象限

01-22

1224

Pandas.Series.describe() 统计学描述详解含代码含测试数据集随Pandas版本持续更新

数据分析——Pandas（基础）

qq_52421831的博客

09-22

1886

数据分析——Pandas入门

pandas中取消科学计数法，输出显示完整（无省略号）

轻窕

06-21

3924

用python进行数据分析时，查看数据，经常发生数据被自动显示成科学记数法的模式，或者多行多列数据只显示前后几行几列，中间都是省略号的情形。汇总了下解决办法，记录：环境如下： python version == 3.7...

python时间序列案例,Python建立时间序列ARIMA模型实战案例

weixin_31517893的博客

03-26

1317

本文将介绍使用Python来完成时间序列分析ARIMA模型的完整步骤与流程时间序列分析概念时间序列分析是统计学中的一个非常重要的分支，是以概率论与数理统计为基础、计算机应用为技术支撑，迅速发展起来的一种应用性很强的科学方法。时间序列是变量按时间间隔的顺序而下形成的随机变量序列，大量自然界、社会经济等领域的统计指标都依年、季、月或日统计其指标值，随着时间的推移，形成了统计指标的时间序列，例如，股价...

pandas设置不用科学计数法

最新发布

03-01

<think>好的，用户现在问的是“把df pandasDataFrame”，看起来可能想了解如何创建或操作pandas的DataFrame。首先，我需要确认用户的具体需求。可能的情况包括： 1. 用户可能想将数据转换成DataFrame，比如从其他数据结构转换。 2. 可能遇到了错误，比如拼写错误，例如将“pandasDataFrame”连在一起，而没有空格，导致问题。 3. 用户可能不太清楚如何创建或操作DataFrame，需要基础指导。接下来，回顾之前的对话历史。用户之前遇到了KeyError: 'date'的问题，我提供了详细的解决方案，包括检查列名、请求字段、异常处理等。现在的问题可能与DataFrame的操作有关，可能是用户在尝试创建或处理DataFrame时遇到了问题，或者是想了解基本操作。现在需要分析当前查询的意图。用户输入的是“把df pandasDataFrame”，可能有两种情况： - 用户可能想表达“把df转换为pandas DataFrame”，但表达不完整或有拼写错误。 - 或者用户想了解如何操作DataFrame，比如创建、修改或保存。首先，检查是否有拼写错误。正确的术语是“pandas DataFrame”，而用户可能误写为“pandasDataFrame”，中间缺少空格。这可能导致用户在实际代码中遇到问题，比如模块导入错误或者类名错误。接下来，考虑用户可能的实际需求。如果用户想将某个数据转换为DataFrame，可能需要示例代码。或者用户可能在处理数据时遇到了问题，比如创建DataFrame失败，或者操作列时出错，比如之前的KeyError。需要覆盖基础内容，确保用户了解如何创建DataFrame，常见的数据源如字典、列表、CSV文件等。同时，可能需要提醒常见的错误点，比如列名拼写、数据格式不一致等。另外，结合之前的KeyError问题，用户可能在处理时间序列数据，需要确保日期列的正确处理，比如正确请求字段、转换日期格式等。因此，可能需要提供相关的示例，特别是与时间数据相关的DataFrame操作。还可能要考虑用户是否在使用特定的数据源，比如baostock、Tushare等，这些库返回的数据结构可能需要特定的处理步骤，比如字段名的确认、数据转换等。因此，提供针对不同数据源的示例可能有帮助。另外，用户可能需要了解如何查看DataFrame的结构，如使用head(), columns, dtypes等方法，以便调试和验证数据是否正确加载。这部分内容在之前的回复中已经提到过，可能需要再次强调。此外，异常处理也是一个重点。用户可能在转换或创建DataFrame时遇到错误，比如数据类型不匹配、缺失值处理等，因此需要提供相应的错误处理建议，比如使用try-except块，或者数据清洗步骤。最后，要确保回答结构清晰，分步骤说明，并提供代码示例，帮助用户逐步解决问题。同时，保持语言简洁，避免技术术语过多，适合不同水平的用户理解。</think>--- ### 一、DataFrame核心概念 **Pandas DataFrame** 是二维表格型数据结构，相当于Excel表格在内存中的数字化实现，包含以下关键特征： - 列名索引（columns） - 行索引（index） - 异构数据类型（每列类型可不同） - 缺失值自动处理（NaN表示） --- ### 二、创建DataFrame的5种方式 #### 1. 从字典创建（最常用） ```python data = { '股票代码': ['600000.SH', '000001.SZ', '600519.SH'], '日期': ['2023-08-21', '2023-08-22', '2023-08-23'], '收盘价': [7.85, 15.32, 1785.00] } df = pd.DataFrame(data) ``` #### 2. 从CSV文件加载 ```python df = pd.read_csv('stock_data.csv', parse_dates=['date'], # 自动转换日期列 dtype={'volume': 'int64'}) # 指定数据类型 ``` #### 3. 从API接口获取（以Tushare为例） ```python import tushare as ts pro = ts.pro_api('your_token') df = pro.daily(ts_code='600000.SH', start_date='20230101') ``` #### 4. 从数据库读取 ```python import sqlalchemy engine = sqlalchemy.create_engine('mysql://user:password@localhost/db') df = pd.read_sql('SELECT date, close FROM stock_prices', engine) ``` #### 5. 创建空DataFrame ```python df = pd.DataFrame(columns=['时间', '开盘价', '最高价', '最低价', '收盘价']) ``` --- ### 三、关键操作速查表 #### 1. 数据探查 | 操作 | 代码示例 | 输出说明 | |-----------------------|-----------------------------|-------------------------| | 查看前5行 | `df.head()` | 显示表格前5行数据 | | 查看列名 | `df.columns.tolist()` | 返回所有列名的列表 | | 显示数据类型 | `df.dtypes` | 每列的数据类型 | | 统计描述 | `df.describe()` | 数值型字段的统计指标 | #### 2. 数据选择 ```python # 选择单列（返回Series） close_prices = df['收盘价'] # 选择多列（返回DataFrame） subset = df[['日期', '收盘价']] # 条件筛选 aug_data = df[df['日期'].dt.month == 8] ``` #### 3. 数据处理 ```python # 新增计算列 df['涨跌幅'] = df['收盘价'].pct_change() * 100 # 重命名列 df = df.rename(columns={'date': '交易日期'}) # 处理缺失值 df.fillna(method='ffill', inplace=True) # 前向填充 ``` --- ### 四、实战案例：股票分析 #### 1. 计算移动平均线 ```python df['5日均线'] = df['收盘价'].rolling(window=5).mean() df['20日均线'] = df['收盘价'].rolling(window=20).mean() ``` #### 2. 数据可视化 ```python import matplotlib.pyplot as plt df.set_index('日期')['收盘价'].plot(figsize=(12,6), title='股价走势') plt.show() ``` #### 3. 保存处理结果 ```python # 保存到CSV df.to_csv('processed_stock_data.csv', index=False) # 保存到Excel df.to_excel('stock_analysis.xlsx', sheet_name='日线数据') ``` --- ### 五、常见错误处理 #### 1. KeyError解决方案 ```python if '收盘价' not in df.columns: print(f"可用列: {df.columns}") # 安全访问列数据 close = df.get('收盘价', pd.Series()) # 避免KeyError ``` #### 2. 数据类型转换 ```python df['成交量'] = df['成交量'].astype('int64') # 处理科学计数法问题 df['日期'] = pd.to_datetime(df['日期'], format='%Y%m%d') # 转换日期格式 ``` #### 3. 内存优化 ```python # 查看内存占用 print(df.memory_usage(deep=True)) # 优化数值列类型 df['price'] = pd.to_numeric(df['price'], downcast='float') ``` --- ### 六、高级技巧 #### 1. 多DataFrame合并 ```python # 纵向合并（相同结构数据） combined = pd.concat([df1, df2], ignore_index=True) # 横向连接（根据索引合并） merged = pd.merge(stock_data, index_data, on='日期', how='left') ``` #### 2. 时间序列处理 ```python df = df.set_index('日期') # 设置时间索引 monthly = df.resample('M').last() # 获取月末数据 ``` #### 3. 高性能操作 ```python # 使用Numpy加速计算 df['log_return'] = np.log(df['收盘价'] / df['收盘价'].shift(1)) ```