
python
文章平均质量分 61
python
changzi990
这个作者很懒,什么都没留下…
展开
-
python的ne.set_num_threads()函数
numexpr还有一个重要的加速利器,多线程操作。通过 ne.set_num_threads(1) 可以设置线程的数量,更多的线程表示程序可以同时对数学表达式进行计算。作者:计算机与AI https://www.bilibili.com/read/cv7970594/ 出处:bilibili。如上所示,如果我们设置单线程,程序运行需要13.4 ms。设置了双线程,速度则可以提升一倍。原创 2024-06-17 18:10:16 · 235 阅读 · 0 评论 -
python---之table写hdf5文件
本文将从tables的读,写,以及一些简单的操作进行简要描述。使得tables这个tool能够为我们所用。首先,我们先介绍下HDF5(Hierarchical Data Format).HDF 是用于存储和分发科学数据的一种自我描述、多对象文件格式。HDF 是由美国国家超级计算应用中心(NCSA)创建的,以满足不同群体的科学家在不同工程项目领域之需要。HDF 可以表示出科学数据存储和分布的许多必要条件。其有以下一些特征:HDF文件是安装树状结构组织起来的。原创 2024-06-17 14:57:36 · 1107 阅读 · 0 评论 -
python数组计算:不适合在内存计算的情况
在【python金融大数据分析】书的177页,提到“不适合于内存的基于数组的计算”。-------我理解这句话的意思是:数组计算如果数据量很大,可能不适合在内存计算。如果数据量不大,那应该可以在内存中计算。是否理解正确,可后续验证。原创 2024-06-17 11:19:10 · 151 阅读 · 0 评论 -
HDF5 数据库及 h5p
HDF5 拥有一系列的优异特性,使其特别适合进行大量科学数据的存储和操作,如它支持非常多的数据类型,灵活,通用,跨平台,可扩展,高效的 I/O 性能,支持几乎无限量(高达 EB)的单文件存储等,详见其官方介绍:https://support.hdfgroup.org/HDF5/。用 h5py 操作 HDF5 文件,我们可以像使用目录一样使用 group,像使用 numpy 数组一样使用 dataset,像使用字典一样使用属性,非常方便和易用。HDF5 数据库,又称HDF5文件。我们只介绍 h5py。原创 2024-06-17 11:13:49 · 471 阅读 · 0 评论 -
python的tables.flush()函数
flush()方法通常和close()方法一起使用,即在最后调用close()方法之前,先调用flush()方法,以确保所有的数据都被写入到文件中。原创 2024-06-14 17:10:29 · 180 阅读 · 0 评论 -
python的tables.row
原创 2024-06-14 17:03:57 · 138 阅读 · 0 评论 -
python的np.range()函数
其中,start表示序列起始值(默认为0),stop表示序列终止值,不包括该值,即生成的序列中最大值为stop-1,step表示序列步长(默认为1)。在上述代码中,我们调用range()函数生成一个包含0~4的整数序列,并将其转换为列表类型,最后打印输出该列表。在每次循环中,将序列的当前元素赋值给变量i,并将其打印输出。其中,start是指定的起始值,stop是指定的停止值(不包含在序列中),step是指定的步长。这段代码将生成一个列表:[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]。原创 2024-06-14 16:06:47 · 620 阅读 · 0 评论 -
python的__name__属性
一个模块被另一个程序第一次引入时,其主程序将运行。如果我们想在模块被引入时,模块中的某一程序块不执行,我们可以用__name__属性来使该程序块仅在该模块自身运行时执行。每个模块都有一个__name__属性,当其值是'__main__'时,表明该模块自身在运行,否则是被引入。底下是双下划线, _ _ 是这样去掉中间的那个空格。print('程序自身在运行')print('我来自另一模块')原创 2024-06-14 15:31:52 · 313 阅读 · 0 评论 -
python的pd.read_excel()函数
如果Excel文件的表头不在第一行,可以通过header参数指定表头所在的行号。通过这个函数,我们可以轻松地将Excel表格中的数据加载到pandas的DataFrame对象中,进而进行各种数据分析和操作。使用read_excel()函数读取Excel文件时,需要指定文件的路径和名称。如果Excel文件中有多个工作表,可以通过sheet_name参数指定要读取的工作表。如果Excel文件没有表头,可以将header参数设置为None,并在读取后手动设置列名。这两个参数可以组合使用,以实现更灵活的数据读取。原创 2024-06-14 14:22:22 · 3567 阅读 · 0 评论 -
python的.hist()函数
plt.hist函数用于绘制直方图。直方图是一种用来表示数据分布的图形,它将数据分成若干个区间,然后统计每个区间中数据的数量,最终以柱状图的形式展示出来。直方图主要用于可视化数据的分布情况。它将数据划分为一系列的区间(也称为箱子或柱子),然后计算每个区间内数据点的数量。这些数量通常用柱状图表示,柱子的高度表示该区间内数据点的数量。原创 2024-06-14 14:11:07 · 576 阅读 · 0 评论 -
python的pandas.to_csv()函数
默认情况下,CSV 文件中的列顺序与 DataFrame 中的列顺序相同。但是,有时我们可能希望按照特定的顺序导出列。这时,我们可以使用 DataFrame 的reindex()方法来重新排序列。1234# 假设我们想要按照 'Name', 'Age', 'City' 的顺序导出列通过本文的介绍,我们了解了如何将 Pandas 的运行结果导出为 CSV 文件,并探讨了处理大数据集、自定义列顺序、处理日期和时间、压缩 CSV 文件等方面的进阶技巧和注意事项。原创 2024-06-14 11:18:43 · 3112 阅读 · 0 评论 -
python的pandas.read_csv()函数
read_csv()函数是Pandas库中一个非常重要的函数,它为我们提供了一个方便、高效的方式来读取CSV文件。通过掌握read_csv()函数的基本用法和参数,我们可以轻松地处理各种CSV文件,并进行数据分析和处理。原创 2024-06-14 10:46:47 · 2209 阅读 · 0 评论 -
python的pandas.read_sql()函数
read_sql是Pandas提供的用于从数据库读取数据的方法。它允许我们执行SQL查询并将结果直接转换为DataFrame。版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。原文链接:https://blog.youkuaiyun.com/weixin_52908342/article/details/136119146。params:SQL查询中的参数,可以使用字典形式提供。parse_dates:指定需要解析为日期时间的列。sql:SQL查询语句,必须提供。原创 2024-06-14 10:13:43 · 726 阅读 · 0 评论 -
python的a[:2]、a[:] 和a [::] 的区别
## :表示索引 0至1行;原创 2024-06-13 17:21:45 · 1520 阅读 · 0 评论 -
python的np.array()函数
{'quicksort', 'mergesort', 'heapsort', 'stable'}(2)np.random.randint(4, 9, size=(3, 5)) 生成一个三行五列的正数矩阵。data={'小写':['a','b','c'],'大写':['A','B','C']}#输出: [1 4 5] (获取数组中(0,0),(1,1)和(2,0)位置处的元素)(start:起始数字 end:结束 Num:要生成的样本数)out:用于存储输出的数组。原创 2024-06-13 17:27:44 · 4037 阅读 · 0 评论