嘻嘻哈哈xdm-优快云博客

原创 pandas中的数据筛选和分群方式

lambda：叫做匿名函数，可以用来快递定义函数apply：参数Series.apply(func, convert_dtype=True, args=(), **kwargs)，其中func也可以匿名函数。当一个函数的参数存在于一个元组或者一个字典中时，用来间接的调用这个函数，并将元组或者字典中的参数按照顺序传递给参数。

2025-04-03 21:55:00 145

原创 python中的函数：apply、map、reduce、lambda函数

它不需要像普通函数那样有一个明确的函数名（当然，你可以将lambda函数赋值给一个变量，然后通过这个变量来调用它，但本质上它不需要函数名来定义），适用适用于简单的、一次性的计算或操作；定义：利用字典或者函数去对特定数据做映射，它主要用于对Series对象的值进行操作，它将传入的函数或字典应用于Series中的每个元素上，并返回一个新的Series。定义：计算原理是将头两个元素传入函数计算，再把结果和第3个元素传入函数计算，再把结果和第4个元素计传入计算，依次类推计算，直到把最后一个计算完成，返回结果。

2025-04-03 21:48:13 226

原创 pandas的联结函数：merge、concat、join

【代码】pandas的联结函数：merge、concat、join。

2025-04-03 21:37:46 97

原创 pandas中的数据类型转换

pandas中的主要数据类型主要有object、int64、float64、datetime64、bool。

2025-04-03 21:33:45 67

原创 pandas中数据查看和清洗

【代码】pandas中数据查看和清洗。

2025-04-03 21:31:49 125

原创机器学习-随机森林

在随机森林中是控制一片森林的生成，森林中每个树都是不一样的，这是用“实际上，标签和特征是可以相互转换的，比如说，在一个“用地区，环境，附近学校数量”预测“房价”的问题中，我们既可以用“地区”，“环境”，“附近学校数量”的数据来预测“房价”，也可以反过来，用“环境”，“附近学校数量”和“房价”来预测“地区”。整数，可以不写，但是老版中默认是10，0.22默认是100，随机森林中树模型的数量即基评估器的数量，这个参数对随机森林的模型的精确性的影响是单调的，往往n_estimators越大，模型的效果往往越好。

2025-04-03 20:52:58 500

原创关联规则分析

关联分析是一种无监督机器学习方法，是用来分析大规模数据集中事务之间的依存性和关联性，挖掘数据集中有价值的关系，有力于对相关的事务进行预测，帮助我们进行合理的决策，在关联分析中最为典型的例子就是购物篮分析，通过发现顾客放入购物篮的不同商品之间的关系，来分析出顾客的购买习惯，通过分析哪些商品是被顾客频繁购买，来帮助零售商等制定合理的营销策略，另外关联分析还用于餐饮企业的菜品搭配、搜索引擎内容的推荐、新闻流行趋势的分析等等。：每条交易都可看作成一个事务：指的某个商品组合出现的次数和总次数之间的比例，以百分比表示。

2025-04-03 20:41:42 476

原创 python之分类写入sheet

【代码】python之分类写入sheet。

2025-04-03 20:36:09 130

原创 python中的openxlsx

是个基于excel操作,有三个不同层次的类:Workbook是对工作簿的抽象,Worksheet是对表格的抽象,Cell是对单元格的抽象，每个类都有自身的属性和方法。它可以读取、写入和修改Excel文件，并且支持Excel文件中的样式、图表等元素。

2025-04-03 20:34:28 246

原创 pandas中的排序函数sort_index、sort_values、rank

主要介绍三种的排序函数：sort_index()，sort_values()，rank(）

2025-04-03 20:28:52 85

原创 pandas中的数据类型设置

定义：是python中的格式化字符串的函数 str.format()，它增强了字符串格式化的功能。基本语法是通过 {} 和 : 来代替以前的 %。format 函数可以接受不限个参数，位置可以不按顺序。Pandas提供了DataFrame.style属性，它会返回Styler对象，用以数据样式的美化。

2025-04-03 20:07:09 165

原创 python中的元组、列表、集合、字典

【代码】python中的元组、列表、集合、字典。

2025-04-03 20:01:51 208

原创 python中的str.join()、os.path.join()函数

os 模块是 Python 标准库中的一个重要模块，提供了与操作系统进行交互的功能。它包含了大量用于处理文件和目录、进程管理、环境变量、文件系统权限等各种与操作系统相关的操作的函数和方法。#获取当前路径import osprint(f"当前工作目录: {current_directory}")#修改路径print(f"已更改工作目录: {os.getcwd()}")#查看当前目录import osprint(f"{directory}目录内容:")

2025-04-03 19:53:03 189

原创 python中的DataFrame

在 Python 中，DataFrame是 pandas 库中的核心数据结构之一，它是一种二维的表格型数据结构，类似于电子表格或 SQL 表。DataFrame 由行索引（index）和列索引（columns）组成，可以方便地进行数据的选择、过滤、排序、聚合等操作。df= DataFrame() #创建DataFrame对象df.info()#查看基本信息df.head() #查看前几行的数据,默认前5行df.tail() #查看后几行的数据,默认后5行df.index #查看索引。

2025-04-03 19:41:03 176

weixin_46185521的博客