- 博客(14)
- 收藏
- 关注
原创 pandas中的数据筛选和分群方式
lambda:叫做匿名函数,可以用来快递定义函数apply:参数Series.apply(func, convert_dtype=True, args=(), **kwargs),其中func也可以匿名函数。当一个函数的参数存在于一个元组或者一个字典中时,用来间接的调用这个函数,并将元组或者字典中的参数按照顺序传递给参数。
2025-04-03 21:55:00
145
原创 python中的函数:apply、map、reduce、lambda函数
它不需要像普通函数那样有一个明确的函数名(当然,你可以将lambda函数赋值给一个变量,然后通过这个变量来调用它,但本质上它不需要函数名来定义),适用适用于简单的、一次性的计算或操作;定义:利用字典或者函数去对特定数据做映射,它主要用于对Series对象的值进行操作,它将传入的函数或字典应用于Series中的每个元素上,并返回一个新的Series。定义:计算原理是将头两个元素传入函数计算,再把结果和第3个元素传入函数计算,再把结果和第4个元素计传入计算,依次类推计算,直到把最后一个计算完成,返回结果。
2025-04-03 21:48:13
226
原创 机器学习-随机森林
在随机森林中是控制一片森林的生成,森林中每个树都是不一样的,这是用“实际上,标签和特征是可以相互转换的,比如说,在一个“用地区,环境,附近学校数量”预测“房价”的问题中,我们既可以用“地区”,“环境”,“附近学校数量”的数据来预测“房价”,也可以反过来,用“环境”,“附近学校数量”和“房价”来预测“地区”。整数,可以不写,但是老版中默认是10,0.22默认是100,随机森林中树模型的数量即基评估器的数量,这个参数对随机森林的模型的精确性的影响是单调的,往往n_estimators越大,模型的效果往往越好。
2025-04-03 20:52:58
500
原创 关联规则分析
关联分析是一种无监督机器学习方法,是用来分析大规模数据集中事务之间的依存性和关联性,挖掘数据集中有价值的关系,有力于对相关的事务进行预测,帮助我们进行合理的决策,在关联分析中最为典型的例子就是购物篮分析,通过发现顾客放入购物篮的不同商品之间的关系,来分析出顾客的购买习惯,通过分析哪些商品是被顾客频繁购买,来帮助零售商等制定合理的营销策略,另外关联分析还用于餐饮企业的菜品搭配、搜索引擎内容的推荐、新闻流行趋势的分析等等。:每条交易都可看作成一个事务:指的某个商品组合出现的次数和总次数之间的比例,以百分比表示。
2025-04-03 20:41:42
476
原创 python中的openxlsx
是个基于excel操作,有三个不同层次的类:Workbook是对工作簿的抽象,Worksheet是对表格的抽象,Cell是对单元格的抽象,每个类都有自身的属性和方法。它可以读取、写入和修改Excel文件,并且支持Excel文件中的样式、图表等元素。
2025-04-03 20:34:28
246
原创 pandas中的排序函数sort_index、sort_values、rank
主要介绍三种的排序函数:sort_index(),sort_values(),rank()
2025-04-03 20:28:52
85
原创 pandas中的数据类型设置
定义:是python中的格式化字符串的函数 str.format(),它增强了字符串格式化的功能。基本语法是通过 {} 和 : 来代替以前的 %。format 函数可以接受不限个参数,位置可以不按顺序。Pandas提供了DataFrame.style属性,它会返回Styler对象,用以数据样式的美化。
2025-04-03 20:07:09
165
原创 python中的str.join()、os.path.join()函数
os 模块是 Python 标准库中的一个重要模块,提供了与操作系统进行交互的功能。它包含了大量用于处理文件和目录、进程管理、环境变量、文件系统权限等各种与操作系统相关的操作的函数和方法。#获取当前路径import osprint(f"当前工作目录: {current_directory}")#修改路径print(f"已更改工作目录: {os.getcwd()}")#查看当前目录import osprint(f"{directory}目录内容:")
2025-04-03 19:53:03
189
原创 python中的DataFrame
在 Python 中,DataFrame是 pandas 库中的核心数据结构之一,它是一种二维的表格型数据结构,类似于电子表格或 SQL 表。DataFrame 由行索引(index)和列索引(columns)组成,可以方便地进行数据的选择、过滤、排序、聚合等操作。df= DataFrame() #创建DataFrame对象df.info()#查看基本信息df.head() #查看前几行的数据,默认前5行df.tail() #查看后几行的数据,默认后5行df.index #查看索引。
2025-04-03 19:41:03
176
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人