
python
文章平均质量分 64
云梦之上
在路上,于诸君共勉
展开
-
分类问题:对体测分数的类型进行预测 采用AdaBoostClassifier
文章目录对体测分数的类型进行预测应用背景1.导入数据原始数据2.对数据进行转化,将类别型数据用数值型数据进行替换。最终数据替换的对应关系如下转化后数据3.对于转化后的数据,需要对方差比较大的数据进行划分区间,然后进行值的映射4.进行模型的搭建5.得出预测的结果对体测分数的类型进行预测应用背景在体测的实际情况中,我们发现某些情况下由于系统错误或者学生操作不当会导致学生的分数出现缺失的情况,从而影响学生总体成绩的统计。因此我们利用学生的体侧成绩中的’性别’, ‘民族代码’, ‘学科门类’, ‘坐位体前屈等原创 2023-02-17 10:43:35 · 477 阅读 · 2 评论 -
python词频统计
python词频统计def wordcount(xlsx_path):输入参数为:xlsx格式的文件路径。最后的返回值为:包含元组的列表:如要转换为字典则:对返回结果进行强制转换即可:dic()xlsx文件如下停用词文件函数代码如下:# _*_ coding:utf-8 _*_# 作者:yunmen# 日期:2021年09月18日import pandas as pdimport jiebaimport numpy as npimport randomimport mat原创 2021-09-19 20:38:25 · 275 阅读 · 0 评论 -
2021泰迪杯B题数据处理4.1
文章目录涉及需要处理的数据文件任务 4 肥料产品的多维度对比分析数据样式最终需要处理的结果的样式数据处理总共分为3部分①获取氮磷钾的含量②获取氯含量③获取有机质含量④程序执行导出结果总结涉及需要处理的数据文件需要处理的文件:提取码zxcv任务 4 肥料产品的多维度对比分析任务 4.1 设计算法或处理流程,从附件 4 技术指标中提取出氮、磷、钾养分和有机质的百分比,以及肥料含氯的程度。请在报告中给出处理思路及过程,并将结果保存到文件“result4_1.xlsx”中。注 如果技术指标中只给出总养分原创 2022-05-15 22:50:49 · 1024 阅读 · 1 评论 -
基于python的LSB加密算法设计
文章目录任务1.首先明确操作的原理2.进行操作的思如如下2.1隐藏信息2.2读取隐藏信息3.遇到的问题补充的python函数内容主要是字符串、数字、中文间的转化:4.具体的操作代码的如下4.1读取图片数据4.2隐藏(数字数据),各函数的设计①隐藏数据函数②进行数据的隐藏,同时保存图片中隐藏的点的位置的数据。③定义读取隐藏信息的函数④读取隐藏信息4.4.加密前后的图像的对比4.3隐藏(中文数据),函数的设计①隐藏数据函数②进行数据的隐藏,同时保存图片中隐藏的点的位置的数据。③定义读取隐藏信息的函数④读取隐藏信原创 2021-12-03 21:20:28 · 4263 阅读 · 0 评论 -
python(中文、数字(2进制、10进制、16进制)、字符串)之间的转换
总结:要转换的数据类型总结有以下几种中文:‘中国’数字:2进制、10进制、16进制字符串:一般转化后都为字符串,所以实际要考虑的转换情况有如下几种:中文←→数字数字←→数字(不同进制之间)数字←→数字(不同进制之间)(10进制)数字→数字(其他进制)>>>format(16,'b')#将数字转化为2进制数表示'10000'>>>format(16,'d')#将数字转化为10进制数表示'16'>>>format(16,'x')#将原创 2021-11-27 14:53:06 · 2699 阅读 · 0 评论 -
“泰迪杯”数据分析职业技能大赛 B 题 新冠疫情数据分析
参考:python数据分析案例简单实战项目(二)–新冠疫情数据分析任务一:数据的基本处理任务 1.1根据附件 1“城市疫情”中的数据统计各城市自首次通报确诊病例后至 6 月 30 日的每日累计确诊人数、累计治愈人数和累计死亡人数,将结果保存为“task1_1.csv”,第一行为字段名,按城市、日期、累计确诊人数、累计治愈人数、累计死亡人数的次序分别放在 A 列~E 列。在论文中给出实现方法的相关描述,并列表给出武汉、深圳、保定每月 10、25 日的统计结果。# _*_ coding:utf-原创 2021-11-10 20:07:29 · 13798 阅读 · 10 评论 -
“泰迪杯”数据分析职业技能大赛 B 题 学生校园消费行为分析
任务 1 数据导入与预处理任务 1.1 将附件中的 data1.csv、data2.csv、data3.csv 三份文件加载到分析环境,对照附录一,理解字段含义。探查数据质量并进行缺失值和异常值等方面的必要处理。将处理结果保存为“task1_1_X.csv”(如果包含多张数据表,X 可从 1 开始往后编号),并在报告中描述处理过程。# _*_ coding:utf-8 _*_# 作者:yunmeng# 日期:2021年11月09日import pandas as pddf_1=pd.re原创 2021-11-10 20:01:54 · 13666 阅读 · 22 评论 -
python将时间格式进行转化(时间戳、结构化时间、字符串)
应用场景:如果说,一个用户的登录时间是:‘2021-10-28 17:23:11’ 这是一个字符串那么,如果他续费了30天的vip,则到期的时间是多少?所以,对于时间字符串的计算应该如何操作?相关内容:1:时间的类型分为以下三种:time包下的三个函数:产生3种时间类型:①:时间戳time.time()②:结构化时间time.localtime()③:特定结构的字符串时间time.strftime("%Y-%m-%d %H:%M:%S")#时间戳,用于计算>>>原创 2021-10-28 20:14:48 · 6821 阅读 · 0 评论 -
python各库的官方文档(涉及各函数、参数的使用)(pandas、numpy、sklearn)
在以下网站的搜索框搜索对应的函数即可。可采用翻译插件进行文本的翻译。SC翻译:一个翻译插件。pandas官方文档numpy官方文档sklearn原创 2021-10-27 15:31:27 · 1589 阅读 · 0 评论 -
DataFrame的apply()、applymap()、map()方法
DataFrame的apply()、applymap()、map()方法是对dataframe进行处理。总结:apply():对dataframe的所有列或者行,进行操作applymap():对dataframe的所有数据进行操作map():对dataframe的某一列数据进行操作①map()df.map函数是针对于dataframe中的某一列数据进行操作:测试dataframe:testdata={'Survived': [0, 1, 1, 1, 0], 'Pclass': [3, 1原创 2021-10-24 21:47:38 · 1335 阅读 · 0 评论 -
基于协同过滤算法的 课程推荐(采用皮尔逊相关系数) 。
解决问题:根据用户的选课情况,推荐相应的课程。对应的文件如下:相关文件:提取码:zxcv 协同过滤算法的基本步骤:1:收集用户偏好2:找到相似的用户或物品3:计算推荐1:收集用户偏好在这里,即用户对不同课程的选课情况,生成对应的0-1矩阵。# _*_ coding:utf-8 _*_# 作者:yunmen# 日期:2021年10月21日import pandas as pddata=pd.read_csv(r'C:\Users\yunmen\Desktop\study_inf原创 2021-10-23 20:33:14 · 1655 阅读 · 1 评论 -
python pandas 怎么判断一天是否为工作日+计算距离特定时间之间的天数
本文实现:①计算距离特定时间之间的天数。②时间是否为工作日。准备数据:数据采用的是一个平台的登录数据,包含登录的时间。任务的要求是:选取用户最近的登录时间,同时判断距2020,6,18的天数有多少天。同时需要区分是否为工作日登录。导入数据# 作者:yunmen# 日期:2021年10月20日#导入模块import pandas as pd#判断节假日函数from chinese_calendar import is_workday, is_holiday,is_in_lieuda原创 2021-10-20 20:57:38 · 2898 阅读 · 0 评论 -
python pysql连接数据库相关操作
1:首先看看是否能连接到数据库中注意连接时各参数的含义:pymysql.Connect()参数说明host(str): MySQL服务器地址port(int): MySQL服务器端口号user(str): 用户名passwd(str): 密码db(str): 数据库名称charset(str): 连接编码import pymysql# 连接数据库conn=pymysql.connect(host="localhost",user="原创 2021-08-30 09:17:41 · 700 阅读 · 0 评论