
数据分析
文章平均质量分 79
ㄣ知冷煖★
优快云人工智能领域优质创作者、阿里云专家博主、腾讯云开发者内容共创官、腾讯云开发者社区2024年度创作之星、百林哲教育专家、全国3D建模大赛国奖获得者、省奖若干、Kaggle竞赛银牌若干、BPAA算法大赛模型鉴赏师、在职算法工程师,计算机硕士。
展开
-
【Python数据挖掘】自动售货机销售数据分析与应用【送书活动】
本案例将主要结合自动售货机的实际情况,对销售的历史数据进行处理,利用pyecharts库、Matplotlib库进行可视化分析,并对未来4周商品的销售额进行预测,从而为企业制定相应的自动售货机市场需求分析及销售建议提供参考依据。原创 2023-10-16 14:29:06 · 1007 阅读 · 26 评论 -
Python错误 TypeError: ‘NoneType‘ object is not subscriptable解决方案汇总
这个错误通常发生在你试图访问一个类型为'NoneType'的对象的元素或者属性时。在Python中,'NoneType'是一种特殊类型,表示值的缺失或空值。原创 2023-03-10 13:54:25 · 106904 阅读 · 0 评论 -
时间序列异常点检测算法(Smoothed z-score algorithm)
时间序列异常点处理!原创 2023-03-02 19:26:32 · 1931 阅读 · 0 评论 -
特征生成(特征创建)
数据决定了模型效果的上限,使用复杂模型只能逼近上限!原创 2022-08-22 14:13:47 · 1693 阅读 · 0 评论 -
BOX-COX变换介绍
通常情况下,我们拿到的数据并不是正态分布的,为了满足经典线性模型的正态性假设,常常需要使用1、指数变换2、对数转化3、倒数转换4、平方根后取倒数5、平方根后再取反正弦使其转换后的数据接近正态,Box-Cox变换可以使线性回归模型在满足线性、正态性、独立性以及方差齐性的同时,又不丢失信息。变换后有利于线性模型的拟合以及分析出特征的相关性。天又黑了,看起来要下雨的样子。...原创 2022-08-16 14:30:18 · 7031 阅读 · 0 评论 -
数据分析可视化常用图介绍以及相关代码实现(箱型图、Q-Q图、Kde图、线性回归图、热力图)
爱意随风起,风止意难平。原创 2022-08-16 10:43:43 · 5670 阅读 · 0 评论 -
如何使用Request方法发送Post请求、JSON文件介绍、Python中的JSON数据以及获取到的JSON数据的解析。
使用接口爬取数据用!参数介绍url必填,请求的网址data选填,字典,元组列表,字节或者要发送到URL的文件对象。json可选,发送到指定URL的JSON对象。files可选,要发送到URL的文件字典可选。用于启用/禁用重定向的布尔值。默认True(允许重定向)auth可选。用于启用某种HTTP身份验证的元组。默认Nonecert可选。指定证书文件或密钥的字符串或元组。默认Nonecookies可选。要发送到指定网址的Cookie字典。默认Noneheaders可选。............原创 2022-07-28 14:25:41 · 5708 阅读 · 0 评论 -
Python enumerate() 函数
0、语法介绍1、结合for循环:除了列表元素本身,并且列出索引输出:0 11 32 52、结合字典生成式:输出:{0: ‘key’, 1: ‘car’, 2: ‘bird’}3、使用list查看:输出:[(0, ‘key’), (1, ‘car’), (2, ‘bird’)]参考文章:Python enumerate() 函数.zzzzz...原创 2022-06-15 16:49:37 · 307 阅读 · 0 评论 -
爬虫基础项目从入门到实战
目录前言一、爬虫的基本流程1-1、准备工作1-2、获取数据1-3、解析内容1-4、保存数据二、从门到入局项目实战总结前言一、爬虫的基本流程本文章来源于b站视频:https://www.bilibili.com/video/BV12E411A7ZQ?p=16&spm_id_from=pageDriver.1-1、准备工作通过浏览器点击F12查看分析目标网页,查看网页源码。1-2、获取数据发起访问请求,请求包含额外的header等信息,如果服务器正常相应,则得到一个Respons原创 2022-05-19 20:45:09 · 1181 阅读 · 0 评论 -
追踪问题——用Python Logging模块更轻松地诊断错误
目录前言一、logging.basicConfig()二、日志等级三、输出格式参数format。总结前言日志的作用是可以保存程序运行的日志,以便在排查程序崩溃的具体原因来定位bug进行抢救。logging可以灵活帮助我们记录程序运行过程的一些信息。/font>一、logging.basicConfig()# define: 顾名思义,basciConfig是用来设置一些日志的的配置参数# 参数介绍:# filename: 指定保存日志的文件名# filemode: 指定打开文件的模原创 2022-04-18 20:43:06 · 1004 阅读 · 0 评论 -
非平衡数据的处理笔记
目录前言一、处理非平衡数据的各种方法1-1、欠采样(下采样)1-2、过采样1-3、人工合成1-4、调整权重(效果较好而且快捷)总结前言众所周知,非平衡数据会极大的影响模型的评判效果,并且会过拟合。所以我们在处理数据的时候,首先需要做的是处理非平衡数据,使得各类型数据均衡。一、处理非平衡数据的各种方法1-1、欠采样(下采样)# define:下采样,是对非平衡数据中样本较多的那一类进行采样,使其等于样本量较少的那一类# eg: Dataframe 列名为y的这一行,统计 0、1出现的频率原创 2022-03-03 16:50:58 · 1411 阅读 · 0 评论 -
SQL常用语句(陆续更新)
目录前言一、目录1、取出指定条数的sql语句总结前言这个一个平平无奇的sql笔记,持续更新,哪里不会查哪里!一、目录1、取出指定条数的sql语句# 取出180条数据SELECT * from res_comment_detail WHERE brand_name ~ '德克士' LIMIT 180参考文章:一文了解倒排表.总结...原创 2022-02-10 13:52:26 · 2226 阅读 · 0 评论 -
Pandas常用操作
目录前言一、Pandas简介1-1、Series(类似一维数组的对象,由values和index组成,及由数据和索引构成):1-2、DataFrame(是一个表格型的数据结构,索引既有行索引也有列索引):总结前言Pandas的两种数据结构(pandas是基于Numpy来进行构建的,让以Numpy为中心的应用变得更加的简单)一、Pandas简介1-1、Series(类似一维数组的对象,由values和index组成,及由数据和索引构成):1、切片:名字索引: loc[]数字索引: iloc原创 2022-01-17 17:06:10 · 962 阅读 · 0 评论 -
随机抽样方法——DataFrame.sample()
目录前言一、函数介绍二、函数使用总结前言在一些情况下,数据不太均衡,这时候我们需要对数据集进行随机的抽样,而Pandas库中自带了抽样的方法一、函数介绍# 参数介绍# n:要抽取的行数# frac:当我们需要抽取数据的百分比时,我们需要用到这个参数。# 注意:frac和n参数不可以同时使用。# replace: 是否允许重复抽样,默认情况下为False# weights:代表的是每个样本的权重。# random_state: 随机种子,给定一个具体的数字,保证每次抽样的数据都是相同原创 2022-01-13 14:53:03 · 5176 阅读 · 0 评论 -
scipy库中的sparse.csr_matrix函数介绍
目录前言一、csr_matrix函数总结前言csr_matrix函数主要是用来压缩稀疏矩阵。一、csr_matrix函数from scipy.sparse import csr_matriximport numpy as np# data:代表的是稀疏矩阵中存储的所有元素data = np.array([1,2,3,4,5,6])# indices: 代表的是这6个元素所在的列的位置indices = np.array([0,2,2,0,1,2])# indptr: 游标,每一行起始原创 2022-01-12 19:29:52 · 5352 阅读 · 0 评论 -
倒排表讲解
目录前言一、倒排表总结前言倒排表可以用来做过滤的相关操作。一、倒排表示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。总结提示:原创 2021-12-02 17:53:10 · 4296 阅读 · 0 评论