- 博客(31)
- 资源 (1)
- 收藏
- 关注
原创 如何避开DLL load failed,安装pywin32
啥?成功安装pywin32还是会报DLL load failed,点解啊???我是这样子解决的~~~~这也不知道适不适用除了我之外的帅哥靓女~~~总之,遇到这问题就放手试试吧~~~反正你也没有别的办法~~~1. conda env list2. conda activate tensorflow_env (选择当前使用的conda环境)3. conda install pywin32 (用conda安装pywin32)...
2021-12-29 14:57:38
239
原创 Python---数据清洗
首先导入数据,并读取前5行然后处理店铺数据,清洗comment字段:先筛选出有‘条’字的评论,再用spilt分割数据,提取评论条数后转换数据类型,用的是astype转换,并查看前5行清洗其他字段也是一样的处理,比如清洗人均价格这个字段,这里是从¥开始分割,因为有‘人均’这俩字的不一定附带着价格,但是有‘¥’的就一定带有价格且人均价格的数字在最后一个位置,所以是提取[-1]这个位置上...
2020-11-08 15:13:16
521
原创 python数据分析练习(一)
问题1、将每种车Price和volume的信息合并到一起(按时间和车名)下面是问题2、问题3的链接:python破某公司数据分析笔试题(二):https://blog.youkuaiyun.com/dafeidouzi/article/details/100168745python破某公司数据分析笔试题(三):https://blog.youkuaiyun.com/dafeidouzi/article/det...
2020-11-08 15:12:59
2652
原创 python数据分析练习(三)
问题3、分析数据(比如:优点,缺点,规律等,按你自己的理解)继前两篇博文后的数据可视化分析python破某公司数据分析笔试题(一):https://blog.youkuaiyun.com/dafeidouzi/article/details/100168562python破某公司数据分析笔试题(二):https://blog.youkuaiyun.com/dafeidouzi/article/details/...
2020-11-08 15:12:42
1355
2
原创 Python数据处理案例
关于数据处理案例有两个,第一个案例是我整理到有道云上的,就直接剪切下来了,下面直接进入正题~案例1:快餐数据案例2:欧洲杯数据先进行数据探索data.info()data.describe()查看数据集是否有缺失值且哪个字段存在缺失值?可以用下面的代码,也可以用前面案例1缺失值那里提到的前两种方法for i in range(d...
2020-11-08 15:12:02
5428
原创 python数据分析练习(二)
问题2、计算每种车的年销量和平均价(hatchback and sedan 是同一种车的不同车厢类别,如Ford Focus Sedan和Ford Focus Hatchback都属于是Ford Focus,同时Focus是Ford旗下的一个车型)问题1、问题3链接:python破某公司数据分析笔试题(一):https://blog.youkuaiyun.com/dafeidouzi/artic...
2020-11-08 15:11:37
1803
2
原创 mysql数据库笔记
pdf格式的mysql笔记已经上传到我的资源那里了,大家按需下载,不需要积分兑换,因为笔记我是整理到有道云的,直接粘贴上传的话,图片没办法上传,代码块格式也会变,所以下面mysql笔记的大部分内容是我直接剪切贴上来的,不太好看,我还没贴完所有的笔记,所以有需要的话就自己去下载吧~这些都是刷网课一点点记下来的,如果哪里写错,望指正...
2020-10-11 23:02:25
140
原创 unique&nunique&value_counts
> 查看数据库SHOW databases;> 使用数据库USE database_name;> 创建数据库CREATE database database_name;> 删除数据库DROP database database_name;> 创建表CREATEtable table_name (column_name column...
2020-10-11 23:01:50
1434
原创 apply函数的使用
函数定义:df.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)函数理解:>>> apply函数中可以使用自定义的函数(func);对于func中传递的参数,如果axis=0则应用于每一列上,如果axis=1则应用于每一行上的参数;func 自定义函数,函数应用在每一列或是每一行上 axis:{0 or 'index' , 1 or 'columns'},de
2020-10-11 23:01:34
8941
1
原创 处理重复数据
我们获取的数据往往会存在一些重复数据,重复数据会对统计结果产生影响,也会误导决策人员的决策。 那么对DataFrame的重复项判断及删除重复项是对数据整理的基本要求。 判断数据是否有重复项 df.duplicated() df.duplicated(self,subset=None,keep='first') 可通过 drop_duplicates() 移除重复项 df.drop_duplicates(subset=['A','B'],keep='fir...
2020-10-11 23:01:05
1016
原创 当OneHotEncoder遇上字符串类型的类别变量 ValueError:could not convert string to float
在对字符型的类别变量进行OneHotEncoder独热编码的时候,不懂大家有没有遇到过下面的问题使用pandas中的get_dummies是可以编码的但是用sklearn中的OneHotEncoder的时候,问题来了会出现ValueError:could not convert string to float : 'white' 这个错误提示一开始看到有些博文上说是因...
2020-04-10 10:49:10
1282
原创 解决python读取csv文件中文乱码问题有妙招
刚才导入数据的时候出现了点问题,没错就是中文乱码然后我往里加了uncoding='utf-8'乱码的问题倒是解决了,但是新的问题来了--->列名及某些列没显示完全我试着将utf-8依次换成gbk、gb2312,还是没用后面尝试了很多博主的方法我认为解决中文乱码问题最好的方法就是用uncoding='utf-8-sig'...
2020-04-07 14:52:43
3019
原创 python数据分析知识点汇总(一)
一、缺失值1.缺失值的产生 ?有以下3种情况 (1)有些信息暂时无法获取 (2)有些信息被遗漏 (3)有些信息被错误处理2、缺失值的处理方法有哪些?主要有以下3种 (1)数据补齐 (2)删除对应缺失行 (3)不处理3、缺失值处理,删除对应缺失行用的是dropna()函数dropna函数作用:去除数据结构中值为空的数据 d...
2019-09-14 22:34:32
1325
1
原创 pandas基础知识详解
pandas基础首先导入库,别名pandas有两种数据结构: Series 和 DataFrame那么怎么生成一个序列?要生成一个序列,使用的是pd.Series。记得Series首字母大写,如果要生成缺失值,可以用np.nan生成NaN值也可以生成一组日期数据,用的是pd.date_range(),periods表示要生成日期的个数那么如何生成一个DataFram...
2019-09-04 17:17:13
1399
原创 numpy基础知识详解
这是我听了两门公开课后整理出来的~~~numpy的特点:高级的数值编程工具 强大的N维数组对象:ndarray 对数组结构数据进行运算(不用遍历循环) 随机数、线性代数、傅里叶变换功能现在有一组列表数据,我要计算列表中a的均值,首先将列表转换成数据框data=[{'a':10,'b':4}, {'a':20,'b':3}, {'a':30,'b':2}...
2019-09-04 09:33:04
2294
原创 python绘制对比分析图(柱状图、折线图)
所谓对比分析就是两个相互联系的指标进行比较下面用例子说明,首先导入库,别名因为我用的是jupyter notebook,后面需要用matplotlib画图,所以要加上%matplotlib inlineimport pandas as pdimport nummpy as npimport matplotlib.pyplot as pltfrom IPython.display...
2019-09-01 09:55:27
17208
1
原创 优快云待审核问题
今早写了一篇博客文章,发布出去后刷新自己的博客,然后发现没能刷出来,后面在管理博客这块看到我写的博客文章是处于待审核的状态,我以为我掉进了黑名单,我就去网上查了一下,感觉别人博客文章里提到的待审核问题我都没有啊~敏感词木有~链接?截图倒是有几张~ 所以到底是什么问题?然后我机智的...
2019-08-31 09:22:11
891
1
原创 如何解决jupyter notebook导入tushare失败的问题
今天采集数据的时候刚好要用到tushare,但是在jupyter notebook中一直导入不成功~后面解决了~~方法如下:先打开Anaconda Powershell Prompt 然后在命令行先安装lxml,安装成功后,接着安装tushare 安装成功后,刷新一下jupyter notebook 重新import tushare as ts 静候~见证奇迹的时刻到啦啦啦!是...
2019-08-31 08:20:20
5653
7
原创 python爬虫模板(个人总结)
在采集了那么多次数据之后,我感觉爬虫是有一个特定框架的所以我用昨天爬上海旅游景点的爬虫框架爬取了漫威电影---复仇者联盟4:终局之战的短评去验证我的猜测网址奉上:https://movie.douban.com/subject/26100958/comments?start=20&limit=20&sort=new_score&status=P注意网址中每次翻页...
2019-08-23 15:49:32
5825
1
原创 python爬取上海旅游景点(详细)
今天爬取的是去哪儿网上的上海旅游景点,我们要爬取的是景点的经纬度、景点名称、点评数、星级、攻略提到的次数爬取出来的数据如下(我只截取了前10条数据):爬取的网址是:https://travel.qunar.com/p-cs299878-shanghai-jingdian首先是导入工具库用途:用requests对网址发出请求后,用BeautifulSoup解析网址 ...
2019-08-22 16:51:20
4365
6
原创 Python图像转换+手绘图像
学累了,咱就玩点有意思的,今天来玩玩图像转换以及用代码实现图像手绘效果我喜欢古天乐啊哈哈,这里选用的是古天乐的海报,下面呈上原图确认过眼神,是我喜欢的人现在开始进入正题,首先是加载本文所需的工具库 ,这里我们需要用到的是Image和numpy我们要明白的是图像转换主要是干嘛?图像的变换其实就是读入图像后,获得像素RGB值,修改后保存为新的文件那么我们就先读入图片,然后再...
2019-08-20 17:33:19
1004
原创 python---索引问题(数据的筛选)
这里用的还是店铺数据首先要清楚以下几个知识点1、列索引df[列名]---单列筛选 df[[列名1,列名2]]---多列筛选2、行索引根据数据的位置去索引 .iloc[] 根据数据的标签去索引 .loc[] 根据一个判断条件 df[判断条件]清楚以上几个操作之后呢,现在开始实操一下首先导入数据单行索引:如果我要查看price字段的内容,那就用df['price...
2019-08-19 09:45:57
3993
原创 python爬取杭州美食
首先进入杭州美食网页:https://travel.qunar.com/p-cs300195-hangzhou-meishi,界面如下:然后在要爬取的第一样菜品那里,鼠标右键--->点击检查元素,查看网页的代码结构点击检查按钮之后会呈现出下面的代码框架:好的,我们现在开始动手爬吧~先导入工具库,我用的是jupyter notebook导入成功后,获取网页以及设...
2019-08-15 15:09:36
882
原创 python---爬取豆瓣漫画书
首先是访问网址:使用requests去访问这里爬取的是豆瓣网上的漫画书接着解析网址:使用BeautifulSoup然后在所要爬取的网页中,右键--->检查,就可以查看网页的代码结构由上面的代码结构可以看出,漫画书的所有信息都包含在id为content的div标签中这里利用soup.find()就可以查看整个网页的信息如果要得到h1的标签那就在soup....
2019-08-14 10:49:49
213
原创 python sklearn---模型选择
这节内容很详细齐全,跟着里面的思路走,差不多就能把sklearn的用法以及建模的套路弄懂。一边学习一边理解一边操作一起开始sklearn的学习吧~sklearn介绍scikit-learn是数据挖掘与分析的简单而有效的工具。依赖于NumPy, SciPy和matplotlib。首先要知道的是sklearn中包含的主要功能有什么?classification 分类 Regre...
2019-08-11 17:04:03
1393
原创 python中的可视化---matplotlib
matplotlib是python的2D绘图库,以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形通过以下例子来说明其用法:读取csv数据画折线图,则:还是上面的数据,这里用来绘制饼图:...
2019-08-10 17:02:45
176
原创 python中的优先级(not、and、or),终终终于明了
今晚做题的时候,看到一道关于优先级的题目,我顿时蒙了???为什么 0 and 1 返回的是0?为什么 3 and 4却返回的是4?天呐?这到底是为什么???不知道初学的小白是否也有着跟我一样的困惑?经过不停的翻阅资料,看大牛们的博客,我顿时明白了首先要知道优先级顺序:not>and>or其次要知道在Python中所有的空字符串都是假,非空字符串都是真,非零的数字都是...
2019-08-09 21:54:11
23610
9
原创 pandas的数据结构---DataFrame
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以试不同的值类型DataFrame既有行索引也有列索引,它可以被看作是由Series组成的字典DataFrame中的数组是以一个或多个二维块存放的最常用的一种建DataFrame的方法是直接传入一个由等长列表或Numpy数组组成的字典结果就是DataFrame会自动加上索引,且全部列会被有序排列,这里使用的是Jup...
2019-08-09 10:25:52
910
原创 pandas的数据结构---Series
pandas提供了一套名为dataframe的书结构,比较契合tonging分析中的表结构,并且提供了计算接口,可用numpy或者其他方式进行计算。 pandas经常和其他工具一起使用,比如数值计算工具NumPy和SciPy,分析库statsmodels和sklearn和数据可视化库matplotlib。pandas是基于numpy数组构建的,特别是基于数组的函数和不使用for循环的数据处理。p...
2019-08-09 09:33:42
269
原创 Python语法
Python基础1、变量使用变量前先赋值 变量名不能以数字开头,不能用关键字命名 大小写敏感,严格区分,比如handsome和Handsome虽然意思上都是帅气,但是在Python中表示的是完全不同的两个名字 一个等号(=)表示赋值,注意赋值时左边名字,右边值;两个等号(==)才是等于 你已经是个成熟的程序猿了,该学会取些专业点的名字啦,不要什么都取a,b,c...,最好取个能很好...
2019-08-07 11:36:47
432
原创 小学生都学Python了,我才开始
从今天开始,作为Python小白的我要开始写博客啦旨在记录我的学习进程并分享我的一些数据代码项目思路等和大家一起学习,互相探讨,共同进步,决不能输给小学生人生苦短,我用Python一入Python深似海,从此渣渣是路人站在巨人的肩膀上学Python,不断往上爬以求看得更远,希望有一天不用跳起来咱也能伸手够到梦想之前看老齐的Python入门书籍曾看到过一句话,我至今记得,这句...
2019-08-06 10:44:37
1094
很详细的mysql数据库笔记.pdf
2019-12-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人