
数据科学
文章平均质量分 71
以python为主要工具,记录工作学习中的数据科学
Rocky_96
这个作者很懒,什么都没留下…
展开
-
数据分析与展示-Pandas入门
数据分析与展示-Pandas入门1 Pandas引入2 Series类型Series类型创建索引和切片in.get()对齐元素修改3 DataFrame类型DataFrame类型创建4 Pandas数据操作重新索引索引类型删除特定列5 Pandas数据运算算数运算比较运算1 Pandas引入Pandas是Python第三方库,提供高性能易用数据类型和分析工具。Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用。pandas的导入:import pandas as pdP原创 2021-12-29 17:02:03 · 970 阅读 · 0 评论 -
Python数据分析与展示-Matplotlib绘图函数
Python数据分析与展示-Matplotlib绘图函数Pyplot基础图表函数饼图直方图极坐标图散点图Pyplot基础图表函数函数含义plt.plot(x,y,fmt,…)绘制坐标图plt.boxplot(data,notch,position)绘制箱形图plt.bar(left,height,width,bottom)绘制条形图plt.barh(width,bottom,left,height)绘制横向条形图plt.polar(theta, r)原创 2021-12-28 16:51:43 · 367 阅读 · 0 评论 -
Python数据分析与展示-Matplotlib入门
Python数据分析与展示-Matplotlib入门介绍plot函数中文显示文本显示绘图区域介绍Matplotlib库是Python优秀的数据可视化第三方库,它由各种可视化类构成,内部结构复杂,这个库的开发受Matlab启发较多。matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。导入方法:import matplotlib.pyplot as pltplt.savefig()将输出图形存储为文件,默认PNG格式,可以通过dpi修改输出质量plot函数plt.原创 2021-12-27 17:06:25 · 589 阅读 · 0 评论 -
Python数据分析与展示-图像的手绘效果
Python数据分析与展示-图像的手绘效果图像数组表示和PIL库图像的变换图像手绘效果实例梯度重构梯度归一化光源效果图像数组表示和PIL库图像一般使用RGB色彩模式,即每个像素点的颜色由红®、绿(G)、蓝(B)组成,RGB三个颜色通道的变化和叠加得到各种颜色,其中R、G、B的取值范围都是0‐255,RGB形成的颜色包括了人类视力所能感知的所有颜色。图像是一个由像素组成的二维矩阵,每个元素是一个RGB值,或者说图像是一个三维数组,维度分别是高度、宽度和像素RGB值。PIL库是一个具有强大图像处理能力的原创 2021-12-27 16:16:28 · 1686 阅读 · 0 评论 -
Python数据分析与展示-数据存取与函数
Python数据分析与展示-数据存取与函数数据CSV文件存取多维数据的存取Numpy随机函数Numpy统计函数Numpy梯度函数数据CSV文件存取CSV是一种用来存储批量数据的常见文件格式,全称为Comma-Seprated Value,逗号分隔值。CSV的局限在于只能有效存储一维和二维数组。numpy中存取CSV的操作包括np.savetxt()和np.loadtxt()方法np.savetxt(frame,array,fmt,delimiter)frame表示文件、原创 2021-12-24 13:49:48 · 599 阅读 · 0 评论 -
Python语言程序设计-文本词频统计II+jieba库
Python语言程序设计-文本词频统计II+jieba库需求:统计三国演义文本中人物出现的次数方案:Jieba库+python首先获取threeKingdoms.txt,链接在https://python123.io/resources/pye/threekingdoms.txt程序:import jiebatxt = open("threeKingdoms.txt", "r", encoding="utf-8").read()words = jieba.lcut(txt)counts =原创 2021-12-24 10:50:30 · 659 阅读 · 0 评论 -
Python语言程序设计-文本词频统计I
Python语言程序设计-文本词频统计I问题分析hamlet.txt实现问题分析需求:一篇文章,出现了哪些词?哪些词出现得最多?以英文文本:Hamet.txt为例分析词频hamlet.txt见https://python123.io/resources/pye/hamlet.txt实现#导入文本对文本进行预处理def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in原创 2021-12-23 16:56:25 · 892 阅读 · 0 评论 -
Python数据分析与展示-Numpy入门
Python数据分析与展示-Numpy入门数据维度Numpy数组对象NumPy的引用ndarray对象的属性ndarray数组的元素类型ndarray数组的创建Python中的列表、元组等类型创建ndarray数组使用NumPy中函数创建ndarray数组从字节流(raw bytes)中创建从文件中读取特定格式创建ndarray数组的变换维度变换元素类型变换向数组转换ndarray数组的索引和切片一维数组索引和切片多维数组索引和切片ndarray数组的运算数组与标量运算一元函数二元函数数据维度维度是一组原创 2021-12-23 09:34:15 · 266 阅读 · 0 评论 -
Python数据展示之雷达图
Python数据展示之雷达图简单实例需求:雷达图方式验证霍兰德人格分析输入:各职业人群结合兴趣的调研数据输出:雷达图使用库:matplotlib+numpy代码import numpy as npimport matplotlib.pyplot as pltimport matplotlibmatplotlib.rcParams['font.family'] = 'SimHei'radar_labels = np.array(['研究型', '艺术型', '社会型', '企业型',原创 2021-12-16 16:39:22 · 1044 阅读 · 0 评论 -
Python中WordCloud库及其应用
Python中WordCloud库及其应用使用方法:步骤1:对象参数配置步骤2:加载词云文本步骤3:输出词云文件使用示例词云通过以词语为基本单位,更加直观和艺术地展示文本。wordcloud是优秀的词云展示的python第三方库。前提是完成wordcloud库的安装:(cmd命令行) pip install wordcloud。然后在程序中加载wordcloud库。使用方法:步骤1:配置对象参数步骤2:加载词云文本步骤3:输出词云文件步骤1:对象参数配置w = wordcloud.Wor原创 2021-12-16 09:43:35 · 11136 阅读 · 0 评论 -
Coursera学科分类爬虫实例介绍
Coursera学科分类爬虫实例介绍背景功能描述定向爬虫可行性程序的结构设计实例编写实例优化附加说明背景Coursera、edX、Udacity是国外三大MOOC平台,在中国用户最多的应该是Coursera。不同平台对于学科的分类有所区别,本文仅对如何爬取Coursera中学科的分类做简要说明。功能描述目标:获取Coursera搜索页面中的学科分类,并将结果输出并保存输入:Coursera平台搜索页面的URL链接,https://www.coursera.org/browse输出:平台中的学科分原创 2021-12-13 15:19:42 · 901 阅读 · 0 评论