
Python科学计算基础
文章平均质量分 90
通过在jupyter notebook上进行练习并记录
胜天半月子
这个作者很懒,什么都没留下…
展开
-
Numpy中np.bincount的使用方法总结
文章目录一、遇到np.bincount二、详解np.bincount总结一、遇到np.bincount在阅读《Python机器学习基础教程》这本书的时候遇到了这行代码,让我遇到了np.bincountprint("Sample counts per class:{}".format({n: v for n, v in zip(cancer.target_names, np.bincount(cancer.target))}))代码解析cancer.targetcancer.tar原创 2021-11-11 16:48:01 · 9936 阅读 · 0 评论 -
问题--在matplotlib的散点图中如何给不同种类颜色的点加标签?
文章目录需求一、scatter图像显示散点含义二、附录需求在进行代码编写的时候,遇到使用散点图的问题,最后呈现出的结果只是不同颜色的点,但是无法一眼看去让人清楚这些点表示的不同含义。因此,通过给散点图中不同颜色的点加标签来表示这些点的含义(我实际的应用是用在机器学习中训练集和测试集的数据中).原始效果最终效果通过该图像中的点可以以下就明白蓝色的散点表示的是训练集的数据,红色的点表示的是测试集的数据一、scatter图像显示散点含义二、附录【matplotli原创 2021-11-02 17:07:01 · 4803 阅读 · 0 评论 -
项目实战--用户消费数据分析
文章目录引入包一、数据预处理二、按月对数据分析三、用户个体消费数据分析四、用户消费行为分析五、用户的生命周期引入包本项目所用数据为【密码:pfj6】:CDNOW_master.txtimport numpy as npimport pandas as pdfrom pandas import DataFrame,Seriesimport matplotlib.pyplot as plt# CDNOW_master.txt# 支持中文plt.rcParams['font.sans-s原创 2021-10-31 22:02:34 · 10022 阅读 · 15 评论 -
Pandas高级操作
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录引入包一、替换操作二、映射操作⭐小案例-计算税后薪资三、排序实现随机抽样四、数据的分裂处理五、高级数据聚合数据加载读取数据库数据六、透视表七、交叉表引入包import numpy as npimport pandas as pdfrom pandas import DataFrame一、替换操作替换操作可以同步作用于Series和DataFrame中单值替换普通替换:替换所有符合要求的原色:to_replac原创 2021-10-31 09:58:43 · 510 阅读 · 1 评论 -
人口分析案例
文章目录需求一、数据预处理二、数据处理总结需求源数据获取–密码:6qpt导入文件,查看原始数据将人口数据和各州简称数据进行合并将合并的数据中重复的abbreviation列进行删除查看存在缺失数据的列找到有哪些state/region使得state的值为NaN,进行去重操作为找到的这些state/region的state项补上正确的值,从而去除掉state 这一列的所有NaN合并各州面积数据areas我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行去除含有缺失数原创 2021-10-24 22:26:01 · 2110 阅读 · 8 评论 -
2012美国大选献金项目数据分析
文章目录需求一、数据预处理二、分析数据需求获取源数据–密码:hxqy读取文件usa_election.txt查看文件样式及基本信息指定数据截取,将如下字段的数据进行提取,其他数据舍去:cand_nm :候选人姓名contbr_nm :捐赠人姓名contbr_st :捐赠人所在州contbr_employer :捐赠人所在公司contbr_occupation :捐赠人职业contb_receipt_amt :捐赠金额contb_receipt_dt :捐赠日期使用np.u原创 2021-10-24 21:21:01 · 1279 阅读 · 0 评论 -
DataFrame案例--双均线策略
文章目录一、数据预处理二、计算该股票历史数据的5日均线和30日均线三、分析输出所有金叉日期和死叉日期四、数据分析一、数据预处理data = ts.get_k_data('000001',start='1900-01-01')# 平安银行datadata.to_csv('./pingan.csv')df = pd.read_csv('./pingan.csv')dfdf.drop(labels='Unnamed: 0',axis=1,inplace=True)dfdf['dat原创 2021-10-22 21:00:35 · 930 阅读 · 0 评论 -
DataFrame的级联与合并操作
文章目录一、级联操作1.1 匹配级联1.2 不匹配级联二、合并操作2.1 一对一合并2.2 一对多合并2.3 多对多合并2.4 key的规范化三、案例-股票分析1. 使用`tushare包`获取某股票的历史行情数据2. 输出该股票所有收盘比开盘上涨3%以上的日期3. 输出该股票所有开盘比前日收盘跌幅超过2%日期4. 假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何?1. 实现买入股票的操作代码2. 实现卖出股票的操作代码总结一、级原创 2021-10-22 19:11:11 · 2429 阅读 · 0 评论 -
Python数据分析处理--Pandas
文章目录前言一、pandas介绍1.1 Pandas基础1.2 Series序列1.3 Dataframe⭐1.4 DataFrame的Selecting和indexing1.5 Mapping和Replace二、Pandas运算、处理、排序操作2.1 简单运算2.2 排序2.3 merge(合并)操作2.4 Concat和Conbine操作三、3.1 apply数据预处理3.2 数据去重操作3.3 数据分箱技术3.4 数据分组Groupby技术总结前言Numpy是最基础的包,Pandas是在上面做的原创 2021-04-05 13:47:55 · 585 阅读 · 1 评论 -
Python数据可视化--Matplotlib
文章目录一、Matplotlib基础1.1 基本参数1.2 子图subplot2.读入数据三、动画和三维图形绘制四、高级绘图seaborn与案例分析总结一、Matplotlib基础1.1 基本参数1.2 子图subplot字体设置局部:参数font_size全局:plt.rcParams[‘font.size’] = 15# 二、常见图形绘制## 1.引入库代码如下(示例):import numpy as npimport pandas as pdimp原创 2021-04-01 21:23:48 · 988 阅读 · 0 评论 -
Python科学计算--Scipy
文章目录一、Scipy基础介绍1.1 常数包1.2 特殊函数包二、Scipy优化2.1 理论基础2.2 ⭐最小二乘法(leastsq)2.3 函数最小值(fmin)2.4 非线性方程组求解(fsolve)三、Scipy插值1.引入库2.读入数据总结一、Scipy基础介绍常用包1.1 常数包from scipy import constants as C1.2 特殊函数包四舍五入:scipy与numpy有些不同具体使用:help(special)查看更多使用方法二、原创 2021-03-14 16:47:41 · 891 阅读 · 0 评论 -
Python之图像处理OpenCV
文章目录前言一、图像基础1.1 理论介绍1.2 案例1-手写数字识别二、图像滤波与预处理三、图像变换1.引入库2.读入数据总结前言基础包 opencv-python高配版 opencv-contrib-python一、图像基础1.1 理论介绍使用了cv2.imread()即改变了存储格式:由 jpg:rgb—>opencv:bgr一张图像 处理:1.三维数组2.画过三维散点图3.图像的直方图:统计像素点的分布特征 灰度图三维的彩色图 ==》转为一维的灰度原创 2021-02-28 19:46:32 · 929 阅读 · 1 评论 -
Python科学计算--KNN算法
文章目录前言一、KNN分类算法1.1 引入数据**加粗样式**1.2 可视化二、KNN算法实现前言邻近算法,或者说K最近邻(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法一、KNN分类算法1.1 引入数据加粗样式iris.data所显示的数据是二维的前面两个数据是花萼的长和宽后面两个数据是花瓣的长和宽使原创 2021-02-13 22:01:38 · 402 阅读 · 1 评论 -
Python科学计算应用基础之Numpy
文章目录前言一、Numpy是什么?二、使用步骤1.引入库2.读入数据总结前言Python四种基本数据结构类型List,Tuple,Set,DictNumpy的数据结构类型Ndarry(多维数组)在介绍Numpy之前,先说一下Jupyter Notebook,这是一款数据分析玩家必用的工具,其风格跟我们以往用过的软件开发IDE有很大的不同。这里简单说一下,Data Science IDE和Code Develop IDE的有什么不同:安装jupyterpip ins原创 2021-02-09 21:33:48 · 384 阅读 · 0 评论