数据分析
文章平均质量分 79
数据分析案例
莫荒误
环保老人,会撸代码。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
波斯公主选驸马python代码及可视化
波斯公主选驸马python代码验证及可视化展示。原创 2021-04-08 11:21:22 · 348 阅读 · 0 评论 -
波斯公主选驸马
波斯公主选驸马。37%爱情法则。未婚妻问题。神奇的自然常数。原创 2021-03-27 22:56:03 · 650 阅读 · 0 评论 -
任他青山多变幻——OpenCV图像处理(截取、移动、旋转【旋转矩阵】、透视)
OpenCV图像处理。图像的二值化cv2.threshold()函数。图片转移c2.warpAffine()函数。图像旋转矩阵cv2.getRotationMatrix2D()函数。换个角度看问题——图片透视cv2.warpPerspective()函数。图像变换矩阵cv2.getPerspectiveTransform()函数。原创 2020-05-11 18:03:31 · 965 阅读 · 0 评论 -
照猫画虎——OpenCV绘图函数
OpenCV的python接口入门:绘图函数的使用:画直线cv2.line(),画圆cv2.circle(),画方形cv2.rectangle(),画椭圆 cv2.ellipse(),画多边形cv2.polylines(),写文字cv2.putText() 等。等待键盘输入cv2.waitKey()设定。cv2绘图函数参数shift为小数点位数。【渐变色是难点】原创 2020-05-09 22:54:21 · 804 阅读 · 0 评论 -
每一个合格的家庭主妇都是生产厂长的有力竞争者——ERP库存管理pandas代码示例(面试题)
ERP系统是一个以生产厂长为核心的信息系统。每一个合格的家庭主妇,都是生产厂长的有力竞争者。ERP库存管理pandas示例。原创 2020-04-24 19:23:04 · 1063 阅读 · 0 评论 -
深度学习API——Keras入门初体验
Keras是一个高级神经网络API。用户友好、高度模块化、可扩展性。同时支持卷积神经网络和循环神经网络,以及两者结合。在CPU和GPU上无缝运行。keras.models.Sequential();keras.losses.categorical_crossentropy();keras.utils.to_categorical();keras.layers.Activation():sigmoid函数、softmax函数、Relu函数原创 2020-04-18 16:32:59 · 734 阅读 · 0 评论 -
BAT面试题——海量整数,找出不重复整数
海量整数(数据),找出不重复;python字典结构;bool数组;迭代器。原创 2020-04-17 16:53:55 · 386 阅读 · 0 评论 -
距离产生美——机器学习常用距离numpy计算
机器学习各种距离用numpy计算;欧几里得距离;曼哈顿距离;切比雪夫距离;闵可夫斯基距离;余弦距离;范数。原创 2020-04-15 14:03:26 · 729 阅读 · 0 评论 -
我和月薪有个约定——功夫大侠pandas处理薪水数据
pandas处理五花八门的月薪数据。正则截取有用数字。原创 2020-04-15 08:46:23 · 2288 阅读 · 7 评论 -
“黑客”入门——爬虫scrapy初体验
scrapy爬虫框架入门scrapy shell模式scrapy crawl模式原创 2020-02-26 19:14:17 · 752 阅读 · 0 评论 -
回归路线图——线性回归五个基本假设及演示
线性回归五个基本假设。用jupyter notebook 演示线性回归。机器学习选择合适的学习系数非常关键。原创 2020-03-24 20:11:39 · 3026 阅读 · 0 评论 -
几种常用回归算法——线性回归、支持向量机回归和KNN回归
常用回归算法:线性回归不拟合非线性;支持向量机回归很好拟合非线性;KNN回归可以拟合非线性,周围样本平均值。原创 2020-04-03 18:05:37 · 6887 阅读 · 1 评论 -
天下没有白吃的午餐——机器学习算法选择(带图)
机器学习算法选择天下没有白吃的午餐,没有一个学习算法可以在任何领域总是产生最准确的学习器。概率近似正确,样本本身要可学习,当训练样本足够大时,“训练准确率”与“预测准确率”的差值,超出容忍误差范围的概率非常小。算法无优劣之分,仅适合特定的场景,不要过于迷信机器学习、深度学习和人工智能。回归、分类、聚类和降维。原创 2020-03-30 18:37:26 · 425 阅读 · 0 评论 -
坑群逃生——安装pycrypto-2.6.1和aliyunsdkcore==1.0.2
pycrypto-2.6.1安装aliyunsdkcore==1.0.2安装`inttypes.h(40): error C2143: syntax error: missing '{' before '__cdecl'`和`building ‘Crypto.Random.OSRNG.winrandom‘ extension`。原创 2020-03-19 18:58:13 · 978 阅读 · 0 评论 -
科技界也有统一诉求——机器学习基本函数求导过程推导(易懂)
机器学习线性回归损失函数和logistics回归损失函数求导结果均为【(预测值 - 实际值) × x】的期望形式统一。原创 2020-03-24 12:09:09 · 235 阅读 · 0 评论 -
生态化反——hadhoop生态圈
handoop生态handoop“动物园”原创 2020-03-19 19:17:06 · 1031 阅读 · 0 评论 -
包打天下——Docker入门体验
程序员项目流程Docker常用命令Docker基本组成:镜像,相当于python的类;容器,相当于实例化的对象。原创 2020-03-19 10:44:45 · 187 阅读 · 0 评论 -
深度学习——相关公式及优化
深度学习往往与大数据结合在一起。大部分传统的机器学习都可以用深度学习来拟合。梯度下降的优化:动量优化、自适应学习率优化器。原创 2020-03-12 20:23:47 · 654 阅读 · 0 评论 -
从中国象棋的角度,理解支持向量机SVM【不包懂,包记住】
从中国象棋的角度,理解支持向量机【印象深刻】。支持向量机SVM是最大边缘分类器!边缘的定义是决策边界与任意样本之间的最⼩距离!支持向量机的工作核心是:找分界平面,N-1维的超平面,最大化边缘,也就是最小距离最大化。公式推导。拉普拉斯算子。原创 2020-03-11 11:04:45 · 831 阅读 · 1 评论 -
20/80原则——主成分分析
主成分分析线性变换不改变实质,只改变表达。奇异值分解前20%的特征,就包含了95%的主要特征。原创 2020-03-09 21:00:24 · 526 阅读 · 0 评论 -
浓缩就是精华——21行python实现输入法自动提示(带过程举例,附录也精彩)
python简单粗暴地实现拼写检查,充分体现python的简洁、灵活。朴素贝叶斯思想有2个精华部分:(1)对单词中一个字符进行增、删、改、换操作:(2)概率思想,短路原则,正确的概率最高,输错一个(增、删、改、换)的概率次之,输错两个的概率更次。原创 2020-01-13 23:19:39 · 1040 阅读 · 0 评论 -
相亲旅游必备——决策树简单代码(numpy和sklearn)实现示例
决策树、信息增益id3算法原创 2020-01-09 22:13:43 · 1123 阅读 · 0 评论 -
三个臭皮匠——集成学习AdaBoost简单代码实现示例
AdaBoost简单代码实现示例集成学习:结合多个个体学习器(弱学习器)从而获得精确率很高的学习器(强学习器)。“三个臭皮匠抵过一个诸葛亮”,多个弱分类器(准确率大于50%)串起来(协作)能达到很好的准确度。转载 2020-01-09 21:28:25 · 939 阅读 · 1 评论 -
手写体识别——Knn算法和logistic算法
knn算法和logistic算法均能进行分类问题的监督式学习,knn算法精度略高,但运算较慢。原创 2020-01-06 20:25:53 · 2245 阅读 · 0 评论 -
“上帝”的价值——客户价值分析
航空公司客户价值分析:流程:业务系统(挖掘目标)——数据抽取 ——数据探索与预处理——建模与应用——结果与反馈。客户关系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数的均值C五个指标作为航空公司客户价值指标,LRFMC模型。找出高价值客户、重点挽留客户。原创 2020-01-03 11:54:31 · 504 阅读 · 0 评论 -
寻找Jack和Rose——泰坦尼克号(Titanic)获救数据分析
Titanic获救数据分析1.男女乘客获救率有无明显差异2.船上是否有明显贫富差异 3.有亲戚在船上是否对获救率有影响4.不同登船地点的男女分布情况 5.不同登船地点是否反应该地区的经济状况 6.不同年龄段的获救率 7.不同等级客舱的获救率 8.Jack和Rose是否在船上 9.使用线性回归预测年龄缺失值原创 2019-12-31 18:55:10 · 1407 阅读 · 0 评论 -
借问钱程何处有,牧童劝我学Python——2019python职位分析
用pandas对招聘网站近期python相关的招聘信息进行分析:1.统计不同学历的职位分布2.统计不同学历下薪资待遇3.统计python不同就业方向的分布(web,爬虫,数据分析,自动化测试,自动化运维,嵌入式,机器学习)4.不同信息来源的薪资情况5.不同城市的招聘规模6.不同城市招聘方向的分布,及相关方向的平均薪资7.不同方向需要的工作经验分布8.分析岗位要求内容,将出现最多的关键词提取出来原创 2019-12-28 18:07:32 · 1331 阅读 · 0 评论
分享