
数据分析
VeeLe
知乎:相对静止 https://www.zhihu.com/column/c_1102570753626591232
展开
-
python数据分析应用之机器学习库(汇总)
1.sklearn应用sklearn自带数据集训练(支持向量机分类)sklearn自带数据集训练(线性判别分析)待续2.TensorFlow应用待续原创 2017-09-14 13:47:56 · 561 阅读 · 0 评论 -
统计学原理之描述性统计——开篇
缘由:学习笔记的起始缘由:遇到了一个活跃的学习小组,学习内容又是一直想学而且想用好的领域。学习内容大纲如下:第一周学习内容——描述性统计知识点如下:数据集中趋势:中位数、均值、众数、极差、分位数算数平均数、加权平均数、几何平均数数据的离中趋势:数值型数据:方差、标准差、极差、平均差分类型数据:异众比率顺序型数据:四分位差相对离散程度:离散系数分布的形状:偏...原创 2019-07-25 16:17:54 · 1663 阅读 · 0 评论 -
使用python bokeh 进行作图,可交互(可以实时查看点对于的数据)
1.从数据度读取联通数据2.整理数据,格式、类型等3.按照折线图可视化最终输出结果:可交互图表,可实时查看对应的点的数据快速测试,模拟数据点# coding: utf-8import psycopg2import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib...原创 2019-05-15 18:19:05 · 2945 阅读 · 0 评论 -
pandas 数据处理从入门到入门教程(待续)
1.数据获取一切工作的开始。1.1数据初始化DataFrame:Numpy:1.2数据读取原创 2019-04-23 15:35:37 · 451 阅读 · 0 评论 -
Jupyter notebook 搭建和使用
转载自:Jupyter notebook 搭建和使用 Jupyter notebook 是什么?欢迎学习本课程——如何使用 Jupyter notebook。Jupyter notebook 是一种 Web 应用,能让用户将说明文本、数学方程、代码...转载 2018-05-06 18:56:31 · 3039 阅读 · 0 评论 -
D3.js从入门到“放弃”指南
转载自D3.js从入门到“放弃”指南 前言 近期略有点诸事不顺,趁略有闲余之时,玩起D3.js。之前实际项目中主要是用各种chart如hightchart、echarts等,这些图形库玩起来貌都是完美的,一切皆可配置,但几年前接触了D...转载 2018-04-08 10:04:32 · 430 阅读 · 0 评论 -
python数据分析复盘——爬虫相关库
Requests、BeautifulSoup、re、lxml、css selector 、scrapy1.Requests1.1 Requests的7个主要方法其中,request()方法是其它方法的基础方法,get()方法用的多一些,本人没在实际爬取中用过其它方法。requests.request() 构造一个请求,支撑以下各方法的基础方法requests.get(...原创 2017-09-11 16:09:15 · 1170 阅读 · 0 评论 -
数据分析系列目录
数据分析系列目录统计学元知识(从一到全部) python数据分析复盘——爬虫相关库Scrapy爬虫实例——南方都市报python数据分析复盘——数据分析相关库之Numpypython数据分析复盘——数据分析相关库之Pandaspython数据分析复盘——数据分析相关库之Matplotlib数据分析复盘——相关理论之精益数据分析数据分析复盘——相关理论之《增长黑客》数据分析复盘——基础原创 2017-09-20 21:59:35 · 3249 阅读 · 0 评论 -
统计学元知识(从一到全部)
1.什么是统计学原始理解:通过样本去估计总体,无论是点/区间估计、假设检验、方差分析还是线性回归。样本 → 总体 课本定义:①一门收集分析、表述和解释数据的科学。②一组方法,用来设计实验、获得数据,然后在数据的基础上组织、概括、演示、分析、解释和得出结论。2.概率论和统计学的关系3.为什么要用统计学总体数据相对比较难获取,有时候也没有必要获取。①统计分析是数据到结论的必经之路,大数据亦需要抽样(E...原创 2017-10-22 23:13:00 · 2118 阅读 · 0 评论 -
数据分析复盘——基础之统计学
更多详细内容,可参考统计学元知识1. 中心极限定理(基本概念)设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为(σ^2)/n 的正态分布。关于各种参数的估计,可以结合分布的定义去看。也许就更容易地理解那些公式,就不用死记硬背了) 假设检验同理。(详见2.参数估计:2.1 参数估计是什么?用样本统计量估计总体参数2.2原创 2017-09-14 13:37:08 · 5310 阅读 · 0 评论 -
数据分析复盘——基础之分析工具1(excel)
推荐课程,也是唯一上过的课程(误): Excel学习的最佳方式——表格之道(专业版) 1.Excel函数1.1数据清洗类(文本) trim删除多余的空格 concatenate合并多个文本 replace替换字符串中的一部为新的字符串 substitute替换第X个某字符为新字符 left right mid文本截取,左右以及区间 len字符数 lenb字原创 2017-09-14 13:34:21 · 2330 阅读 · 0 评论 -
数据分析复盘——相关理论之《增长黑客》
主要内容: (一) 什么是增长黑客? (二) 为什么要重视增长黑客? (三) 以“海盗指标”为基础的增长黑客内容 (四) 《增长黑客》总结(对比《精益数据分析》)(一) 什么是增长黑客?1. 增长黑客有5种特质:a) 数据为王,以数据驱动增长。认为一切的工作都是基于数据分析的指导之上的。(这点和《精益数据分析》中的观点不完全相同,因为在一开始的时候很可能是没有足够的数据进行分析的。所以在开始原创 2017-09-14 13:32:42 · 1705 阅读 · 2 评论 -
数据分析复盘——相关理论之精益数据分析
零. 《精益数据分析维》导图(部分)一. 什么是数据分析?数据分析,就是通过数据的统计分析发现问题。无论是文本数据、空间数据、还是图像数据,最终都会回归统计分析。其实和数据挖掘的联系非常密切。广义的数据分析,包括基础的统计分析和数据挖掘。我就先不严谨的分为两类吧(因为不懂建模和算法),一类偏向技术,一类偏向业务/产品。偏向技术,主要负责数据的获取、数据处理算法、数据分析平台的构建。偏向业务或者产品的原创 2017-09-14 13:31:20 · 2741 阅读 · 0 评论 -
数据分析复盘——基础之机器学习算法概览
看这篇:机器学习元知识原创 2017-09-14 13:44:04 · 3318 阅读 · 0 评论 -
统计学原理之python数据分析基础(初稿)
本篇内容关键词:python基础、数据分析、pandas、描述统计、matlibplot、seaborn、可视化分析1.python基础1.1python简介都说python是门胶水语言,可以在需要的地方轻松地粘合目标需求。我觉得python的主要优点有两点:只需聚焦实现逻辑:只要把逻辑捋顺,调用第三方库可以轻易实现处理逻辑。语法简洁,符合日常阅读的习惯。容易获得相关的技术/理论支持:...原创 2019-07-28 21:44:28 · 765 阅读 · 0 评论