- 博客(15)
- 收藏
- 关注
原创 Matplotlib 数据可视化
数据可视化,更有意义的说法是,Data Communication for audiences。 Matplotlib总是因为它的aesthetics和amounts of codes被些许诟病。然而,我觉得熟练的使用之后,它的灵活性还是比较强的(相比ggplot)。所以这篇文章的适合读者是: 想在数据展示方面有自己的taste; 想要了解一个数据可视化方面堪称奠基的python libra...
2020-04-19 10:24:42
262
转载 动态规划 | Dynamic Programming
https://leetcode.com/discuss/general-discussion/475924/My-experience-and-notes-for-learning-DP
2020-04-06 09:46:21
262
原创 Tensorflow Embedding Layer
Embedding的table是可以训练的。当然也可以是是fixed或者用pre-defined的word vector,例如使用GloVe(https://nlp.stanford.edu/projects/glove/)作为初始的参数(注意:weights已经deprecated。现在用embedding_intiator)。 以下摘自官网(https://www.tensorflow.o...
2020-02-24 20:41:04
454
转载 数据分析概率题
1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率。 M表示两个牌堆各有2个A的情况:M=4(25!25!) N表示两个牌堆完全随机的情况:N=27!27!所以概率为:M/N = 926/53*17 2.男生点击率增加,女生点击率增加,总体为何减少? 因为男女的点击率可能有较大差异,同时低点击率群体的占比增大。 如原来男性20人,点击1人;女性100人,点击99人,总点击率100/...
2020-01-05 09:32:21
2976
原创 统计概率基础总结
1. 中心极限定理CLT 2. 参数估计 与 假设检验 Parameter Estimatin vs Hypothesis Testing 3. p value 3.置信区间 Confidence Interval 4. 协方差、方差、 相关系数 Covariance, Variance and Correlation Coefficient ...
2020-01-05 09:31:15
175
原创 启发式搜索算法 - 以A*为中心来说明启发式算法本质是要找有效的heuristic需要满足的性质
转载https://www.jianshu.com/p/5704e67f40aa
2020-01-01 19:03:42
812
原创 我理解的数据科学 | Data Science in my eyes (Version 5)
统计是什么?机器学习是什么?他们有什么关系? 在本科酒店管理专业有门统计学课,学完后我知道统计是小学数学就学的平均数,是做人口统计等工作时采用的抽样调查;很幸运地,后来我对数据感兴趣后,在研究生课程里又学了一遍统计(是结合概率论一起学的,作为学习机器学习算法的入门课),这时候引入的概念多了起来,还和概率论纠缠不清,包括随机数,各种分布,假设检验,置信区间。总结概括,其最核心、有挑战性、最有趣的就...
2020-01-01 14:44:59
439
2
原创 测量非线性关系 | measure non-linear dependence
Since there is nofixedform of function which can be used(At least I have not found yet.). There are multiple straightforward solutionsfor doing this, such as spline, neural net or generalized addit...
2020-01-01 12:53:06
217
原创 测量线性关系 | measure linear dependence
首先,回顾下测量线性关系的工具。 First, let's recall the tool for the measurement of linear dependence. 皮尔森系数r可以用来测量两个变量之间的线性关系。因为它取决于数据的分布用于两个变量都符合正态分布的情况,所以也被称为有参数的相关性测试。一般可视化时图中拟合出的的线也被称为线性回归曲线。 Pearsoncorrela...
2020-01-01 10:16:48
1181
翻译 机器学习概念 | ML Concepts
Essentially, the terms "classifier" and "model" are synonymous in certain contexts; however, sometimes people refer to "classifier" as the learning algorithm that learns the model from the training da...
2019-09-29 13:16:04
347
原创 数据预处理 | Data Preprocessing
归一化和标准化定义 https://en.wikipedia.org/wiki/Feature_scaling#Rescaling_(min-max_normalization) 归一化和标准化区别(摘自https://www.jianshu.com/p/95a8f035c86c) 归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内,仅由变量的极值决定,因区...
2019-09-29 13:14:54
586
转载 字符集
中文字符集编码Unicode ,gb2312 , cp936 ,GBK,GB18030 转自:http://hi.baidu.com/okptqdwpfrbosuq/item/0fc063f8b65f0516d6ff8c03 中文字符集编码Unicode ,gb2312 , cp936 ,GBK,GB18030 转自: http://www.blog.edu.cn/user3/flyingc...
2018-11-28 11:37:15
135
原创 关于mysql validate_password plugin deprecated导致的问题
问题一:ERROR 1193 (HY000)set global validate_password_XXX=XXX;ERROR 1193 (HY000): Unknown system variable 'validate_password_XXX'解决方案:中间变成点号,如set global validate_password.length问题二:ERROR 1064 (42000)SET ...
2018-05-22 12:53:34
1712
原创 python3X中当直接print(item)是没问题,使用item.string处理HTML网页数据输出none
from bs4 import BeautifulSoupsoup = BeautifulSoup('''<div class="short-content"> 其实我没有看过这本书. 恰好看电视转台, 看到龙永图和杨澜在做节目, 杨澜介绍了这本书. 书的大意是(转杨澜的概述): 如果你真的想要得到什么, 或达到什么目标, 你就一定会...
2018-04-01 13:14:51
1226
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅