- 博客(6)
- 收藏
- 关注
原创 逻辑回归-概述与推导
1.概述逻辑回归为分类模型,适用于二分类问题。思想基于线性回归,属于广义线性回归模型,其公式为:hθ(x)=11+e−z=11+e−θTxh_\theta(x)=\frac{1}{1+e^{-z}}=\frac{1}{1+e^{-\theta^{T}x}}hθ(x)=1+e−z1=1+e−θTx1,其中z=θ0+θ1x1+...+θnxn=θTxz=\theta_0+\theta_1x_1+...+\theta_nx_n=\theta^Txz=θ0+θ1x1+...+θnxn=θTx。L
2020-10-24 14:59:23
508
原创 [算法题] 跳一跳 Python求解
[算法题] 跳一跳 Python求解题目描述:跳一跳 有一条石板路,每块石板上从1挨着编号为:1、2、3…,这条石板路要根据特殊的规则才能前进:对于当前所在的编号为 K 的石板,单次只能往前跳K的一个约数(不含1和 K )步,即跳到 K + X ( X 为 K 的一个非1和本身的约数)的位置。若当前处在编号为 N 的石板,想跳到编号恰好为 M 的石板去,请求解最少需要跳跃次数,不可到达输出-1。 输入格式:4 24 输出格式:5算法设计思路求解过程中涉及到两个方面的问题,一个是每个点
2020-07-25 21:26:39
538
原创 Hive中将数据一行转多行、多行转一行、再转为以逗号分隔的string类型
Hive中将数据一行转多行、多行转一行、再转为以逗号分隔的string类型背景表content中有观看内容id(content_id),内容标签id列表(tag_id_list),如下所示:content_idtag_id_list11000,1001,100221000,100331002,100341002,1004表id_decode中有内容标签id(tagid),内容标签中文(tagname),如下所示:tagidtagname
2020-06-15 14:40:34
4830
原创 决策树graphviz可视化报错can only concatenate str (not “numpy.float64”) to str
决策树graphviz可视化报错can only concatenate str (not “numpy.float64”) to str对iris数据集作的一个简单的决策树实例,但是在用graphviz可视化时报了“can only concatenate str (not “numpy.float64”) to str”的错误,之后成功解决,因为之前也出过一次bug,所以在此做个小小的总结。...
2020-04-24 11:34:34
4371
4
原创 腾讯暑期实习提前批 数据分析 面经
感觉整个流程还挺快速的,4.6一面,4.8二面,4.10三面,4.11显示已完成。之后就是煎熬地等待oc,4.16oc????文章目录一面(100min)简历部分SQLPython机器学习大数据Linux其他问题个人信息反问问题二面(55min)简历部分Python其他问题反问问题HR面(15min)提问反问问题一面(100min)简历部分1.自我介绍2.为什么不投算法岗位而是投数据分析岗位...
2020-04-17 23:25:06
1123
原创 AUC、KS评价指标、洛伦兹曲线、Gini系数、Lift曲线和Gain曲线
文章目录1.AUC1.1.混淆矩阵1.2.ROC曲线2.KS评价指标3.洛伦兹曲线4.Gini系数5.Lift曲线和Gain曲线6.总结关于AUC、KS评价指标、洛伦兹曲线、Gini系数、Lift曲线和Gain曲线。在别人的博客里看到下面的一个小故事:故事是这样的: 首先,混淆矩阵是个元老,年龄最大也资历最老。创建了两个帮派,一个夫妻帮,一个阶级帮。 之后,夫妻帮里面是夫妻两个,...
2020-02-04 11:43:00
7313
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人