- 博客(6)
- 收藏
- 关注
原创 Spark读取csv转为Array[Map(String,String)]格式
工作中碰到需要代码如下:val spark: SparkSession = SparkSession.builder().appName("test1").master("local[*]") getOrCreate() val data: DataFrame = spark.read.csv("328061757452.csv") val dataArrayRow: Array[Row] = data.collect() val nameArray: Array[String]
2022-03-28 16:36:41
2337
原创 两条线段之间的最短距离
两条线段之间的最短距离from shapely.geometry import LineStringa=LineString([(1,1),(3,5)])b=LineString([(2,2),(5,2)])print(a.distance(b))结果:0.447213595499958有需求去求两条线段之间的最短距离,在网上找了一大堆,终于找到一个能用的。...
2022-02-21 18:39:50
2072
1
原创 pip安装报错解决方案
pip安装模块报错使用: pip --default-timeout=100 install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple/大概解释一下 --default-timeout=:pip安装第三方库是有预定时间的,如果超时就会报timeout,–default-timeout=100可以延长预计时间。-i https://pypi.tuna.tsinghua.edu.cn/simple/:这个是pip的国内镜像源,推荐使用这个是清华大学的国
2021-04-06 13:58:07
505
原创 IV值和woe
IV值和woe1. 对IV的直观理解从直观逻辑上大体可以这样理解“用IV去衡量变量预测能力”这件事情:我们假设在一个分类问题中,目标变量的类别有两类:Y1,Y2。对于一个待预测的个体A,要判断A属于Y1还是Y2,我们是需要一定的信息的,假设这个信息总量是I,而这些所需要的信息,就蕴含在所有的自变量C1,C2,C3,……,Cn中,那么,对于其中的一个变量Ci来说,其蕴含的信息越多,那么它对于判断A属于Y1还是Y2的贡献就越大,Ci的信息价值就越大,Ci的IV就越大,它就越应该进入到入模变量列表中。你好!
2020-07-24 21:38:32
837
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人