- 博客(11)
- 收藏
- 关注
原创 同时使用GitHub&GitLab(图文)
思路:建立两个密钥,不同账号配置不同的密钥,不同仓库配置不同密钥一、生成密钥1.1 GitLab密钥1.2 GitHub密钥二、添加config2.12.2三、配置仓库假定GitLab的工作目录为:D:\PycharmProjects\GitLab假定GitHub的工作目录为:D:\PycharmProjects\GitHub3.1 配置GitLab仓库3.2 配...
2020-01-01 20:40:28
154
原创 pyspark.sql.functions.lit(col)
Creates a Column of literal valuedf.select(lit(5).alias(‘height’)).withColumn(‘spark_user’, lit(True)).take(1)[Row(height=5, spark_user=True)]
2019-12-17 15:58:29
5153
原创 Git pull GitLab
一、配置Git1.11. 配置local repository的账号&邮箱$ git config --global user.name “Your Name”$ git config --global user.email “email@example.com”2
2019-12-13 10:37:16
368
原创 Pandas:将DataFrame中的Tuple分割成多列
背景class pyspark.ml.recommendation.ALS(2.4.4) def recommendForAllUsers(self, numItems): “”" Returns top numItems items recommended for each user, for all users. :param numItems: max number ...
2019-12-10 12:00:55
420
原创 spark als output
http://www.learnbymarketing.com/993/pyspark-als-and-recommendation-outputs/
2019-12-04 11:58:55
165
1
原创 极大似然估计
极大似然估计是概率的 log 概率的最大化问题,即 max(log(P) ), log 函数是单调函数, 通常取底数大于 1 的情况,所以 log 函数不影响原来概率大小的判断。如果取极大似然函数 的相反数,得到的就是我们熟悉的损失函数 cost,同时极大似然函数也对应的极小化我们 的损失函数。...
2019-10-23 17:42:05
211
原创 最小二乘法及推导
最小二乘法(Least Square Method):通过最小误差的平方和寻找数据的最佳函数,利用该方法可简便求得未知的数据,并使求得的数据与实际数据简单间的误差平法和最小。推导过程:1、...
2019-10-22 17:35:19
286
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人