- 博客(10)
- 收藏
- 关注
原创 RFE -- 用户活跃度模型
RFE模型概述RFE模型基于用户普通行为(非转化或交易行为)产生,RFE模型可以说是RFM模型的变种,实现思路和RFM模型类似。RFE详解最近一次访问时间 R(Recency):会员最近一次访问或到达网站的时间访问频率 F(Frequency):用户在特定时间周期内访问或到达的频率页面互动度 E (Engagements):互动度的定义可以根据不同企业或行业的交互情况而定,例如可以定义为页面浏览时间、浏览商品数量、视频播放数量、点赞数量、转发数量等。RFE模型打分样例:R:0-15天=5
2021-08-09 16:03:26
2754
转载 特征工程(一)-- 概述
简介特征工程本质上可以理解成数据预处理,其目的是最大限度地从原始数据中提取特征以供算法和模型使用,从而提高模型的准确率等指标。处理的数据中的特征直接影响到正在使用的模型以及能达到的最好的结果。当模型和特征都确定之后,通过调参带来的收益微乎其微,似乎已经到达模型的上限了。但是如果此时发现了更好的特征,只更换特征的情况下,效果会有很大的提升,这不是靠调参能够得到的。特征工程总览:特征工程的位置在近一步讨论特征工程的细节之前,我们先明确一下机器学习或者说深度学习模型的工作管道。这会帮助我们了解一项任务,
2021-08-06 16:57:07
314
原创 Python 画桑葚图
import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.sankey import Sankeyplt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号my_dpi = 96plt.figure(figsize=(480/my_dpi,480/my_dpi),dpi=m
2020-12-26 22:27:12
582
原创 Python 画雷达图
import matplotlib.pyplot as pltimport pandas as pdfrom math import pidf = pd.DataFrame({ 'group': ['A', 'B', 'C', 'D'], 'var1': [38, 15, 12, 7], 'var2': [34, 16, 19, 3], 'var3': [8, 29, 13, 1.4], 'var4': [17, 31, 23, 24], 'var5'
2020-12-14 00:37:14
438
原创 Python 画词云图
Python 画云图在这里插入代码片from wordcloud import WordCloudimport matplotlib.pyplot as pltmy_dpi = 96plt.figure(figsize=(480/my_dpi,480/my_dpi),dpi=my_dpi)#dpi:绘图对象的分辨率,默认值为80text = ("Python Python Python Matplotlib Matplotlib Seaborn Network Plot Violin C
2020-12-12 18:50:09
657
原创 R笔记1
setwd('C:/Users/Administrator/Desktop')LC <- read.csv('LC.csv',header = T,sep = ',',quote = '')#清除空值LCS <- na.omit(LC)#表#频数分布表table(LCS$性别)prop.table(table(LCS$性别))#列联表table(LCS$借款类型,LCS$性别)#1:按行百分比,2:按列百分比prop.table(tab...
2020-07-06 10:34:09
177
转载 pycharm创建工程后.idea和venv文件夹存储的信息
.idea 保存 IDE 需要的和你当前项目相关的一些配置,状态,比如说,你打开了N个文件,关了软件,下次再打开,又给你恢复到你上次关闭时的状态,这些信息就在这里面了(你可以关闭后把.idea目录删掉再打开试试)venv 就是 Python 的virtualenv ,现在的pycharm版本(我也不知道是从哪个版本开始的),新建项目时默认是新建一个虚拟环境,其实你也可以选择使用已有的其它虚拟环境目录...
2020-06-01 08:52:30
5039
1
原创 5/29 SQL练习题摘要
9. 查询和" 01 "号的同学学习的课程完全相同的其他同学的信息select * from StudentWHERE S_id in(select S_id from SCwhere C_id in (select C_id from SC where S_id='01')and S_id not in ('01')GROUP BY S_id HAVING COUNT(S_id)=3)15. 按各科成绩进行排序,并显示排名, Score 重复时保留名次空缺select a....
2020-05-29 11:14:06
222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人