- 博客(60)
- 资源 (7)
- 收藏
- 关注
原创 Uplift 经典模型介绍
Uplift 经典模型介绍1. 元学习相关模型1.1 双模型(Two Model, T-Learner)1.2 单模型(Single Model, S-Learner)1.3 X-Learner模型2. Uplift树模型2.1 CTS算法2.2 因果森林2.3 广义随机森林(GRF)2.4 正交随机森林(ORF)3. 剪枝方法3.1 重采样(resampling)3.2 单调约束3.3 最小增益...
2022-06-19 20:00:27
3312
原创 Double Machine Learning(DML) 原理及其应用
Double Machine Learning(DML) 原理及其应用1. 为什么需要DML?2. DML原理2.1 符号定义2.2 DML训练过程2.3 为什么残差正交化可得到无偏差因果效应?2.4 使用DML估计ATE2.5 使用DML估计CATE2.6 直接预测反事实的Y3. Econml DML应用实战1. 为什么需要DML? 用来做因果推断 优势 减少函数形式的假设可以对高维数据进行建模...
2022-06-19 19:59:02
4454
2
原创 华为笔试题——去除重复的数字
华为笔试题题目描述给定一个包含重复数字的数组,数组中的数字范围(0,9],要求删除重复数字后得到的数组组成的整数最大,且数字的相对位置不变。数组的长度小于7。输入样例[1,2,9,1,2,1]输出样例[9,2,1]解题思路s = input()s = s[1:-1].replace(',', '')if not s: print('[]')else: res = s[0] for i in range(1, len(s)): if
2021-11-18 15:31:27
1132
2
原创 Mac Book HomeBrew 一键快速安装脚本
Mac Book HomeBrew 一键快速安装脚本转载自原文:https://zhuanlan.zhihu.com/p/1110144481. 安装脚本完整版安装/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"精简版安装/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/mast
2021-07-03 16:45:21
564
原创 C++ 纯虚函数
C++ 纯虚函数#include<bits/stdc++.h>using namespace std;class A {public: virtual void add() = 0;};class B : public A {public: virtual void add() { printf("1\n"); }};int main() { B b; A *p = &b; p->add();
2020-09-23 17:19:38
363
原创 手撕代码高频考题代码详解
手撕代码高频考题代码详解1. 快速排序# Python最简版from random import randintdef quick_sort(arr): if len(arr) <= 1: return arr p = arr[randint(0, len(arr) - 1)] left = [x for x in arr if x < ...
2020-09-16 16:30:44
666
原创 python 分组合并元素
python 分组合并元素问题描述:将用户点击过的物品进行合并,返回用户点击记录的字典数组.此处用到了python字典进行处理.1. 实例分析import pandas as pdres = {}data = [[0, 0, 1], [0, 1, 1], [0, 2, 1], [1, 1, 1], [1, 2, 1]] # [u_id, i_id, rating]for item in data: res.setdefault(item[0], []).append(item[1
2020-07-12 11:16:28
662
原创 Python 多进程与多线程优化
Python 多进程与多线程优化Python 多线程代码from time import ctime, sleepimport threadingimport numpy as npimport collections loops = [1e6,1e7]class MyThread(threading.Thread): def __init__(self, func, args, name=''): threading.Thread.__init__(self)
2020-05-26 11:15:16
673
原创 spark 多次join操作带来的问题
scala sparkspark dataframe 聚合操作、join操作,多次引用导致字段解析错误的问题,可以重命名列解决。
2020-05-14 18:08:48
907
原创 or-tools工具使用教程
or-tools工具使用教程工具简介or-tools是用于解决组合优化问题的开源软件,旨在从众多的可能中寻找到最佳的解决方案,比如解决以下的问题:最优线路问题最佳计划问题装箱问题or-tools包括用于以下方面的求解器:约束优化问题线性和整数规划问题车辆路线问题图相关问题代码仓库https://github.com/google/or-tools安装pip install ortools使用示例线性优化问题from __future__ import
2020-05-12 17:08:19
9381
1
原创 参考文献查阅网站大全
陕西三百六信息科技有限公司:论文必备:史上最全文献检索、阅读及管理攻略 写论文如何找参考文献? 主流网站: Semantic scholar AMINER dblp arxiv google 学术 百度学术 知网 ...
2020-05-08 15:37:25
1994
原创 重新认识傅里叶变换
傅里叶变幻的基本思想:任意周期函数可以写成三角函数之和。 复数的作用:旋转。乘以i旋转90°,再乘以i旋转90°。 傅里叶变换通过欧拉公式变成指数函数形式: 参考资料 https://www.cnblogs.com/h2zZhou/p/8405717.html 如何理解傅里叶变换公式? 复数的物...
2020-05-08 05:49:43
255
原创 Multiple Treatment 相关文献资料
主要解决的问题是:针对不同的用户发放不同的优惠券之类的策略的活动,从而刺激用户增长,日活,提高收益等等。 相关论文: https://dl.acm.org/doi/10.1145/3308558.3313744 Estimation of causal effects with multiple treatments: a rev...
2020-05-08 04:48:44
474
原创 图神经网络开源框架DGL
图神经网络开源框架DGL还有另外一个开源框架PyTorch Geometric, 在这里不做详细介绍,有兴趣的同学自己去了解一下,个人推荐DGL,简单易用,扩展性好。1. 使用教程1.1 pip安装pip install dgl # For CPU Buildpip install dgl-cu90 # For CUDA 9.0 Buildpip in...
2020-04-06 10:29:17
2173
8
原创 图神经网络开源框架DGL学习
图神经网络开源框架DGL学习 还有另外一个开源框架PyTorch Geometric, 在这里不做详细介绍,有兴趣的同学自己去了解一下,个人推荐DGL,简单易用,扩展性好。 个人公众号 ...
2020-04-06 02:38:04
1593
原创 Hive 复制表结构和数据
Hive 复制表结构和数据1. 复制非分区表create table a as select * from b;2. 复制分区表create table a like b;insert overwrite table a partition (year, month, day) select * from b;...
2020-04-02 14:42:03
463
原创 causalml 使用介绍
causalml 使用介绍 1. 安装教程及官方文档 1.1 pip安装 pip install causalml 1.2 API文档 https://causalml.readth...
2020-03-30 07:44:55
3959
原创 Linux查找文件名和文件内容的命令
Linux查找文件名和文件内容的命令1. find 命令命令详解:https://man.linuxde.net/find查找文件名包含 abc的文件: find . -name "*abc*"2. grep 命令命令详解:https://man.linuxde.net/grep查找文件内容包含abc的文件: grep -rn "abc"...
2020-03-17 11:38:11
4958
原创 Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-Experiment Data
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SJyoawDB-1582873027451)(https://s2.ax1x.com/2020/02/28/3DVai6.jpg)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ItNO7B4X-1582873027452)(https://s2.ax1x.com/2020/02/28...
2020-02-28 14:58:41
33219
1
原创 CUPED算法
CUPED算法是一个通用的方法,主要利用实验前的无偏数据,(一般选取实验前的同一指标)对实验核心指标进行修正,使得新指标的方差更低,得到更敏感的新指标,放大treatment的影响;同时该方法还可以在减少样本量或实验周期,减少前期实验成本,降低实验风险。 https://blog.youkuaiyun.com/qq_20001941/article/details/104556748...
2020-02-28 07:22:16
1905
原创 python append和extend的区别
python append和extend的区别1. appendappend可以添加单个元素,也可以添加可迭代对象2. extendextend只能添加可迭代对象3. 代码示例:arr_ap = [1,2,3,4]item = [5,6,7]arr_ap.append(item)In [160]:arr_apOut[160]:[1, 2, 3, 4, [5, 6, 7]]...
2020-01-08 19:41:22
4806
原创 常见面试题汇总
SpringBoot 面试题集锦https://www.cnblogs.com/3xmq/p/springboot.htmlhttps://blog.youkuaiyun.com/panhaigang123/article/details/79587612https://segmentfault.com/a/1190000016686735https://juejin.im/post/5ccaa56...
2019-06-02 15:02:55
4572
原创 推荐系统热门研究方向
推荐系统热门研究方向1. 大方向个性化推荐群组推荐2. 近期热门研究方向利用图神经网络来提供可解释性利用评论来提供可解释性利用多模态(文本、图像)信息进行融合利用多个算法进行综合推荐利用强化学习解决在线推荐问题利用强化学习构建虚拟环境进行模拟测试利用树结构挖掘更高阶的显式信息利用知识图谱提供可解释性利用时序循环网络解决长短期依赖问题...
2019-05-12 11:02:22
33636
原创 Github + Hexo搭建博客源代码
Github + Hexo搭建博客源代码1. 代码参考地址2. 简易教程1. 代码参考地址https://github.com/ZSCDumin/BlogSystems2. 简易教程https://zscdumin.github.io/2018/01/30/hexo-githubpage/...
2019-04-29 10:46:41
4971
2
原创 MovieLens 数据集补充版爬虫代码解析
MovieLens 数据集补充版爬虫代码解析import requestsfrom pyquery import PyQuery as pqimport pandas as pddef get_response(url): try: response = requests.get(url, timeout=30) return response.t...
2019-04-08 17:30:46
5292
2
原创 2019未来杯高校AI挑战赛之图像-发现超新星
1. 参赛网址https://ai.futurelab.tv/contest_detail/12. 背景知识介绍http://psp.china-vo.org/article/sysaquiz1intro3. 数据分析(未经允许不得转载)...
2019-03-22 11:28:01
5435
1
原创 2019 未来杯高校 AI 挑战赛 > 图像-发现超新星
2019 未来杯高校 AI 挑战赛 > 图像-发现超新星 1. 任务目标 设计一个目标检测模型,从天文望远镜拍摄到的影像中发现疑似新星、超新星。 2. 规则说明 参赛选手需要基于给定的数据集,设计并训练模型,用于检测PSP项目中天文望远镜拍摄到的影...
2019-03-22 03:35:37
553
原创 Graph Neural Networks for Social Recommendation
Graph Neural Networks for Social Recommendation1. 摘要构建基于图神经网络的推荐系统的三大挑战the user-item graph encodes both interactions and their associated opinionssocial relations have heterogeneous strengthsus...
2019-03-13 17:27:43
6815
原创 DataFound 2019用户画像竞赛分析
DataFound 2019用户画像竞赛分析1. 数据解释列的含义['用户编码', '用户实名制是否通过核实', '用户年龄', '是否大学生客户', '是否黑名单客户', '是否4G不健康客户','用户网龄(月)', '用户最近一次缴费距今时长(月)', '缴费用户最近一次缴费金额(元)', '用户近6个月平均消费值(元)','用户账单当月总费用(元)', '用户当月账户余额(元)',...
2019-03-07 17:24:59
5369
1
原创 Explainable Reasoning over Knowledge Graphs for Recommendation
Explainable Reasoning over Knowledge Graphs for Recommendation1. 摘要 近年来,将知识图结合到推荐系统中已引起越来越多的关注。通过探索知识图中的互连链接,可以将用户和项之间的连接发现为路径,从而为用户项交互提供丰富且互补的信息。这种连接不仅揭示了实体和关系的语义,而且有助于理解用户的兴趣。然而,现有的努力尚未充分探索用于推断用...
2019-03-01 16:45:29
32445
原创 NDCG
NDCG 详解1. CG累积增益(CG)是DCG的前身,并且在考虑结果集的有用性时不包括结果的位置。以这种方式,它是搜索结果列表中所有结果的分级相关值的总和。特定等级位置p的CG定义为:2. DCGDCG的前提是在搜索结果列表中出现较低的高度相关文档应该受到惩罚,因为分级相关值与结果的位置成对比地减小。DCG的传统公式累积在特定的等级位置p的定义为:另一种表述...
2019-03-01 16:36:42
5822
原创 图神经网络相关综述论文推荐
图神经网络相关综述论文推荐1.1 Relational inductive biases, deep learning, and graph networks1.2 论文链接论文链接视频链接2.1 Graph Neural Networks: A Review of Methods and Applications2.2 论文链接论文链接视频链接...
2019-02-18 21:23:13
6474
原创 英语翻译作业
第一单元 英翻中 德.汤说过,一切进步,一切发展均来自挑战及由此引起的反应。没有挑战就没有反应,没有发展,没有自由。所以,我们首先应该在我们孩子的能力允许的范围内为他们开设最严格最富有挑战性的课程。 我们可以向我们的孩子提供第二个机会是允许他们有失败的权力。德.纽伊写道:“不仅是一种特权,也是一种考验。”如果没有人可以失败,那它算什么考验,...
2019-01-06 06:33:33
443
原创 爬虫
1.创建项目 scrapy startproject p1 2.文件说明: scrapy.cfg 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py 设置数据存储模板,用于结构化数据,如:Django的Model pipe...
2019-01-06 06:32:35
278
原创 手写数字识别之卷积神经网络版
参考代码如下: import numpyfrom keras.datasets import mnistfrom keras.models import Sequentialfrom keras.layers import Densefrom keras.layers import Dropoutfrom keras.layers ...
2019-01-06 06:31:55
203
原创 Hexo+GithubPage制作自己的博客
具体步骤如下: 1. 创建一个文件夹(如Blog) 2. 开始安装Hexo,在Bolg文件夹里面打开git bash,输入如下命令 $ npm install hexo -g 3. 初始化Hexo $ hexo init 4...
2019-01-06 06:30:44
168
slide of cuped.pdf
2020-02-28
复旦大学——机器学习与深度学习
2019-04-21
大数据Spark企业级实战版
2018-04-05
循序渐进学Docker
2018-04-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人