- 博客(31)
- 收藏
- 关注
原创 《百面机器学习》学习笔记之经典算法(支持向量机SVM、逻辑回归LR、决策树DT)
支持向量机(Support Vector Machine, SVM)是监督学习方法。将低维的数据映射到高维的核映射空间,寻找“分类超平面”将不同类别的数据区分开。
2023-04-04 11:01:22
710
原创 【CVPR2022】Boosting Robustness of Image Matting with Context Assembling and Strong Data Augmentation
Boosting Robustness of Image Matting with Context Assembling and Strong Data Augmentation
2022-12-15 15:14:59
530
原创 【CVPR2022】MatteFormer: Transformer-Based Image Matting via Prior-Tokens
【CVPR2022】 MatteFormer: Transformer-Based Image Matting via Prior-Tokens
2022-12-06 20:11:48
1679
原创 【ECCV2022】论文阅读笔记TransMatting: Enhancing Transparent Objects Matting with Transformers
ECCV2022 TransMatting: Enhancing Transparent Objects Matting with Transformers
2022-11-24 16:28:08
1298
1
原创 【ACCV2022】论文阅读笔记Lightweight Alpha Matting Network Using Distillation-Based Channel Pruning
ECCV2022论文
2022-11-23 15:31:54
581
1
原创 【CVPR2022】论文阅读笔记Semi-Supervised Semantic Segmentation Using Unreliable Pseudo-Labels
Semi-Supervised Semantic Segmentation Using Unreliable Pseudo-Labels
2022-11-14 20:05:08
1307
1
原创 《百面机器学习》学习笔试之模型评估(第2章)
01 评估指标的局限性准确率(Accuracy)的局限性Accuracy=ncorrectntotalAccuracy = \frac{{{n_{correct}}}}{{{n_{total}}}}Accuracy=ntotalncorrect当负样本占99%时,分类器把所有样本都预测为负样本也可以获得99%的准确率。所以当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素。为了解决这个问题,可以使用更为有效地平均准确率(每个类别下的样本准确率的算术平均)作为模型评
2021-11-27 23:30:53
1775
原创 《百面机器学习》学习笔试之特征工程(第1章)
01、特征归一化(为什么需要对数值型的特征归一化?)对数值类型的特征归一化可以将所有的特征都统一到一个大致相同的数值区间内。方法:1)线性函数归一化(Min-Max scaling)Xnorm=X−XminXmax−Xmin{X_{norm}} = \frac{{X - {X_{\min }}}}{{{X_{\max }} - {X_{\min }}}}Xnorm=Xmax−XminX−Xmin2)零均值归一化(Z-score Normalization)z=x−μσz =
2021-11-16 00:30:43
797
原创 天池新闻推荐入门赛之排序模型+模型融合
排序模型通过召回的操作, 我们已经进行了问题规模的缩减, 对于每个用户, 选择出了N篇文章作为了候选集,并基于召回的候选集构建了与用户历史相关的特征,以及用户本身的属性特征,文章本省的属性特征,以及用户与文章之间的特征,下面就是使用机器学习模型来对构造好的特征进行学习,然后对测试集进行预测,得到测试集中的每个候选集用户点击的概率,返回点击概率最大的topk个文章,作为最终的结果。排序阶段选择了三个比较有代表性的排序模型,它们分别是:LGB的排序模型LGB的分类模型深度学习的分类模型DIN得到了最
2020-12-06 23:22:02
214
原创 天池新闻推荐入门赛之特征工程
特征工程(制作特征和标签, 转成监督学习问题)构造特征的思路是这样, 我们知道每个用户的点击文章是与其历史点击的文章信息是有很大关联的, 比如同一个主题, 相似等等。 所以特征构造这块很重要的一系列特征是要结合用户的历史点击文章信息。我们已经得到了每个用户及点击候选文章的两列的一个数据集, 而我们的目的是要预测最后一次点击的文章, 比较自然的一个思路就是和其最后几次点击的文章产生关系, 这样既考虑了其历史点击文章信息, 又得离最后一次点击较近,因为新闻很大的一个特点就是注重时效性。 往往用户的最后一次点击
2020-12-03 19:04:01
140
原创 天池新闻推荐入门赛之多路召回
多路召回所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。import pandas as pd import numpy as npfrom tqdm import tqdm from collections import defaultdict import os, math, warnings, math, picklefrom
2020-11-30 20:06:13
359
原创 天池新闻推荐入门赛之数据分析
训练集数据分析# 导入相关包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', family='SimHei', size=13)import osimport gcimport reimport warningsimport syswarnings.filterwarnings("ignore")path = './da
2020-11-27 23:52:04
173
原创 天池新闻推荐入门赛之赛题理解+Baseline
零基础入门推荐系统【赛题理解+Baseline】赛题简介赛题是以新闻APP中的新闻推荐为背景, 目的是要求我们根据用户历史浏览点击新闻文章的数据信息预测用户未来的点击行为, 即用户的最后一次点击的新闻文章, 这道赛题的设计初衷是引导大家了解推荐系统中的一些业务背景, 解决实际问题数据概况该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,从中抽取20万用户的点击日志数据作为训
2020-11-25 20:14:38
263
原创 efficientNe笔记
Efficientnet 原文使用pip安装efficientnetpip install efficientnet_pytorch导入efficientnetfrom efficientnet_pytorch import EfficientNetmodel = EfficientNet.from_name('efficientnet-b0') # load an Efficien...
2019-11-21 17:46:16
587
原创 第一、二章
深度神经网络(DNN) 、 卷积神经网络(CNN) 、 循环递归神经网络(RNN) 、 生成对抗网络(GAN)Tensorflow与Caffe都是命令式的编程语言, 而且是静态的, 首先必须构建一个神经网络, 然后一次又一次使用同样的结构,如果想要改变网络的结构, 就必须从头开始。 但是对于PyTorch, 通过一种反向自动求导的技术, 可以让你零延迟地任意改变神经网络的行为, 尽管...
2019-05-29 10:56:35
197
原创 C语言复试上机(入门篇-算法初步之排序算法)
冒泡排序:#include <stdio.h>int main(){ int a[5] = {1,5,8,3,0}; int i,j,l,temp; for(i=1;i<5;i++) for(j=0;j<5-i;j++) if(a[j] >= a[j+1]){ temp = a[j]; a[j] = a[j+1]; a...
2019-03-26 10:35:35
288
原创 C语言复试上机(入门篇-入门模拟)
害死人不偿命的(3n+1)猜想问题描述:对任何一个自然数n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把(3n+1)砍掉一半。这样一直反复砍下去,最后一定在某一步得到n=1.要求:给定一个不超过1000的正整数n,需要多少步才能得到n=1?输入样例:3输出样例:5#include &amp;amp;amp;amp;lt;stdio.h&amp;amp;amp;amp;gt;int main(){ int n,count=0 ;
2019-02-28 16:58:39
985
原创 C语言基础(复试复习版)
C语言基础1.#include &amp;amp;amp;amp;lt;stdio.h&amp;amp;amp;amp;gt; (standard input &amp;amp;amp;amp;amp; output) 包括 printf 和scanf函数2. C++ 需要加上“using namespace std;”3. C语言中的数据类型:分类名称在内存中占的字节数字符char1
2019-02-25 18:13:03
953
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人