
【阿里天池_新闻推荐入门赛系统项目】
新闻推荐入门赛系统项目
数据闲逛人
18级双非本科学生
展开
-
Web小入门
Why:怕自己看过就忘,写一下让脑子不会犯困,还在转动 What: Web是什么,一般我们会听说有web开发工程师,就是前端开发,那Web这东东究竟是什么缩写,是Word Wide Web:全球广域网,也称为万维网 1 Web的标准构成:结构(Structure)、表现(Presentation)和行为(Behavior)三个方面 结构:HTML 表现: CSS 行为: JS 2 HTML(Hyper Text原创 2021-12-30 00:15:07 · 152 阅读 · 0 评论 -
Datawhale 32期组队学习 Task01 熟悉新闻推荐系统基本流程
文章目录前言1 目前进度 前言 第1天就看到有大佬将18天的学习内容给跑通起来,然后总结出分享视频与分享资料及各种奇奇怪怪bug的解决的方法,我只能说  1 目前进度 大佬的直播视频看完 直播视频录屏 已经感受到整个项目难度,前后端及用户画像,推荐算法及数据库等等, 将学习资料及大佬们分享的资料整理好开始学习中 ...原创 2021-12-13 23:33:40 · 275 阅读 · 1 评论 -
Datawhale 实践项目 天池赛中零基础入门推荐系统 Task05:排序模型+模型融合 笔记[让我看看]
文章目录1. 排序模型1.1 读取排序特征1.2 返回排序后的结果 1. 排序模型 通过召回的操作, 我们已经进行了问题规模的缩减, 对于每个用户, 选择出了N篇文章作为了候选集,并基于召回的候选集构建了与用户历史相关的特征,以及用户本身的属性特征,文章本省的属性特征,以及用户与文章之间的特征,下面就是使用机器学习模型来对构造好的特征进行学习,然后对测试集进行预测,得到测试集中的每个候选集用户点击的概率,返回点击概率最大的topk个文章,作为最终的结果。 排序阶段选择了三个比较有代表性的排序模型,它们分别是原创 2020-12-04 22:55:18 · 589 阅读 · 0 评论 -
Datawhale 实践项目 天池赛中零基础入门推荐系统 Task04:特征工程 笔记[让我看看]
文章目录1 制作特征和标签, 转成监督学习问题1.1 导包1.2 df节省内存函数1.3 数据读取1.3.1 训练和验证集的划分1.3.2 获取历史点击和最后一次点击1.3.3 读取训练、验证及测试集1.3.4 读取召回列表1.3.5 读取各种Embedding查看'30760'表示的词向量 1 制作特征和标签, 转成监督学习问题 我们先捋一下基于原始的给定数据, 有哪些特征可以直接利用: 文章的自身特征, category_id表示这文章的类型, created_at_ts表示文章建立的时间, 这个关系着原创 2020-12-02 22:19:54 · 252 阅读 · 0 评论 -
Datawhale 实践项目 天池赛中零基础入门推荐系统 Task03:多路召回 笔记[让我看看]
文章目录1 前言2.导包3.读取数据4.工具函数5.计算相似性矩阵我敲不过来了[我太菜了],才到一半,我留坑,ballball不要抱我出群 1 前言 所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候 选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间 进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近 理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,原创 2020-11-30 22:07:31 · 314 阅读 · 0 评论 -
Datawhale 实践项目 天池赛中零基础入门推荐系统 Task02:数据分析 笔记[让我看看]
[让我看看谁那么帅] 标题原创 2020-11-26 11:46:47 · 280 阅读 · 0 评论 -
Datawhale 实践项目 天池赛中零基础入门推荐系统 Task01 赛题理解+Baseline 笔记[让我看看]
[让我看看谁那么帅]1赛题理解+Baseline1.1 赛题理解1.2 赛题简介1.3 数据概况`1.5 评价方式理解 1赛题理解+Baseline 1.1 赛题理解 赛题理解是切入一道赛题的基础,会影响后续特征工程和模型构建等各种工作,也影响着后续发展工作的方向,正确了解赛题背后的思想以及赛题业务逻辑的清晰,有利于花费更少时间构建更为有效的特征模型, 在各种比赛中, 赛题理解都是极其重要且必须走好的第一步, 今天我们就从赛题的理解出发, 首先了解一下这次赛题的概况和数据,从中分析赛题以及大致的处理方式,原创 2020-11-23 17:15:50 · 305 阅读 · 0 评论