
山软项目实训
山东大学软件学院项目实训日志,电影评价网
_Mogician
这个作者很懒,什么都没留下…
展开
-
【创新实训】推荐系统实验2(修改模型、混合数据集)
数据集混合的数据集单独使用douban_imdb训练确实有效果,但是因为是国外的数据集,国外电影占绝大部分,国内电影推荐效果非常差。douban_csdn数据集最稀疏,训练不出效果,mtime、douban_openkg指标还行,单独来用item太少。因此拟将这三个数据集混合在一起。douban_imdb电影频数往往达到五六万往上,其他数据集的频数比较而言太小了,需要删除douban_imdb的部分行。于是,我将所有数量大于1000的item,随机删除记录,只保留(500 + len(group)原创 2020-07-01 20:34:08 · 1315 阅读 · 1 评论 -
【创新实训】BERT4EL,基于文本相似度的实体消歧实现
任务描述现有douban、mtime、maoyan三个来源的电影,包含名称、简介、导演、演员、类型等等属性。需要相同的电影融合为一个电影条目,其中maoyan数量很少,可以合并到mtime中。参照实体消歧(或实体链接)的惯用语,数量最多的douban可以作为知识库中的entity,mtime(+maoyan)作为需要链接到KB的mention。思路事实上,这个任务也相当于文本多分类任务。类别数为KB中的entity数,那么将模型运算得到的mention hidden states输入到最后一层全连原创 2020-06-28 22:26:47 · 1694 阅读 · 6 评论 -
【创新实训】推荐系统之召回池设计
召回池我的想法是,输入形式为batch时模型总计算时间应当比一个一个喂小不少,因此可以建立一个比如200为大小的召回池,最多每隔0.5s送入模型进行计算,当waiting list已经到达了200,立即执行计算,重置定时任务。消息队列python的queue库是一个线程安全的队列,可以用作消息队列。其基本用法参考:Python之queue模块以及生产消费者模型先写一个类包装class Pack: def __init__(self, flag=False, _id=None, seq=原创 2020-06-21 10:16:04 · 3001 阅读 · 0 评论 -
【创新实训】用户后台
待办事项insertStamp现为字符串,以后需要更新为long类型的timestamp,以减少硬盘占用。注意代码也需更改Useruser为movie数据库下的collection,存放用户注册手机号、用户名、密码(暂hd5加密)、emb、浏览历史class User(Document): _id = ObjectIdField() phone = StringField() name = StringField() pwd = StringField() e原创 2020-06-20 17:23:16 · 251 阅读 · 0 评论 -
【创新实训】推荐系统模型训练实验
Experimentsdouban_imdb原数据集来自movieLens-25M,为显示反馈,以评分大于等于3作为隐式反馈。筛选出可以映射为douban_id的(最后应当筛选能映射为最终融合id的),去掉user、item频数小于5的,sess长度小于2的,按8:2划分数据集,train 152142条,test 36791条,item 10576个。NARM源码 session_NARMpytorch版本 Neural-Attentive-Session-Based-Recommendati原创 2020-06-18 22:19:40 · 602 阅读 · 0 评论 -
【创新实训】推荐系统召回学习
Reference个性化推荐系统_召回推荐系统简明教程-召回推荐系统的召回策略架构1.离线方式:离线的model file算出推荐结果,这些推荐结果可以是用户喜欢哪些item,也可以是item之间的相似度文件,然后写入KV存储,在线的server recall部分直接调用这个结果,拿到ID之后访问detail server得到详情,再往rank部分传递。2.半在线模式:将model file算出来的item embedding也存入KV,然后tf-server调用在线model 生成 user原创 2020-06-10 09:16:29 · 289 阅读 · 0 评论 -
【通知】项目日志从本专栏转移至收藏夹
因为转载不便(还得复制),现本专栏仅为个人开发日志,团队项目转移至收藏夹 创新实训原创 2020-06-07 10:22:14 · 240 阅读 · 0 评论 -
【创新实训】接口约定、需求草稿
接口数据库接口MongoDB的地址:39.106.132.48:27017可以clone下来,也可以直接用如果使用官方GUI(MongoDB Compass),链接的时候使用账号密码user:rootpwd:r****lf(见群,下同)cmd里,use movie(切换到movie集合)之后,db.auth(“usr”, “z****7”)前端和爬虫代码所需账号密码由相对路径下的setting.json(/crawler/ 和/backend/api/ 下)读取,该文件加入了.gitigno原创 2020-06-06 19:54:56 · 375 阅读 · 0 评论 -
【创新实训】后端开发笔记
电影评价网原创 2020-06-06 20:56:56 · 365 阅读 · 0 评论 -
【创新实训】前端开发笔记
电影评价网Vue依赖:Vue 3.x 建议使用脚手架Vue-cliVuex 负责静态存储ElementUI 组件库axios HTTP访问安装脚手架yum install npmnpm install -g vue-cli要求npm > 4.0版本过低建议使用版本管理工具nnpm install -g nn latest启动windows上建议使用 vue ui 命令启动脚手架GUI,然后新建项目。然后安装相应依赖。实现...原创 2020-06-06 19:54:18 · 329 阅读 · 0 评论