- 博客(9)
- 收藏
- 关注
原创 非等频采样时间序列表示学习新方法
预训练任务的设计:针对不规则时间序列,设计合适的预训练任务,让模型从无监督数据中学到良好表征。文中主要提出了基于预测的预训练任务和基于重构的预训练任务。数据增强方式设计:文中设计了用于无监督学习的数据增强方式,包括添加噪声、增加随机mask等方式。下载地址:https://arxiv.org/pdf/2308.13703v1.pdf。此外,文中还提出了一种针对不同分布数据集,如何探索最优无监督学习方式的算法。本文的预训练方法借鉴了NLP中的经验,主要包括两个方面。时间2023-10-11。
2023-10-11 19:40:18
118
原创 python实现基于内容的电影推荐系统
因为本科论文需要,所以写个blog留个纪念。代码只有核心推荐系统部分代码,对于其中文本繁体转简体的部分需要自己实现,如需要请联系我。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport jiebaimport nltkimport reimport numpy as npfrom langconv import *# df = pd.read_csv(r"C:\Users\heng\Desk
2022-05-24 15:55:04
552
原创 基于python商品和酒店的评论进行情感分析(监督学习)
数据是关于商品和酒店的评论,请利用下列方法对该数据的商品和酒店的评论进行情感分析,并评估模型的性能。(1) 基于IF-IDF特征工程,分别采用逻辑回归、支持向量机和多项式朴素贝叶斯分析import pandas as pdimport jiebaimport refrom sklearn.model_selection import train_test_splitimport model_evaluation_utils as meudataset = pd.read_csv(r'E:\py
2021-06-17 22:33:27
663
1
原创 python最强文本预处理(清洗)
python文本预处理import pandas as pdimport numpy as npimport jiebaimport refrom sklearn.model_selection import train_test_split# import model_evaluation_utils as meudataset = pd.read_csv(r'E:\python\python文本挖掘\作业7\DataSet.csv')dataset.info()# 去掉评论空白数据
2021-06-17 22:26:07
1258
原创 基于地域和热度的酒店推荐系统
实验5:创建一个基于地域和热度的酒店推荐系统一、主要实现酒店推荐, 根据用户所在的地区和所选择的排序方式返回相应的前k个酒 店数据。•数据集都取所在地址是北京的, 包含朝阳区、 丰台区、 东城区、 西城区、 海淀区、 顺义 区、 石景山区、 延庆区、 房山区、 通州区。•支持排序的字段有:评论数目、装修时间、开业时间、评分、最低价格,以及综合排序。•程序中通过type字段进行赋值。•排序方式分为升序和降序。“综合排序”的实现思路二、“综合排序” 是对其余排序字段的线性整合。这里简单地定义了各个
2021-05-27 09:36:59
631
原创 CNN卷积神经网络实现图像识别
# coding: utf-8# In[2]:import urllib.requestimport osimport tarfileimport pickle as pimport numpy as npimport tensorflow as tf# ## 1、下载数据集# In[3]:filepath = 'data/cifar-10-python.tar.gz'if not os.path.exists("data/cifar-10-batches-py"):.
2021-05-13 11:21:51
1275
原创 基于python实现计算物品之间的相似度矩阵算法二
计算物品之间的相似度矩阵例如现在有A、B、C、D四个用户,分别对a、b、c、d、e五个物品表达了自己喜好程度(通过评分高低来表现自己的偏好程度高低),计算物品之间的相似度矩阵算法1、建立用户物品倒排表A a b dB a c eC b eD b d e2、构建同现矩阵同现矩阵表示同时喜欢两个物品的用户数,根据用户物品倒排表计算出来3、统计每个物品有行为的用户数4、计算物品之间的相似度,得到物品之间的相似度
2021-04-25 09:07:57
2441
原创 基于python计算物品之间的相似度矩阵
计算物品之间的相似度矩阵例如现在有A、B、C、D四个用户,分别对a、b、c、d、e五个物品表达了自己喜好程度(通过评分高低来表现自己的偏好程度高低),计算物品之间的相似度矩阵算法1、建立用户物品倒排表A a b dB a c eC b eD b d e2、构建同现矩阵同现矩阵表示同时喜欢两个物品的用户数,根据用户物品倒排表计算出来3、统计每个物品有行为的用户数4、计算物品之间的相似度,得到物品之间的相似度
2021-04-25 08:41:28
3591
4
原创 python实现基于用户的协同过滤算法一
python实现基于用户的协同过滤算法基于用户的协同过滤算法主要包括两个步骤。(1) 找到和目标用户兴趣相似的用户集合。(2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。1、构建用户物品评分表2、相似度计算计算用户相似度的方法很多,这里选用余弦相似度给定用户u和用户v,令N(u)表示用户u曾经有过正反馈的物品集合,令N(v)为用户v曾经有过正反馈的物品集合。可以看出D用户与C用户相似度最大。3、计算推荐结果用户C评分的物品是b和e,下面计算用户C对物品a,c
2021-04-20 09:10:57
1648
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人