推荐系统
文章平均质量分 78
广漂一枚
来自遵义酒都的广漂族,多年大厂经验,等混不下去就回家卖酒,哈哈...
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
1.4 机器学习-K 近邻算法(代码干货)
K近邻算法(KNN)是一种基于实例的机器学习方法,其核心思想是"物以类聚"。在分类问题中,通过多数投票原则确定新样本类别;在回归问题中,通过取K个最近邻的平均值预测目标值。算法实现包含三个关键要素:K值选择、距离度量和决策规则。本文详细介绍了KNN在分类(如乳腺癌预测)和回归(如波士顿房价预测)任务中的应用流程,包括数据加载、切分、特征标准化、模型训练与评估,并展示了如何保存和加载模型。评估指标方面,分类任务使用准确率,回归任务则采用MAE、MSE和RMSE。原创 2025-08-28 14:27:43 · 302 阅读 · 0 评论 -
deepseek+“D-id”或“即梦AI”快速生成短视频
学会高效使用工具,deepseek+“D-id”或“即梦AI”快速生成短视频原创 2025-02-11 23:55:57 · 3815 阅读 · 0 评论 -
deepseek+即梦一键生成海报
访问deepseek官方网站:https://www.deepseek.com/原创 2025-02-15 19:13:09 · 1528 阅读 · 0 评论 -
deepseek+kimi一键生成PPT
轻松使用大模型工具高效办公,deepseek+kimi一键生成PPT,让你不再为领导要求而烦恼。原创 2025-02-11 22:23:07 · 9890 阅读 · 0 评论 -
机器学习-数据预处理(附完整代码)
在进行数据挖掘中,原始海量的数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以对首先对数据进行清洗就显得尤为重要,在数据清洗完成后,后续伴随着数据集成、转换、规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。原创 2025-02-07 00:02:16 · 4027 阅读 · 1 评论 -
机器学习-学习算法
机器学习。原创 2025-01-16 23:03:17 · 908 阅读 · 0 评论 -
机器学习训练方式和三要素
判别模型是对数据输出做判别的模型,多用于监督学习,尤其适合。继续编辑。原创 2025-01-16 23:02:26 · 1538 阅读 · 0 评论 -
机器学习-数据标注(二)
是指三维数据的一种重要表达方式,通过激光雷达等传感器,能够采集到各类障碍物以及其位置坐标,而标注员则需要将这些密集的点云分类,并标注上不同属性,常应用于。数据标准是通过分类、画框、标注、注释等,对图片、语音 、文本等数据进行处理,标记对象的特征,以作为机器学习基础素材的过程。、语义分割、实例分割、 目标检测、图像分类、关键点、线段标注、文字识别转写、点云标注、属性判断等。负责对文本、图像、语音、视频等标注数据进行归来、整理、编辑、标记和批注。是对事物属性进行标签,属性标注包括:文本类别、新闻、娱乐等。原创 2025-01-16 23:01:42 · 1987 阅读 · 0 评论 -
spark读写minio文件代码实践
Minion作为一个先进的对象存储方案,对于大数据和人工智能的支持有着天然的优势。它支持与Spark\Flink等技术方案进行整合,并且通过S3协议实现数据查询的下沉,这让大数据的存储与查询分离提供了事实依据。(2) 根据部署的minio服务的信息(如端口、Access Key、Secret Key、存储桶名称等),创建一个SparkSession对象,可以使用如下步骤进行读写Minio。(1) 首先,需要部署minio服务集群,搭建minio对象存储桶,可以参考我的文章。原创 2023-08-14 22:29:46 · 1841 阅读 · 0 评论 -
推荐系统-ALS协同过滤算法代码实现
从协同过滤的分类来说,ALS(Alternating Least Squares,交替最小二乘)算法属于User-Item CF,也叫做混合CF,它同时考虑了User和Item两个方面。用户和物品的关系,可以抽象为如下的三元组:。其中,Rating是用户对商品的评分,表征用户对该商品的喜好程度。ALS算法是基于模型的推荐算法,,评估出缺失项的值,以此来得到一个基本的训练模型,然后依照此模型可以针对新的用户和物品数据进行评估。原创 2023-07-27 22:19:27 · 975 阅读 · 0 评论 -
推荐系统-基于标签的Top-N个性化推荐代码实现
本文主要探讨如何利用用户打标签的行为为其推荐物品,UGC标签系统受到越来越多的关注,标签既能反映用户的兴趣又能描述物品的本身特征。原创 2023-07-18 22:25:41 · 1704 阅读 · 0 评论 -
推荐系统-基于物品协同过滤算法代码实现
当前Spark没有像mahout那样,严格区分基于物品的协同过滤推荐(ItemCF)和基于用户的协同过滤推荐(UserCF),只有基于模型的协同过滤推荐算法ALS(model-based CF)。但ALS算法对于一些特定的问题(用户数量较小的场景,以及物品数量明显小于用户数量的场景),效果并不理想,不像mahout提供了各种推荐算法选择。为了充分利用spark在速度上带来的提升同时为满足一些业务需求,于是使用spark构建ItemCF算法。原创 2023-08-02 23:29:26 · 717 阅读 · 0 评论 -
推荐系统-基于领域的协同过滤算法选择(一文足矣)
为什么新闻推荐使用UserCF算法,而购物网站使用ItemCF算法?原创 2023-03-12 13:26:39 · 762 阅读 · 1 评论
分享