【炼丹手记】在ModelArts上使用AI芯片Ascend训练基于MindSpore的DeepFM

最新推荐文章于 2025-07-04 11:09:14 发布

原创

最新推荐文章于 2025-07-04 11:09:14 发布 · 1.2k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #深度学习

本文档记录了如何在ModelArts平台上，利用AI芯片Ascend进行基于MindSpore的DeepFM模型训练。首先介绍了DeepFM模型在CTR预测中的应用，接着详细阐述了数据集的获取与预处理过程，包括遇到的问题和解决方案。然后，描述了训练代码的上传、训练作业的创建和执行，最后提到训练完成后模型在AI Gallery的发布。

论文

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
https://arxiv.org/abs/1703.04247

CTR预估是目前推荐系统的核心技术，其目标是预估用户点击推荐内容的概率。
在CTR预估任务中，特征非常重要。
这篇论文提出的DeepFM模型是一种可以从原始特征中抽取到各种复杂度特征的端到端模型，可以有效避免人工特征工程的困扰。

数据集

criteo是非常经典的点击率预估比赛数据集。
下载地址如下：
http://go.criteo.net/criteo-research-kaggle-display-advertising-challenge-dataset.tar.gz

数据集预处理

准备数据和代码

把准备好的数据集从OBS复制到ModelArts。

import moxing as mox
mox.file.copy_parallel("obs://dataset-city/recommend-criteo/data", "/cache/criteo_ori")

把准备好的代码也从OBS复制到ModelArts。

mox.file.copy_parallel("obs://2021-ms-models/deepfm/", "/home/ma-user/work/deepfm")

预处理

用下面的命令，进行数据预处理。

python -m src.preprocess_data --data_path=/cache/criteo_ori/ --dense_dim=13 --slot_dim=26 --threshold=100 --trai

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

UnseenMe

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【炼丹手记】在ModelArts上使用AI芯片Ascend训练基于MindSpore的图神经网络BGCF，并发布到AI Callery

UnseenMe的博客

12-26

1063

论文贝叶斯图协同过滤（BGCF）论文原文如下 https://dl.acm.org/doi/pdf/10.1145/3394486.3403254 数据集 amazon sh-4.4$git clone -b r1.5 --depth=1 https://gitee.com/mindspore/models.git Cloning into 'models'... remote: Enumerating objects: 7254, done. remote: Counting objects: 100

华为云实验-Alexnet

guguu1的博客

02-28

1008

华为云实验-Alexnet 实验步骤首先讲数据集上传至OBS，在OBS中上传至云端，具体实现如下： import moxing as mox dataset_url = “obs://wkkk/flower_data/” mox.file.copy_parallel(dataset_url,"./) 其中./为当前文件夹，…/为上一级文件夹。在Terminal里输入： cd work ls python train.py 训练结束后得到结果最好的模型Alexnet.pth保存到当前文件夹。 !]

参与评论您还未登录，请先登录后发表或查看评论

【本地Mindspore代码迁移至华为云ModelArts平台训练】

qq_37652891的博客

11-20

1700

本地Mindspore代码迁移至华为云ModelArts平台训练前提：本地代码能正常运行 1、上传代码和数据集至华为云OBS 注册华为云OBS账号并使用AK登录。参考这篇文件OBS账号注册和登录修改MindSpore本地训练代码文件，新增以下代码，目的是动态获取在控制台上输入的路径，而不是写在代码里面的静态路径。 # 创建解析 parser = argparse.ArgumentParser(description="train flower",

MindSpore入门--跑通DeepFM模型训练经验

kewei chen

02-10

2071

MindSpore入门–跑通DeepFM模型 A Practice of MindSpore – DeepFM MindSpore入门–跑通DeepFM模型本文开发环境如下 ModelArts Notebook Ascend*8 本文主要内容如下环境准备数据准备模型训练发布算法 1. 环境准备注意事项：本次笔者基于Ascend进行8卡运行，并且配置了500G的云硬盘。8卡主要作用是防止内存溢出，导致预处理时进程被Killed 1.1 克隆仓库并进入到本地deepfm

[学习笔记]在ModelArts上利用Ascend引擎训练基于MindSpore-0.5的YOLOv3

UnseenMe的博客

08-10

1312

关键字：昇腾头孢云训练 Baseline 传送门：Github上mindspore 0.5版的YOLOv3 适配云端训练 Baseline的代码在本地训练的话，不需要更改。但在ModelArts上训练的话，需要适配一下。首先，需要引用一个库方便OBS数据Copy。还要声明两个地址 import moxing as mox local_data_url = '/cache/data' local_train_url = '/cache/train_url' 其次，需要在parser增加两个参数，如下

【人工智能】 人工智能的炼丹炉：大模型训练的技术革命

最新发布

一个被知识诅咒的人

07-04

475

人工智能的飞速发展得益于大模型训练技术的突破，这些技术如同现代“炼丹炉”，将海量数据、复杂算法与强大算力融合，炼制出具备卓越能力的模型。本文深入剖析大模型训练的核心技术，包括数据预处理、Transformer架构优化、分布式训练、混合精度训练及超参数调优。通过大量Python代码示例、详细注释和数学公式，揭示如何利用PyTorch、DeepSpeed等框架实现高效训练。本文还探讨训练中的挑战与解决方案，为研究者和开发者提供全面的技术参考。

AI绘画Stable Diffusion 终极炼丹攻略教程-训练你的专属Lora模型！

mate1357的博客

06-20

943

文章包含了Lora的功能介绍，炼丹方法，实操案例，大家只要跟着一步一步操作，一定能学会。当这两样东西结合在一起，你才能真正的使用 SD，不管是为自己量身定做一个真人，还是为一个商业产品做一个模型，都能做到。Lora所需的数据非常少，比起大型的模型，要容易得多。”之后，还只是在“玩”这个层次上徘徊。但是，我认为，最重要的，还是要让所有人都能“用”到它。在 SD里面，可以生成这样一张大图，可以直观地看到所有模型在不同权重下的效果。“普适性”指的是 Lora在照片中可以随意改变自己的发型，发色，衣服等等。

《AI大模型应用》--阿里巴巴通义千问AI PaaS大模型、炼丹炉大模型、ChatMemo接入、模型训练.zip

07-15

阿里巴巴通义千问AI PaaS大模型、炼丹炉大模型、ChatMemo接入、模型训练、VUE页面部署、后端部署、对接阿里云通义千问、语音转文本、简易搭建通义千问大模型聊天功能（支持PC端、移动端）个人深耕AI大模型应用领域...

[MindSpore]Ascend310处理器上推理MindIR模型的流程以及小技巧

weixin_43586408的博客

11-29

1517

目录前言一、Ascend310处理器上推理MindIR模型的流程二、遇到的问题三、离线推理的一些小技巧总结前言近期参加了华为的众智计划进行了网络的开发，第一次接触到了310推理，一路开发下来还算顺利，但还是遇到了一些问题，所以还是想写一篇文章记录和分享一下。一、Ascend310处理器上推理MindIR模型的流程其实这个离线推理的过程在mindspore官网上有一个很详细的介绍，如果有很想了解的推荐取mindspore官网上查看其教程，或者可以上华为mindspore/models仓库里查看别

kaggle-display-advertising-challenge-dataset下载403 Forbidden

qq_38941327的博客

11-27

5574

网址：https://www.kaggle.com/c/criteo-display-ad-challenge/data Download Kaggle Display Advertising Challenge Dataset - Criteo Engineering 这两个用cmd还是下面的直达地址都是 403，好像是因为他们的托管云不好使了；然后没办法直接找了一个其他人的备份，感谢： Criteo_dataset | Kaggle ...

kaggle广告比赛思路

05-24

kaggle比赛3 Idiots' Approach for Display Advertising Challenge YuChin Juan, Yong Zhuang, and Wei-Sheng Chin NTU CSIE MLGroup

Advertising数据集下载

07-04

Advertising.csv 是机器学习中线性回归算法中双特征的典型数据集，希望喜欢。

Kaggle ： Display Advertising Challenge( ctr 预估 )

热门推荐

hero_fantao的专栏

01-15

3万+

CriteoLabs kaggle 展示广告ctr预估比赛

如何使用modelarts训练海量数据

华为云官方博客

09-04

4277

在modelarts上使用notebook上使用evs空间默认大小是5G，能满足大部分文本和图片训练模型的需求。如果训练数据稍微超过这个限额，可以适当的扩增下空间。但如果训练对象是视频，或是实际生成过程中的海量数据，这个空间就显得小了，这时候扩增evs空间就显得很不经济了。最近老山便碰到这样的案例，客户的训练数据大约在1T的量级，在obs上存储的数据结构大概如下图所示。 your-obs-...

用obs移动文件和文件夹

kewei chen

02-07

1203

移动文件 import moxing as mox mox.file.copy('vocaug_mindrecords', 'obs://ms-models/deeplabv3-input/') 文件夹 import moxing as mox mox.file.copy_parallel('obs://bucket_name/sub_dir_0', 'obs://bucket_name/sub_dir_1')

gitblog_00114的博客

01-10

348

【亲测免费】 Kaggle 2014 Criteo 开源项目教程

gitblog_00096的博客

10-10

660

Kaggle 2014 Criteo 开源项目教程 1. 项目介绍 Kaggle 2014 Criteo 项目是一个基于机器学习的广告点击预测竞赛项目。该项目使用了名为“field-aware factorization machines”（字段感知因子分解机）的模型，通过LIBFFM库实现。项目旨在通过处理和分析大规模数据集，提升广告点击预测的准确性。主要特点使用LIBFFM模型进行特征分...

《自然语言处理》-文本生成实验（基于MindSpore），避免的坑，保姆式教学

weixin_43575647的博客

03-28

2996

自然语言处理-文本生成实验-华为mindspore框架

ModelArts基本操作

suiyuan2009的专栏

05-02

2679

下载OBS文件到notebook import moxing as mox mox.file.copy_parallel('s3://obs-aifood-bj4/aifood', 's3://obs-aifood-baseline/aifood') print('Copy procedure is completed.')

如何在炼丹平台AutoDL上运行和使用so-vits-svc，使用中文回答

04-01

在炼丹平台AutoDL上运行和使用so-vits-svc，可以按照以下步骤进行： 1. 登录AutoDL平台，进入“创建任务”页面。 2. 在“选择算法”中选择“自定义算法”。 3. 在“自定义算法”页面中，选择“上传代码包”，上传所需的代码包和数据集。 4. 选择“运行环境”，可以选择已有的环境或者自定义环境。 5. 在“运行参数”中，设置算法的超参数和其他参数。 6. 点击“运行任务”按钮，即可开始运行算法。需要注意的是，so-vits-svc是一个基于PyTorch的模型，因此需要在运行环境中安装PyTorch和相关依赖库。在运行任务前，需要确保上传的代码包和数据集已经正确配置，并且运行参数已经设置好。运行完成后，可以查看算法的输出结果和日志信息。