思腾云计算

去年世界人工智能大会上,中国大模型数量显著增长,其中昇腾AI支持了大量创新。华为推出昇腾伙伴网络,通过Atlas300系列(Tpro、Vpro、IPro)展示了高度集成、超强算力和高效能的AI训练、视频解析和推理解决方案,推动国产算力的发展。

去年世界人工智能大会(WAIC 2022)上,只有屈指可数的几家大厂推出大模型,但在科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布79个,几乎进入“百模大战”。

而中国有一半左右的大模型创新,都是由昇腾AI来支持的,开发者数量从90万到180多万,原生孵化和适配30多个大模型,已发展1200多家ISV(独立软件开发商),联合推出2500多个行业AI解决方案。昇腾AI正是国内唯一一个完成千亿参数大模型训练并商用的系统。

此外,华为推出“昇腾伙伴网络”(简称APN)合作伙伴计划,将通过总经销商供货的销售支持、华为与总销售商双方的技术支持模式,思腾合力凭借多年在AI行业的积累和自身的实力成为首家签署APN合作协议的公司,共同打造基于昇腾的软硬件AI基础架构解决方案,推进人工智能国产算力替代的进步和发展。昇腾产品应用覆盖比较全面,产品型号也比较丰富,接下来我们就逐一介绍一下:

Atlas 300T pro

图片

T代表training,训练卡,pro是升级版,其性能特点是:

1. 高度集成:AI算力、通用算力、I/O能力三合一,处理器集成30个华为达芬奇AI Core +16个TaiShan核 + 1 * 100GE RoCE v2网卡。

2. 超强算力:提供业界领先的280 TFLOPS FP16算力。

3. 高速带宽:支持PCIe 4.0和 1*100G RoCE高速接口,出口总带宽56.5 Gb/s;无需外置网卡,训练数据和梯度同步效率提升10%~70%。

4. 32GB HBM内存支持ECC,专为训练设计,训练一个好的模型,需要使用大量数据,内存带宽要够大,内存容量要足够大,相比传统的DDR4内存,HBM内存的带宽可以提高10倍以上,功耗也更低。

 Atlas 300V pro

图片

V代表Video,视频解析卡,pro是升级版,其性能特点是:

1. 内置DVPP预处理单元,它是昇腾AI处理器内置的图像处理单元,提供强大的媒体处理硬加速能力,主要功能包括缩放、抠图、色域转换、图片编解码、视频编解码等。具有超大视频解析路数、高性能特征检索、安全启动等优势,支持128路高清视频实时分析。

2. 48G LPDDR4X 内存容量,LPDDR4X的特点是低功耗、高带宽、高频率,专为视频解析这种高带宽、多路数、视频解析流畅度高的应用场景而设计。

3. 强大的视频编解码能力可广泛应用于智慧城市、智慧交通、智慧园区、智慧金融、智慧制造等诸多AI行业场景。

 Atlas 300I Pro

图片

I代表 Inference, 推理卡,Pro升级款,基于昇腾310 芯片开发最高功耗72W,被动散热,半高半长单宽,达芬奇架构。性能特点:

1.拥有超强算力:单卡最大提供140 TOPS INT8算力,为数据中心推理提供更强大支持。

2. 超高能效:提供 2 TOPS/W 超高能效比,达到业界2.1倍。

3. 算力与显存平衡,搭载24G LPDDR4X内存,且支持ECC,保证推理的及时性。

4. 强大的AI 推理性能,可用于:内容审核、搜索推荐、票据识别、信息录入、资料对比、身份证实名认证、电子签名识别、语音识别等应用场景。

### 腾合力服务器使用教程 腾合力服务器的使用教程涵盖了从基础连接到高级任务提交的多个方面。以下内容详细介绍了如何使用腾合力服务器,包括连接服务、作业提交、镜像上传等操作。 #### 1. 连接服务 腾合力服务器支持多种连接方式,例如 SSH、Jupyter 和 PyCharm 等[^1]。以下是每种连接方式的基本步骤: - **SSH 连接** 使用 SSH 客户端连接到服务器,命令格式如下: ```bash ssh username@219.216.99.4 -p 22 ``` 其中 `username` 是用户账号,`219.216.99.4` 是服务器地址,`22` 是默认端口号。 - **Jupyter 连接** Jupyter Notebook 可通过浏览器访问,连接地址为 `http://219.216.99.4:6901`。需要确保服务器已启动 Jupyter 服务,并获取对应的 Token 或密码[^1]。 - **PyCharm 连接** PyCharm 的远程调试配置较为复杂,建议参考官方文档:[PyCharm 配置教程](https://github.com/sitonholy/scm/blob/master/notes/submit_jobs.md)[^1]。具体步骤包括配置远程解释器、同步代码文件和设置调试断点。 #### 2. 作业提交 作业提交是腾合力服务器的核心功能之一。可以通过 Web 界面或命令行工具完成作业提交。以下是一个示例 JSON 文件结构[^2]: ```json { "jobName": "example_job", "image": "219.216.99.4:8888/zhengyan/ubuntu18.04_cuda10.1_cudnn7_py3.6_tf2.3_torch1.6:v1.2", "gpu": 1, "cpu": 4, "memory": "8G", "command": "python train.py" } ``` 将上述 JSON 文件保存为 `job.json`,并通过以下命令提交作业: ```bash curl -X POST -H "Content-Type: application/json" --data @job.json http://219.216.99.4/api/jobs ``` #### 3. 镜像管理 腾合力服务器支持通过 Harbor 仓库管理 Docker 镜像。以下是上传和下载镜像的基本步骤[^3]: - **上传镜像** 1. 登录 Harbor 仓库: ```bash docker login 219.216.99.4:8888 ``` 2. 标记本地镜像: ```bash docker tag local_image:tag 219.216.99.4:8888/namespace/image:tag ``` 3. 推送镜像: ```bash docker push 219.216.99.4:8888/namespace/image:tag ``` - **下载镜像** 1. 登录 Harbor 仓库。 2. 拉取目标镜像: ```bash docker pull 219.216.99.4:8888/namespace/image:tag ``` #### 4. 数据集传输 对于大内存数据集,推荐通过 SCP 或 SSH 协议进行传输[^3]。以下是上传和下载数据集的命令: - **上传数据集** ```bash scp -r /path/to/local/dataset username@219.216.99.4:/path/to/server/directory ``` - **下载数据集** ```bash scp -r username@219.216.99.4:/path/to/server/dataset /path/to/local/directory ``` #### 5. 系统安全与运维 腾合力服务器内置了多层次的安全机制和智能运维功能[^4]。这些功能包括国密算法加密、芯片级根信任、实时监控和故障分类上报等。用户可以通过简洁易用的 Web 管理平台进行系统维护。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值