
人工智能
文章平均质量分 91
人工智能前言技术
fpga和matlab
专业即算法,算法即数学,数学即万物。从事MATLAB算法仿真工作15年,从事FPGA系统开发工作12多年。擅长解决各种算法仿真、建模、通信、图像处理、AI、智能控制等各专业问题。
展开
-
字节跳动COMET:MoE架构优化技术解析
在人工智能领域,随着模型规模与复杂度不断攀升,高效的模型架构优化技术成为关键。字节跳动开发的 COMET(Computation-communication co-Execution for Mixture-of-Experts Training),针对混合专家模型(MoE,Mixture of Experts)架构,有效解决了分布式训练中通信开销过大的难题,显著提升训练效率并降低成本。原创 2025-03-15 17:23:07 · 985 阅读 · 0 评论 -
DeepSeek开源周开源的五个项目分析
实验数据表明,使用 DualPipe 能够将训练效率提升200% 左右,同时仅增加了1倍的激活内存峰值,在提升训练效率的同时,对内存资源的增加相对可控,使得在有限的硬件资源下能够更高效地训练大规模模型。通过采用EPLB,在大规模专家并行的应用中,能够将GPU的利用率提升至80%以上,最大限度地减少训练时间。例如,在一个具有大量专家的MoE模型训练任务中,使用EPLB后,训练时间相比未使用时缩短了30% - 50%,大大提高了模型的训练效率,降低了训练成本,同时也提高了模型在推理阶段的响应速度和性能稳定性。原创 2025-03-04 20:54:45 · 3813 阅读 · 3 评论 -
deepseek指令使用方法总结
目录1.基础指令1.1直接提问1.2内容生成1.3总结与解释2.格式控制指令2.1指定输出格式2.2结构化输出3.参数调整指令3.1 控制输出长度3.2 调整风格与语气3.3温度参数(创造性控制)4.高级功能指令4.1多轮对话控制4.2角色扮演4.3逻辑运算与数据分析5.优化与修正指令5.1迭代优化5.2错误修正6.特殊场景指令6.1多语言支持6.2安全边界设置7.实用技巧7.1复合指令7.2优先级符号7.3参考范例8.常见问题处理DeepSeek-R1作为一款源自国内的创新性大型模型,被视作国产 AGI的原创 2025-02-17 18:56:39 · 3048 阅读 · 1 评论 -
DeepSeek本地部署
DeepSeek的高性价比策略降低了AI部署的门槛,使得更多企业能够将AI技术应用于边缘计算场景。并且随着算力部署成本的降低,以前不少集中在大型中心的算力需求,有望向更多的小型设备、边缘设备集中,这是因为,DeepSeek的轻量化模型能够适应从高端服务器到普通消费级设备的多种场景。这意味着,边缘计算设备,如智能网联设备、工业质检设备、智慧交通设备等,将能够更好地支持AI应用。在部署前,我们首先要了解不同规模的deepseek对硬件的要求:下面我们以1.5B为例,介绍如何在本地进行部署。原创 2025-02-08 17:21:50 · 2636 阅读 · 0 评论 -
大模型蒸馏技术的理论分析与应用
模型蒸馏(Model Distillation)是一种在深度学习中用于压缩模型和提高模型效率的技术。其核心思想是将一个复杂的、性能较高的教师模型(Teacher Model)的知识迁移到一个相对简单的学生模型(Student Model)中,使学生模型能够在保持较好性能的同时,具有更小的模型规模和更快的推理速度。:教师模型通常在大规模数据上进行训练,学习到了丰富的特征表示和知识。通过模型蒸馏,将教师模型的这些知识传递给学生模型,帮助学生模型更好地学习和泛化。原创 2025-02-01 03:32:22 · 1463 阅读 · 0 评论 -
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
DeepSeek-VL:DeepSeek-VL2 系列有 DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2,分别具有 10 亿、28 亿和 45 亿个激活参数。DeepSeek-V2:基于高效且轻量级的框架 HAI-LLM 进行训练,采用 16-way zero-bubble pipeline 并行、8-way 专家并行和 ZeRO-1 数据并行。DeepSeek-VL:训练过程包括视觉-语言对齐、视觉 - 语言预训练、监督微调(SFT)三个阶段。原创 2025-01-29 23:07:55 · 11770 阅读 · 0 评论 -
DeepSeek-V3原理介绍与性能分析
DeepSeek-V3主要涉及到创新点包括混合专家(MoE)架构,多头潜在注意力(MLA)机制,多 Token 预测(MTP)训练目标,FP8混合精度训练框架,训练与部署效率的协同优化以及后训练阶段的创新知识蒸馏。原创 2025-01-26 15:28:50 · 5532 阅读 · 0 评论 -
无线通信与人工智能技术与发展年度总结
太赫兹波(Terahertz wave,简记为 THz),其频段覆盖范围处于100GHz 至10THz之间,所处位置介于微波与远红外区域之间,如下图所示。 这一频段蕴藏着极为丰富、但尚未得到充分挖掘的频谱资源。太赫兹波具有独特的物理特性,它能够顺利穿透非极性分子材料以及非金属复合材料 ,而且对分子的振动和转动能级具备卓越的光谱分辨能力。鉴于太赫兹频段拥有超大带宽的频谱资源,能够有力支持超高速率的无线通信,因此,它被视作6G 实现太比特每秒(Tbps)通信速率的关键空中接口技术备选方案之一。原创 2025-01-22 18:31:33 · 2384 阅读 · 10 评论 -
DDPG深度确定性策略梯度强化学习控制系统matlab仿真实现
DDPG(Deep Deterministic Policy Gradient)是一种用于连续动作空间的无模型强化学习算法。它结合了深度神经网络和确定性策略梯度定理,能够有效地学习到最优策略。该算法的目标是在环境中找到一个最优策略,使得智能体(agent)能够最大化累积奖励。原创 2025-01-15 15:22:19 · 1385 阅读 · 0 评论 -
GPT可以写python,可以写java,好像写不出高质量RTL
GPT是一款强大的语言模型,其在生成自然语言文本、解答各类问题、进行多轮对话等方面展现出卓越的能力。然而,当涉及到编写高质量的RTL(Register Transfer Level)代码时,可能会面临一些挑战,导致其难以达到预期的效果。RTL代码是硬件设计中用来描述数字逻辑电路行为的一种低级硬件描述语言(如Verilog或VHDL),它需要满足严格的规范性和工程实践要求。原创 2024-04-05 22:22:38 · 1631 阅读 · 2 评论 -
常用深度学习模型理论简介
在机器翻译(如Google的Transformer论文)、文本分类、问答系统、文本生成等领域取得革命性进展,是现代NLP模型(如BERT、GPT系列)的基础。近年来兴起的一种生成模型,基于扩散过程逐步将高斯噪声转化为数据样本可以用于图像生成、图像编辑、音频合成、3D形状生成等任务,以其高质量生成效果和可控性受到关注。卷积神经网络(Convolutional Neural Network, CNN)是一种特殊的深度神经网络,专为处理具有网格结构(如图像、视频、音频波形、序列数据等)的数据而设计。原创 2024-04-05 21:28:21 · 3975 阅读 · 0 评论 -
GPT-4在SORA中的应用原理
Sora是一个先进的AI模型,它能够将文本描述转化为相应的视频内容。这种能力意味着你可以给Sora一个故事、一个场景描述,甚至是一个简单的想法,Sora都能将其变为一段生动的视频。这不仅代表了数据处理和视频生成技术的重大突破,也展现了AI在理解和创造视觉内容方面的巨大潜力。Sora的出现是AI在文本到视频转换方面的一大步。原创 2024-03-26 04:12:12 · 1493 阅读 · 0 评论 -
Sora技术原理简要分析
Sora 技术以其创新的“扩散+Transformer”混合模型为核心,能够生成高质量的视频内容。以下是对Sora技术路线的主要特点和技术原理的概述。原创 2024-03-24 20:18:46 · 3953 阅读 · 0 评论