
人工智能
文章平均质量分 91
上海名猿小王
天下风云出我辈,一入代码岁月催。
展开
-
DeepSeek专业研究报告(三)
DeepSeek的出现,以其“开源+高性价比+强推理力”的模式,打破了过去闭源大模型垄断、疯狂砸算力才能出成果的固有观念。它在不依赖顶级GPU资源的情况下,通过多层次创新(数据自学习、MoE架构、HAI-LLM框架、PTX底层编程)打造出与GPT-4等闭源大模型接近或相当的竞争力。这种“平权化”与“普惠化”路径,不仅对中小企业、科研机构意义重大,也在国际AI竞争格局中提供了宝贵范例。未来,大模型将向更高水平的多模态、工具调用、国际化合规与产业落地深耕迈进;开源与闭源的博弈也会继续演化。原创 2025-02-14 15:10:31 · 1010 阅读 · 0 评论 -
DeepSeek专业研究报告(二)
针对混合精度场景,DeepSeek开发了自定义GEMM(通用矩阵乘法)内核,支持FP8/FP16转换及保留必要的数值精度校正。通过这些优化,GPU的寄存器和共享内存利用率提升,理论上可比标准CUDA库快10%~20%。原创 2025-02-14 14:58:13 · 538 阅读 · 0 评论 -
DeepSeek专业研究报告(一)
DeepSeek(中文名“深度求索”)由幻方量化创始人梁文锋于2023年7月发起。梁文锋本身拥有量化金融与大数据分析的深厚背景,曾在高频交易、机器学习等领域积累了丰富经验。DeepSeek从成立伊始便确立了“打造低成本、高性能、全面开源的大语言模型”的目标,试图在高昂成本与闭源为主导的国际大模型市场中,提供一条“平价又开源”的替代方案。DeepSeek的产品线分为两大系列:V系列(V2、V3)和R系列(R1)。V系列更偏通用对话与内容生成,R系列主打深度推理与逻辑思维。原创 2025-02-14 14:51:51 · 986 阅读 · 0 评论 -
《ChatGPT中文提示词(prompt)》入门必学!
提示词(Prompt)是一种向人工智能系统(如ChatGPT等)提供的输入,用于引导和激发AI生成特定的回应或内容。根据提供的提示,AI系统将结合其训练数据和内置算法来生成相应的回答、细节或其他相关信息。原创 2023-05-19 21:01:25 · 12129 阅读 · 2 评论