- 博客(26)
- 资源 (158)
- 收藏
- 关注
原创 AI领域有哪些名人?今天讲一讲AI教母李飞飞
AI 教父有很多,但 AI 教母只有一个。如果没有她,黄仁勋还在卖游戏显卡,山姆奥特曼还在搞风投,库克还在挤牙膏,现在也在挤 only apple can do。深度学习之父辛顿教授说,她是第一位真正理解大数据力量的人,她打开了深度学习和 AI 技术的闸门。她就是美国三院院士斯坦福女王、全球 AI 华人之光李飞飞。李飞飞如何成长起来的呢?有何不同的经历?
2025-10-17 10:42:35
583
原创 峰哥爆肝整理:大模型微调进阶32问
本文分享了关于大模型微调的25个关键问题及解决方案,涵盖全量微调显存需求、SFT数据构建、领域模型训练、多轮对话微调等核心内容。作者指出,微调应注重数据质量而非数量,推荐使用LoRA等高效方法,并强调混合通用数据以防止灾难性遗忘。文章还探讨了预训练与微调的区别、优化器选择、batch size设置等技术细节,并提供了处理loss突刺等问题的实用技巧。最后总结了微调大模型的"终极心法":精选基座模型、严格把控数据质量、合理配置训练参数,实现从"语言预测器"到"
2025-09-22 17:38:53
776
转载 谷歌AI Agent白皮书:2025年AI智能体时代来临
本文探讨了生成式AI Agent的核心架构与工作原理。Agent通过整合语言模型、工具和编排层,实现了超越基础模型的能力:1)利用工具扩展功能,访问实时数据并执行现实操作;2)采用ReAct、思维链等推理框架进行决策规划;3)通过扩展程序、函数调用和数据存储三种工具类型实现外部系统交互。文章详细解析了Agent的认知架构组成,对比了不同工具的应用场景,并指出目标学习(上下文学习、检索增强、微调)对提升Agent性能的关键作用。最后强调Agent开发需要持续迭代,未来"Agent链"将成为
2025-07-30 00:04:57
124
原创 2025.7.26字节掀桌子了,把coze开源了!!!
【摘要】字节跳动开源AI开发平台Coze,包含CozeStudio和CozeLoop两大核心组件。CozeStudio提供一站式AI智能体开发工具,支持零代码/低代码开发;CozeLoop专注于AI智能体全生命周期管理。两大项目均采用Apache2.0许可证,支持商业使用和私有化部署。此次开源将推动AI代理开发社区共建,降低开发者门槛。开源地址已公布,开发者可立即体验完整功能。
2025-07-26 18:40:10
646
原创 开源语音TTS与ASR大模型选型指南(2025最新版)(疯聊AI提供)
开源语音大模型正重塑智能语音市场格局,TTS(文本转语音)和ASR(语音识别)技术取得显著突破。国产模型Speech-02-HD在TTS领域表现突出,支持32种语言和情感控制,在自然度和音色克隆方面领先。ASR领域,FireRedASR中文识别效果优异,Whisper多语言覆盖广。选型需考虑场景需求,如智能客服推荐Speech-02-HD+FireRedASR组合。未来趋势包括多模态融合、边缘计算和情感计算,但面临数据合规、技术同质化等挑战。开源技术正加速语音AI在各行业的应用渗透。
2025-07-25 14:33:15
9069
原创 实战:一文讲清ASR语音转文本大模型Faster-Whisper部署全过程
之前我们写了一篇《开源语音TTS与ASR大模型选型指南(2025最新版)》,里边埋了一个伏笔,就是我们的项目是用的哪个ASR大模型,本篇就给大家解密,并给大家分享详细的部署过程,相信大家在这过程中可以学到很多东西。
2025-07-23 19:18:45
1764
转载 豆包、midjourney、stable diffusion生图提示词大全
豆包、midjourney、stable diffusion生图提示词大全
2025-07-11 17:25:02
603
原创 一文读懂具身智能(基本概念、发展历程、政策推动、技术体系、产业现状、应用场景、市场现状、创业机会、就业机会、未来趋势)
一文了解具身智能的基本概念、发展历程、政策推动、技术体系、产业现状、应用场景、市场现状、创业机会、就业机会、未来趋势。
2025-06-30 18:22:38
3127
原创 通用专业级大模型部署Docker基础环境的DockerFile构建(九章云极提供)
我们平时训练微调大模型或部署大模型应用时,会通常用到镜像文件,本文提供通用且专业镜像文件,如有其它组件需安装,则可在Dockerfile文末追加。
2025-06-15 11:56:24
961
原创 从零开始:使用SGlang私有化部署满血版DeepSeek-R1实战指南
是一款拥有671B参数规模的推理大模型,其在数学、编程和推理等复杂任务上的表现,已经与当前主流商业大模型不相上下。本文详细介绍如何使用SGlang作为分布式推理方案,并基于Alaya NeW算力云的弹性容器集群,展示DeepSeek-R1私有化部署的最佳实践。通过这种组合,我们旨在提供一个灵活、可扩展且高性能的解决方案,以支持深度学习模型的高效部署与运行。这一方法不仅提升了模型推理的效率,还确保了在私有化环境下的稳定性和安全性。
2025-02-25 15:52:11
3536
原创 基于DeepSeek构建个人级与企业级大模型本地知识库
大模型最典型最成熟的应用非知识库莫属了,构建本地大模型知识库的主流技术组件组合通常围绕检索增强生成(RAG)框架展开,涵盖前端交互、向量存储、嵌入模型、推理大模型等核心模块。本文介绍基于大模型构建本地知识库的技术原理,特别是RAG原理,并演示操作个人用的基于轻量版Cherry studio及企业级Dify的知识库构建方案,通过本文档的学习,您可以建设自己个人的或企业级的知识库。
2025-02-25 13:54:34
1791
原创 DeepSeek-R1比肩OpenAI o1,再一次惊艳世人
当我们还沉浸在大模型的价格杀手、开源之光DeepSeek-V3的惊喜中,DeepSeek于2025年1月20日又再一次让我们吃了一惊,发布了DeepSeek-R1,性能直接对标OpenAI o1,是全球唯一一个可以与其较劲的大模型。此次发布的DeepSeek-R1还是将模型权重一并开源,有实力就是豪横!
2025-01-30 10:41:33
1482
原创 DeepSeek-V3——国产AI黑马如何用“东方魔法”颠覆全球AI格局?
DeepSeek V3出现的基本情况、国内外业内人士对DeepSeek-V3的看法、DeepSeek-V3背后的团队介绍、DeepSeek-V3牛在哪里、如何使用DeepSeek-V3、DeepSeek-V3有哪些不足、DeepSeek-V3对行业的影响等内容。
2025-01-30 08:37:54
1467
### 【美国人工智能政策】2025年美国人工智能行动计划:创新、基础设施与国际安全战略布局
2025-07-28
基于DeepSeek构建个人与企业大模型本地知识库-技术原理、方案选型及实操详解
2025-02-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅