
大模型
文章平均质量分 68
大模型
小鹏AI
深度学习算法工程师,主攻深度学习模型优化部署,辅攻图形图像算法调优。
软件设计师、英伟达Jeston Nano专家认证。
展开
-
追溯ChatGPT
text-davinci-003 恢复了(但仍然比code-davinci-002差)一些在text-davinci-002 中丢失的部分上下文学习能力(大概是因为它在微调的时候混入了语言建模) 并进一步改进了零样本能力(得益于RLHF)。详实的回应:text-davinci-003 的生成通常比 text-davinci-002长。Code-davinci-002 是基础模型,text-davinci-002 是指令微调 code-davinci-002 的产物(见 OpenAI 的文档)。原创 2023-03-01 23:45:00 · 3371 阅读 · 0 评论 -
MLC LLM:将大模型运行在手机端的部署工具
MLC LLM依赖于开源生态系统,更具体地说,是 TVM Unity,这是 TVM 项目中一个令人兴奋的最新发展,它支持 Python 优先的交互式 MLC 开发体验,使我们能够轻松地用 Python 编写新的优化,并逐步将我们的应用带到感兴趣的环境中。利用优化,如融合量化内核,一流的动态形状支持和不同的 GPU 后端。提供了一个轻量级的基于 C + + 的示例 CLI 应用程序,它展示了如何包装已编译的构件和必要的预/后处理,这将有望澄清工作流程,以便将它们嵌入到本地应用程序中。原创 2023-05-01 13:46:18 · 5001 阅读 · 1 评论 -
7B的模型有多大?
7B的模型有多大?原创 2025-01-14 11:53:05 · 962 阅读 · 0 评论