Finetuner+：为企业实现大模型微调和私有化部署

原创

已于 2023-04-23 21:22:25 修改 · 2.8k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#程序人生

于 2023-04-23 14:22:56 首次发布

Finetuner+ 是一个帮助企业将通用大模型微调为行业专家的工具，确保数据安全并提供定制化服务。通过无监督的二阶预训练、指令微调等技术，Finetuner+ 可以在金融、汽车营销等领域提高模型的领域适应性。此外，其数据并行训练策略保护了数据隐私，提供灵活的部署方式，以满足不同企业的安全需求。

如 ChatGPT、GPT4 这样的大型语言模型就像是你为公司请的一个牛人顾问，他在 OpenAI、Google 等大公司被预训练了不少的行业内专业知识，所以加入你的公司后，你只需要输入 Prompt 给他，介绍一些业务上的背景知识，他就能马上上手干活了。然而，由于这个顾问专家不是你们公司所独有的，最重要的是你们之前没有签订任何数据安全协议，他既不能保证数据安全，也不能保证内容受控不外流。

此外，由于它们都是公有的大型语言模型，可以作为一个基础模型来帮助解决一些基本问题，但是当您需要更好地应对特定领域的问题时，比如法律领域内的专业案例分析时，它的回答就不够理想了。尤其对于变化快、专业词汇复杂的领域时，这类大模型的回答就会显得不够令人满意了，甚至常有事实性错误发生。

随着这些大型语言模型、文本图像生成模型在各行各业的应用越来越广泛，我们如何在既享有公有的 ChatGPT 知识和能力的基础上，再微调训练出一个 私有化部署的、数据安全的、更擅长特定行业应用的 ChatGPT 或 Midjourney，让它能更好地服务企业自己或客户使用呢？

而这就是我们推出 Finetuner+ 的原因：让通用的大模型转变为客户所在行业的专家。我们将根据客户的数据和需求，对这类通用大型语言模型进行定制化微调，让它更适合解决客户所在行业的问题。并且将微调权重完全保留在客户组织的基础设施内。也就是说，微调后的模型将完全部署在企业的内网里，从而大大降低了数据泄露的风险。