Phi-4 Technical Report

本文是LLM系列文章,针对《Phi-4 Technical Report》的翻译。

摘要

我们介绍了phi-4,这是一个140亿参数的语言模型,使用集中关注数据质量的训练配方开发。与大多数语言模型不同,在大多数语言模型中,预训练主要基于网络内容或代码等有机数据源,而phi-4在整个训练过程中战略性地整合了合成数据。虽然Phi家族的先前模型在很大程度上提取了教师模型(特别是GPT-4)的能力,但Phi-4在以STEM为重点的质量保证能力方面大大超越了教师模型,这证明了我们的数据生成和训练后技术超越了蒸馏。尽管phi-3架构的变化很小,但由于改进了数据、训练课程和训练后方案的创新,phi-4相对于其规模实现了强大的性能,特别是在以推理为中心的基准测试中。

在查找的参考内容中,虽未直接提及在C#中使用Phi - 4的方法,但有在C#环境中对Phi系列模型操作的相关信息。可以借鉴在C#环境中使用Phi系列模型的方法来尝试使用Phi - 4。 在Phi - 3 CookBook项目中有在C#环境实现Phi - 4 mini函数调用功能的相关探讨,函数调用允许模型与外部系统交互,执行特定任务。同时,Phi - 3 Cookbook存储库展示了在.NET环境利用Phi系列模型执行问答和图像分析等任务的方法,这些项目使用Microsoft.ML.OnnxRuntime库加载本地ONNX Phi - 3或Phi - 3 Vision模型 [^1][^2]。 可推测在C#中使用Phi - 4可能步骤如下: 1. 确保已安装Microsoft.ML.OnnxRuntime库,该库可用于加载本地ONNX格式的Phi - 4模型。 2. 准备Phi - 4的ONNX模型文件,存于本地合适路径。 3. 使用C#代码加载模型并进行推理,示例代码如下: ```csharp using Microsoft.ML.OnnxRuntime; using Microsoft.ML.OnnxRuntime.Tensors; using System; using System.Collections.Generic; class Program { static void Main() { // 加载本地ONNX Phi - 4模型 var sessionOptions = new SessionOptions(); var session = new InferenceSession("path/to/your/phi - 4.onnx", sessionOptions); // 准备输入数据 var inputTensor = new DenseTensor<float>(new float[] { 1.0f, 2.0f, 3.0f }, new int[] { 3 }); var inputs = new List<NamedOnnxValue> { NamedOnnxValue.CreateFromTensor("input_name", inputTensor) }; // 进行推理 using (var outputs = session.Run(inputs)) { // 处理输出 foreach (var output in outputs) { var outputTensor = output.AsTensor<float>(); Console.WriteLine($"Output: {outputTensor[0]}"); } } } } ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值