OpenJAI-v1.0: An Open Thai Large Language Model

该文章介绍了一款针对泰语和英语的开源大型语言模型OpenJAI-v1.0,详细阐述其开发背景、数据与实验设置、评估结果,并指出未来工作方向,创新点集中在数据构建、能力强化及性能平衡上。

一、文章主要内容总结

  1. 模型基础与开发目标
    • 以Qwen3-14B为基础模型,开发支持泰语和英语的开源大型语言模型OpenJAI-v1.0。
    • 核心目标是提升模型在实际任务中的性能,重点强化指令遵循、长上下文理解和工具使用三大核心能力,同时避免灾难性遗忘。
  2. 数据与实验设置
    • 数据集构建:围绕三大核心能力构建高质量数据集,均采用指令-响应格式,且所有样本经过严格筛选或翻译以适配双语需求。
      • 指令遵循数据集:整合公开高质量数据与合成数据,经LLM评估筛选,训练时排除IFBench基准约束以保证零样本泛化评估准确性。
      • 长上下文理解数据集:结合开源数据与合成数据,支持处理长达120,000 tokens的输入,适配RAG任务。
      • 工具调用数据集:整合多场景数据并翻译为泰语,包含单轮/多轮交互及工具调用判断案例。
    • 实验环境:在8xH100 GPU集群上训练,训练数据量约4.62亿tokens,全局批次大小256,训练耗时不到1天。
  3. 评估与结果
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值