SK Telecom发布韩语优化大语言模型A.X 3.1,引领韩国主权AI技术突破

SK Telecom发布韩语优化大语言模型A.X 3.1,引领韩国主权AI技术突破

【免费下载链接】A.X-3.1 【免费下载链接】A.X-3.1 项目地址: https://ai.gitcode.com/hf_mirrors/skt/A.X-3.1

2025年7月24日,韩国电信巨头SK Telecom(以下简称SKT)正式对外发布了新一代大语言模型A.X 3.1(发音为“A dot X”)。这款被誉为“韩国主权AI”的突破性产品,是SKT完全自主研发的里程碑式成果,从底层架构设计、多维度数据筛选到全流程训练过程均由其内部团队独立完成,并依托SKT自主构建的超级计算基础设施TITAN实现高效训练。该模型以韩语理解与企业级应用为核心定位,通过2.1万亿tokens的高质量多语言语料从头训练,在保持相对紧凑训练规模的同时,实现了韩语处理能力的全面跃升,为韩国AI产业发展注入强劲动力。

A.X-3.1大语言模型品牌标志,包含英文“A.X”、韩文“에이닷엑스”及“From Scratch”字样,体现SKT自主研发的主权AI定位。 如上图所示,品牌标志中“From Scratch”字样直观彰显了A.X 3.1从底层架构到训练流程的完全自主属性。这一设计不仅强化了SKT在AI技术自主可控领域的领先地位,更为韩国企业级用户选择本土AI解决方案提供了清晰的技术信任背书。

作为真正意义上的韩国主权AI模型,A.X 3.1在数据安全与技术自主性方面构建了双重护城河。其训练数据筛选工作由SKT内部专业团队全程把控,通过多层级质量审核机制确保数据来源合规性与内容安全性,同时依托SKT专有GPU集群完成模型训练,从根本上杜绝了核心技术依赖外部基础设施的风险。在性能优化方面,该模型展现出惊人的训练效率——在仅使用2.1万亿tokens训练数据的情况下(约为同类多语言模型训练量的60%),通过创新的注意力机制优化,实现了韩语处理性能的超越。韩国权威语言评估基准KMMLU测试结果显示,A.X 3.1以69.2分的成绩大幅领先其他韩语专用模型,在CLIcK韩语文化语境理解基准中更是取得77.4分的优异成绩,充分验证了其对韩国语言细微差异和文化背景知识的深度掌握。

企业级部署优势是A.X 3.1的另一大亮点。通过精细化的token压缩算法,该模型在处理同等韩语输入时比GPT-4o节省约33%的tokens消耗,直接降低企业用户的推理计算成本。上下文窗口方面,A.X 3.1原生支持32,768 tokens的超长文本处理能力,配合SKT自主研发的YaRN扩展技术,可将上下文长度进一步拓展至131,072 tokens,相当于一次性处理约65万字的韩文文本,为法律合同分析、学术论文综述、企业知识库构建等长文本应用场景提供了强大支撑。

技术架构层面,A.X 3.1采用340亿参数的优化模型结构,包含48层Transformer网络、8个KV-Heads注意力头设计,隐藏层维度达8192,前馈网络维度21824,形成兼顾性能与效率的神经网络配置。训练数据体系构建上,SKT从20万亿tokens的多领域原始语料库出发,通过专有数据处理 pipeline进行深度加工,该 pipeline整合了合成数据生成、语义去重、质量分级过滤等核心技术,最终精选出2.1万亿tokens的高质量训练语料,其中韩语相关内容占比达65%,同时保留35%的多语言数据以确保跨语言理解能力。

实测数据显示,A.X 3.1在专业评测中表现卓越:KMMLU(韩国大规模多任务语言理解)测试得分69.73,CLIcK(韩语文化语境理解)测试得分77.09,均处于行业领先水平。企业级功能方面,该模型内置完善的工具调用接口,支持与企业现有系统无缝集成,通过简单修改配置文件即可启用131072 tokens超长文本处理模式。典型应用场景包括:法律行业的合同条款自动提取与风险评估、金融领域的多文档交叉分析报告生成、制造业的技术手册智能问答系统构建等。SKT表示,A.X 3.1的推出标志着韩国在主权AI领域实现了从技术跟跑到自主创新的关键跨越,未来将持续优化模型性能,拓展垂直行业解决方案,推动韩国AI产业生态的健康发展。

【免费下载链接】A.X-3.1 【免费下载链接】A.X-3.1 项目地址: https://ai.gitcode.com/hf_mirrors/skt/A.X-3.1

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值