SK Telecom发布韩语优化大语言模型A.X 3.1，引领韩国主权AI技术突破-优快云博客

SK Telecom发布韩语优化大语言模型A.X 3.1，引领韩国主权AI技术突破

【免费下载链接】A.X-3.1 项目地址: https://ai.gitcode.com/hf_mirrors/skt/A.X-3.1

2025年7月24日，韩国电信巨头SK Telecom（以下简称SKT）正式对外发布了新一代大语言模型A.X 3.1（发音为“A dot X”）。这款被誉为“韩国主权AI”的突破性产品，是SKT完全自主研发的里程碑式成果，从底层架构设计、多维度数据筛选到全流程训练过程均由其内部团队独立完成，并依托SKT自主构建的超级计算基础设施TITAN实现高效训练。该模型以韩语理解与企业级应用为核心定位，通过2.1万亿tokens的高质量多语言语料从头训练，在保持相对紧凑训练规模的同时，实现了韩语处理能力的全面跃升，为韩国AI产业发展注入强劲动力。

如上图所示，品牌标志中“From Scratch”字样直观彰显了A.X 3.1从底层架构到训练流程的完全自主属性。这一设计不仅强化了SKT在AI技术自主可控领域的领先地位，更为韩国企业级用户选择本土AI解决方案提供了清晰的技术信任背书。

作为真正意义上的韩国主权AI模型，A.X 3.1在数据安全与技术自主性方面构建了双重护城河。其训练数据筛选工作由SKT内部专业团队全程把控，通过多层级质量审核机制确保数据来源合规性与内容安全性，同时依托SKT专有GPU集群完成模型训练，从根本上杜绝了核心技术依赖外部基础设施的风险。在性能优化方面，该模型展现出惊人的训练效率——在仅使用2.1万亿tokens训练数据的情况下（约为同类多语言模型训练量的60%），通过创新的注意力机制优化，实现了韩语处理性能的超越。韩国权威语言评估基准KMMLU测试结果显示，A.X 3.1以69.2分的成绩大幅领先其他韩语专用模型，在CLIcK韩语文化语境理解基准中更是取得77.4分的优异成绩，充分验证了其对韩国语言细微差异和文化背景知识的深度掌握。

企业级部署优势是A.X 3.1的另一大亮点。通过精细化的token压缩算法，该模型在处理同等韩语输入时比GPT-4o节省约33%的tokens消耗，直接降低企业用户的推理计算成本。上下文窗口方面，A.X 3.1原生支持32,768 tokens的超长文本处理能力，配合SKT自主研发的YaRN扩展技术，可将上下文长度进一步拓展至131,072 tokens，相当于一次性处理约65万字的韩文文本，为法律合同分析、学术论文综述、企业知识库构建等长文本应用场景提供了强大支撑。

技术架构层面，A.X 3.1采用340亿参数的优化模型结构，包含48层Transformer网络、8个KV-Heads注意力头设计，隐藏层维度达8192，前馈网络维度21824，形成兼顾性能与效率的神经网络配置。训练数据体系构建上，SKT从20万亿tokens的多领域原始语料库出发，通过专有数据处理 pipeline进行深度加工，该 pipeline整合了合成数据生成、语义去重、质量分级过滤等核心技术，最终精选出2.1万亿tokens的高质量训练语料，其中韩语相关内容占比达65%，同时保留35%的多语言数据以确保跨语言理解能力。

实测数据显示，A.X 3.1在专业评测中表现卓越：KMMLU（韩国大规模多任务语言理解）测试得分69.73，CLIcK（韩语文化语境理解）测试得分77.09，均处于行业领先水平。企业级功能方面，该模型内置完善的工具调用接口，支持与企业现有系统无缝集成，通过简单修改配置文件即可启用131072 tokens超长文本处理模式。典型应用场景包括：法律行业的合同条款自动提取与风险评估、金融领域的多文档交叉分析报告生成、制造业的技术手册智能问答系统构建等。SKT表示，A.X 3.1的推出标志着韩国在主权AI领域实现了从技术跟跑到自主创新的关键跨越，未来将持续优化模型性能，拓展垂直行业解决方案，推动韩国AI产业生态的健康发展。

【免费下载链接】A.X-3.1 项目地址: https://ai.gitcode.com/hf_mirrors/skt/A.X-3.1

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考