
大模型
文章平均质量分 92
shinelord明
北方待了10多年,北京六年多工作时间。先后在北京大唐电信,爱奇艺,京东等企业从事java开发、软件开发、与大数据开发、设计等相关工作。18年回重庆,在一家互联网金融公司,从事后端开发与大数据相关工作。
展开
-
【人工智能】一部正在书写的传奇,从诞生到未来蓝图
围棋作为一种极其复杂的策略游戏,一直被认为是人类智慧的高地,AlphaGo 的胜利标志着人工智能在复杂战略游戏领域取得了重大突破,引发了全球对人工智能的高度关注和热烈讨论,将人工智能的发展推向了一个新的高潮。同时,深度学习模型的可解释性问题一直是一个挑战,其复杂的内部机制如同 “黑盒”,使得人们难以理解模型决策的依据,这在一些对决策可解释性要求较高的领域,如医疗、金融、司法等,可能会限制其应用。研究人工智能在新兴领域,如量子计算辅助的材料设计、太空探索中的智能任务规划等方面的应用,开拓新的技术创新点。原创 2025-03-27 08:28:55 · 1067 阅读 · 5 评论 -
【技术产品】DS三剑客:DeepSeek、DataSophon、DolphineSchduler浅析
DeepSeek 是由北京深度求索人工智能基础技术研究有限公司推出的大语言模型(LLM),专注于自然语言处理(NLP)任务,如文本生成、代码生成、问答系统等。多模态交互:支持文本、图像、语音等多种输入输出形式。高效推理:通过稀疏注意力机制和混合专家模型(MoE)架构,显著降低计算复杂度。持续学习:支持基于人类反馈的强化学习(RLHF)和微调,适应不断变化的任务需求。DataSophon 是一款致力于快速实现部署、管理、监控以及自动化运维大数据云原生平台的开源工具。原创 2025-02-14 16:23:22 · 1133 阅读 · 0 评论 -
【AI】大模型技术:开启人工智能新时代
未来,研究者们需在提高模型性能的同时,关注其可解释性和可靠性,以促进人工智能技术的健康发展。未来,研究者们将致力于开发更高效的算法和硬件,降低大模型技术的应用门槛。大模型技术在预训练阶段积累了丰富的通用知识,这使得模型具有很强的迁移学习能力。同时,模型可能存在偏见和不公平性,如何确保AI模型的公平性和透明度是一个重要的研究方向。大模型技术在单一模态(如文本、图像)上取得了显著成果,未来将向跨模态学习方向发展,实现多模态数据的深度融合。大模型的训练需要巨大的计算资源和时间,往往伴随高昂的成本。原创 2024-07-15 00:57:34 · 1073 阅读 · 0 评论