- 博客(112)
- 收藏
- 关注
原创 DeepSeek-R1对决ChatGPT:AI大模型蒸馏小模型微调,全流程深度解析
知识蒸馏通过迁移大型教师模型(DeepSeek-R1)的知识到小型学生模型,实现模型压缩与加速。双模型协同训练:固定教师模型参数,指导学生模型学习知识迁移机制:软标签(Soft Targets)传递类别间关系信息损失函数设计:结合任务损失与蒸馏损失的复合目标函数动态温度调节:控制知识传递过程中概率分布的平滑度通过上述流程可实现DeepSeek-R1到轻量级模型的高效知识迁移。引入AutoDistill自动蒸馏策略探索MoE架构的稀疏化蒸馏开发硬件感知的NAS搜索框架。
2025-03-03 18:59:34
1469
原创 DeepSeek-R2:AI大模型新纪元的破晓之光
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-03-03 18:46:11
1368
原创 DeepSeek FlashMLA:用技术创新破解大模型落地难题
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-03-02 19:54:22
828
原创 DeepSeek FlashMLA 技术深度剖析:开启 AI 高效推理新时代
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-03-02 19:49:04
668
原创 DeepSeek后训练:监督微调和强化学习
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-28 18:56:59
1065
原创 DeepSeek核心技术优势总结
在人工智能的快速发展进程中,大语言模型的性能、效率与成本成为衡量其竞争力的关键维度。DeepSeek系列模型凭借一系列前沿技术,在这些方面展现出卓越的优势,为行业树立了新的标杆。以下将从性能、效率和成本三个核心层面,深入剖析DeepSeek的核心技术优势。3.7.1 性能优势在当今大语言模型激烈竞争的格局下,性能优劣直接决定了模型的应用广度与深度。DeepSeek系列模型凭借深厚的技术底蕴与创新突破,在性能维度大放异彩,全方位展现出领先实力。
2025-02-28 18:52:55
705
原创 DeepSeek-V3后训练揭秘:如何通过监督微调和强化学习提升模型性能
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-27 19:01:01
797
原创 DeepSeek-V3预训练技术深度剖析:开启AI语言模型新篇章
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-27 18:55:06
1014
原创 DeepSeek 双引擎驱动知识蒸馏与强化学习,助力小模型 “逆袭” 大模型
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-26 18:47:40
1000
原创 DeepSeek 突破!NSA——DeepSeek 原生稀疏注意力开启硬件适配与可训练新时代
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-26 18:35:50
866
原创 深度揭秘!DeepSeek 如何借 DeepSeek-R1 与小模型蒸馏称霸多基准测试
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-25 19:02:56
794
原创 DeepSeek-R1 震撼登场!DeepSeek 冷启动强化学习引领推理性能大飞跃
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-25 18:53:43
1056
原创 DeepSeek-R1-Zero:基于基础模型的强化学习
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-24 21:28:09
2137
原创 DeepSeek-R1:通过强化学习激发大语言模型的推理能力
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-24 21:18:36
1244
原创 DeepSeek大模型技术架构全解析:从底层原理到顶层设计
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-16 12:27:45
809
原创 DeepSeek核心算法解析:如何打造比肩ChatGPT的国产大模型
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2025-02-16 12:14:36
2456
5
原创 自然语言处理系列六十九》搜索引擎项目实战》搜索框架技术选型
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-11 21:09:15
1446
原创 自然语言处理系列六十八》搜索引擎项目实战》搜索引擎系统架构设计
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-11 20:58:53
2243
原创 自然语言处理系列六十七》搜索引擎项目实战》搜索引擎项目概述
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括索引更新、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。我们这个章节讲的搜索引擎是全文检索垂直搜索引擎。什么叫垂直搜索引擎呢?
2024-09-09 21:18:13
1203
原创 自然语言处理系列六十六》对话机器人项目实战》对话机器人原理与介绍
对话机器人是一个用来模拟人类对话或聊天的计算机程序,本质上是通过机器学习和人工智能等技术让机器理解人的语言。它包含了诸多学科方法的融合使用,是人工智能领域的一个技术集中演练营。在未来几十年,人机交互方式将发生变革。越来越多的设备将具有联网能力,这些设备如何与人进行交互将成为一个挑战。自然语言成为适应该趋势的新型交互方式,对话机器人有望取代过去的网站、如今的App,占据新一代人机交互风口。在未来对话机器人的产品形态下,不再是人类适应机器,而是机器适应人类,基于人工智能技术的对话机器人产品逐渐成为主流。
2024-09-09 21:12:32
1924
原创 自然语言处理系列六十五》神经网络算法》GAN生成对抗网络算法
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-08 21:31:40
1974
原创 自然语言处理系列六十四》神经网络算法》Seq2Seq端到端神经网络算法
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-08 21:22:18
1625
原创 自然语言处理系列六十三》神经网络算法》LSTM长短期记忆神经网络算法
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-07 21:29:31
1907
2
原创 自然语言处理系列六十二》神经网络算法》MLP多层感知机算法
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-07 21:18:35
1824
原创 自然语言处理系列六十一》分布式深度学习实战》TensorFlow深度学习框架
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-06 21:00:32
1592
原创 自然语言处理系列六十》分布式深度学习实战》主流深度学习开源平台
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-06 20:50:41
1868
原创 自然语言处理系列五十九》自然语言模型》N-Gram统计自然语言模型
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-05 21:32:54
978
原创 自然语言处理系列五十八》自然语言模型》自然语言模型算法原理
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-05 21:19:55
765
原创 自然语言处理系列五十七》关键词提取和文本摘要》文本摘要介绍及相关算法
文本摘要是一种从一个或多个信息源中抽取关键信息的方法,它帮助用户节省了大量时间,用户可以从摘要获取到文本的所有关键信息点而无需阅读整个文档。16.2.1 文本摘要介绍及相关算法文本摘要按照输入类型可分为单文档摘要和多文档摘要。单文档摘要方法是指针对单个文档,对其内容进行抽取总结生成摘要;多文档摘要方法是指从包含多份文档的文档集合中生成一份能够概括这些文档中心内容的摘要。按照输出类型可分为抽取式摘要和生成式摘要。抽取式摘要从源文档中抽取关键句和关键词组成摘要,摘要全部来源于原文。
2024-09-04 21:37:24
1520
原创 自然语言处理系列五十六》关键词提取和文本摘要》关键词提取介绍及相关算法
关键词提取是文本挖掘领域一个很重要的部分,通过对文本提取的关键词可以窥探整个文本的主题思想,进一步应用于文本的推荐或文本的搜索。16.1.1 关键词提取介绍及相关算法关键词是能够表达文档中心内容的词语,常用于计算机系统标引论文内容特征、信息检索、系统汇集以供读者检阅。关键词提取是文本挖掘领域的一个分支,是文本检索、文档比较、摘要生成、文档分类和聚类等文本挖掘研究的基础性工作。从算法的角度来看,关键词提取算法主要有两类:无监督关键词提取方法和有监督关键词提取方法。无监督关键词提取方法。
2024-09-04 21:31:53
1791
原创 自然语言处理系列五十五》文本聚类算法》LDA主题词-潜在狄利克雷分布模型算法原理
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-04 20:53:18
1580
原创 自然语言处理系列五十四》文本聚类算法》K-means文本聚类算法原理
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-03 20:39:34
1391
原创 自然语言处理系列五十三》文本聚类算法》文本聚类介绍及相关算法
分类和聚类都是文本挖掘中常使用的方法,他们的目的都是将相似度高的对象归类,不同点在于分类是采用监督学习,分类算法按照已经定义好的类别来识别一篇文本,而聚类是将若干文本进行相似度比较,最后将相似度高的归为一类。在分类算法中,训练集为已经标注好的数据集,但是微博文本具有的大数据特性及不确定性决定了标注数据的难度,因此本文选择聚类算法对大量且随机的微博文本进行处理。大量文本建模后还需要对主题分布进行聚类以得到更精确简洁的话题,因此文本聚类在话题检测技术中具有重要意义。
2024-09-03 20:33:33
1570
原创 自然语言处理系列五十二》文本分类算法》BERT模型算法原理及文本分类
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-02 21:18:09
2288
原创 大模型企业应用落地系列九》多模态具身智能》端到端强化学习人形机器人
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-02 21:06:56
2853
原创 自然语言处理系列五十一》文本分类算法》Python快速文本分类器FastText
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-01 21:18:28
1649
原创 自然语言处理系列五十》文本分类算法》SVM支持向量机算法原理
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-09-01 21:08:00
1770
4
原创 自然语言处理系列四十九》文本分类算法》朴素贝叶斯算法原理
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-08-31 20:50:09
1000
原创 自然语言处理系列四十八》Word2vec词向量模型》算法原理
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-08-31 20:43:07
1337
原创 自然语言处理系列四十七》Elasticsearch搜索引擎》Elasticsearch代码实战
【配套新书教材】《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
2024-08-30 21:46:36
1211
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人