一文速学-人工智能项目实战
文章平均质量分 95
博主现任高级人工智能工程师,专注于深度学习项目的实际应用。曾发表多篇SCI论文并在多次国际竞赛中获奖,具备深厚的理论知识和丰富的实战经验。专栏内容涵盖图像处理、预测分析、语音识别等深度学习项目,每篇文章均包含详细的实战项目与可运行代码。目标是帮助零基础读者快速掌握各类深度学习模型及其应用,紧跟前言
fanstuck
曾世界百强私企大数据工程师,现任国企高级人工智能算法工程师,工作与研究方向为大数据开发和人工智能,个人喜欢研究技术和算法,博客热衷分享实用项目和技术干货。MCM/ICM Meritorious Winner,APMCM second prize,本科SCI二区一篇,软著七项发明专利两项,国家级竞赛多次获一等奖,总计省级奖项以上23项,热衷分享喜欢原创~关注我会给你带来一些不一样的认知和成长。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
最全面详解文档生成提示词优化:让AI写得更好
在人工智能文档生成中,**提示词(Prompt)就像一把钥匙**,决定了模型会开启怎样的大门。它既是用户需求的载体,也是模型输出的起点。一个好的提示词能让模型写出条理清晰、逻辑严谨又符合语境的内容;而一个模糊的提示词,可能只会得到空泛甚至偏题的回答。本文的目标,就是带大家理解提示词设计的基本原则,学会优化提示词的技巧,并能在实际应用中灵活运用不同的设计方案。原创 2025-09-15 17:43:26 · 930 阅读 · 0 评论 -
图像创作模型模型在工程领域上的探索与应用:从概念到落地
如果说 CAD 曾经是工程制图的革命,那么文生图很可能就是下一次革命的起点。未来,工程不只是冷冰冰的图纸和文字,更是直观、生动、可交互的智能表达。原创 2025-09-22 16:27:57 · 1112 阅读 · 0 评论 -
基于大模型的个性化推荐系统实现探索与应用
需要强调的是,在这一整条链路中,推荐算法虽然只是其中的一个环节,但却是最核心的“心脏”。没有好的算法,视频无法精准匹配用户;但如果缺少审核、冷启动、合规、反馈闭环的支持,再好的算法也难以真正落地。原创 2025-09-11 16:16:03 · 1219 阅读 · 13 评论 -
Prompt提示工程上手指南(六):AI避免“幻觉”(Hallucination)策略下的Prompt
摘要:本文探讨了大型语言模型(LLM)中普遍存在的"幻觉"问题,即AI产生不准确或虚构信息的情况。研究表明,幻觉是LLM的内在局限,无法完全消除。文章分析了AI幻觉的成因,包括训练数据偏差、泛化能力有限等问题。虽然定制化微调可以缓解幻觉,但会损害模型的泛化能力。作者建议通过Prompt工程来遏制幻觉,提出了四种策略:1)提供明确具体的指令;2)包含充分上下文信息;3)设计引导性问题;4)采用主流LLM框架(如CoT、ToT、RAG)。这些Prompt技巧能有效提高回答的准确性和相关性。原创 2025-09-12 10:31:06 · 1358 阅读 · 1 评论 -
一文速通最全ChatGPT模型架构与简介
GPT,全称为 “Generative Pre-trained Transformer”(生成式预训练 Transformer),是由人工智能研究机构 OpenAI 提出的**基于 Transformer 架构的预训练生成模型**,也是当前自然语言处理(NLP)领域极具影响力的基础模型之一。其核心定位是 “通用语言模型”—— 区别于传统针对单一任务(如仅做翻译或仅做摘要)设计的专用模型,GPT 具备跨场景的语言理解与生成能力,可灵活适配多种自然语言处理任务,无需为每个任务单独进行大规模重构。原创 2025-09-08 15:40:20 · 1526 阅读 · 0 评论 -
高效速搭基于DeepSeek的招标文书智能写作Agent
总的来说,智能写作Agent正在推动招标文书写作从传统人工操作向智能化、自动化的方向发展。随着AI技术的不断进步,未来智能写作Agent将变得更加智能、高效和定制化,进一步解放人力资源,提升招标文书写作的质量和效率。原创 2025-06-04 15:13:13 · 1246 阅读 · 0 评论 -
大模型是自我能力延展,还是认知主权的让渡?
或许未来的理想图景并非人机对立,而是你中有我、我中有你的协同进化。人类保持对价值目标和终极关怀的掌舵,AI则提供前所未有的计算智慧和创造力,两者融合,去完成单独任一方都无法完成的宏图。这条路充满挑战也充满希望。原创 2025-06-17 08:44:40 · 910 阅读 · 0 评论 -
如何高效提升大模型的RAG效果?多种实用策略一次掌握
摘要: RAG(检索增强生成)技术通过结合外部知识库提升大模型回答准确性,但实际落地需多维度优化。本文剖析四大关键因素:数据质量(合理文档拆分与更新)、检索算法(ANN加速搜索)、Embedding模型(按场景选择)及结果排序(Cross-Encoder重排)。提供实操方案如分层文档分割、多语言模型适配、开源向量库(FAISS/Milvus)搭建等,并强调从小规模试点开始,持续评估指标(Recall/F1)。未来RAG将更智能高效,助力企业降低幻觉风险,实现精准知识问答。关注@Fanstuck,获取AI落地原创 2025-05-27 16:43:17 · 952 阅读 · 0 评论 -
Deepseek与manus是何区别?深入解析AI Agent和智能体编排
《AIAgent技术演进与应用落地解析》摘要:本文探讨了DeepSeek与Manus两大AI平台的核心差异与发展路径。DeepSeek侧重深度语义理解与推理,而Manus专注于任务自动化执行,二者分别代表AIAgent发展的认知与执行方向。文章系统梳理了AIAgent从机械执行(2010-2016)、认知增强(2017-2022)到具身智能(2023-)的技术演进历程,重点分析了智能体编排系统的三大突破:动态工作流引擎、认知资源调度和元认知控制层。通过药企研发案例展示了智能体编排的商业价值,并给出了工程落地原创 2025-06-04 14:56:59 · 1147 阅读 · 0 评论 -
大模型推理性能差?你必须知道的优化技巧全汇总
有更多感悟以及有关大模型的相关想法可随时联系博主深层讨论,我是Fanstuck,致力于将复杂的技术知识以易懂的方式传递给读者,热衷于分享最新的行业动向和技术趋势。如果你对大模型的创新应用、AI技术发展以及实际落地实践感兴趣,那么请关注Fanstuck,下期内容我们再见!原创 2025-05-27 16:33:12 · 1143 阅读 · 0 评论 -
一文速览:大模型语料构建与基础训练全流程实战指南
因为模型只有看到足够丰富、高质量的数据,才能真正学到“真本事”,展现出更强大的泛化能力,也就是能够在全新的场景和任务下,做出准确的推理和判断。我们日常做饭的时候,通常会先把买回来的菜仔细清洗干净,把坏掉的叶子、泥土、杂质等去除掉。同理,训练大模型的数据就像我们的食材,如果不干净,就会影响模型的学习效果,甚至训练出逻辑紊乱的模型。在大模型的世界里,有一句名言:“Garbage in, Garbage out”,翻译过来就是“垃圾输入,垃圾输出”,说白了,就是给模型喂的是什么数据,它学到的就是什么知识。原创 2025-07-17 09:39:29 · 1397 阅读 · 7 评论 -
一文详解模型上下文协议(MCP):打通大模型与业务场景的关键
摘要: MCP(Model Context Protocol)是Anthropic于2024年提出的标准化协议,旨在解决AI模型与外部数据/工具交互的"信息孤岛"问题。它通过客户端-服务器架构实现统一接口,支持AI安全访问本地/远程资源(如文件系统、API),并具备动态发现、双向通信等优势。与Function Calling相比,MCP更通用、复用性更高。文章以开发"arXiv论文检索工具"为例,演示了MCP服务器的搭建流程,包括工具接口定义、API调用及结构化返回。原创 2025-05-26 09:21:09 · 1174 阅读 · 0 评论 -
一文看懂大模型核心参数调优用法与实战
本文深入探讨了OpenAI Python SDK在大模型开发中的核心参数调优方法。首先介绍了参数调优的重要性,通过实际案例展示了不同场景下的参数配置策略。详细解析了ChatCompletion和Completion两大核心接口,包括接口用途、主要参数及其影响,并提供了调用示例。文章强调参数调优如同"对话艺术",合理配置temperature、max_tokens等参数能显著提升模型输出质量,满足不同业务需求。最后指出,掌握参数调优技巧是将大模型从"能用"到"好用"的关键一步。原创 2025-05-26 09:09:15 · 1141 阅读 · 0 评论 -
从知识图谱到精准决策:基于MCP的招投标货物比对溯源系统实践
从最初对人工智能的懵懂认知,到逐渐踏入Prompt工程的世界,我们一路探索,从私有化部署的实际场景,到对DeepSeek技术的全面解读,再逐步深入到NL2SQL、知识图谱构建、RAG知识库设计,以及ChatBI这些高阶应用。一路走来,我们在AI的领域里一步一个脚印,不断拓展视野和能力边界。如果你是第一次点开这篇文章,或许会觉得今天的内容稍有挑战。但别担心,之前我创作的的每一篇人工智能文章都是精心铺设学习前置的基石。原创 2025-05-08 15:40:16 · 2029 阅读 · 12 评论 -
大模型微调新手全流程友好指南
在深入讲解之前,我们先来简单地理解一下“微调”的概念:大模型微调(Fine-tuning),就是在预训练好的大语言模型(例如Qwen、GPT系列、DeepSeek等)基础上,利用特定的数据集对模型的参数进行小规模训练,以更好地适应特定任务或领域。比如,你有一个通用的语言模型,但你想专门用来写金融报告或者进行客服问答,那么通过微调,这个模型就能更高效地完成这些特定任务。原创 2025-05-08 16:41:42 · 499 阅读 · 9 评论 -
生成模型常见损失函数Python代码实现+计算原理解析
既然存在生成内容与原有数据之间存在差距,那么有应该有度量二者差距的标量,损失函数就是度量两者直接的差距。损失函数的值告诉了优化算法应该如何更新模型的参数,以使模型的预测结果更接近实际数据。生成模型的损失函数值可以作为一个指标,用来评估模型的性能。通常情况下,我们希望损失函数越小越好,因为这意味着模型的预测结果越接近实际数据。通过选择合适的损失函数和正则化项,可以降低模型对训练数据的过拟合程度,提高模型在未见过数据上的泛化能力。原创 2023-11-03 15:42:27 · 4142 阅读 · 9 评论 -
目标分割技术-语义分割总览
博主现任高级人工智能工程师,曾发表多篇SCI且获得过多次国际竞赛奖项,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。目的就是为了让零基础快速使用各类代码模型,每一篇文章都包含实战项目以及可运行代码。欢迎大家订阅一文速学-深度学习项目实战我们可以把目标分割拆解为两个技术实现部分:一为语义分割、二为实例分割。图像分类旨在判断该图像所属类别。目标检测是在图像分类的基础上,进一步判断图像中的目标具体在图像的什么位置,通常是以外包矩形(bounding box)的形式表示。原创 2023-11-21 10:01:17 · 3283 阅读 · 50 评论 -
损失函数(Loss Function)一文详解-聚类问题常见损失函数Python代码实现+计算原理解析
在聚类问题中,我们试图将数据集分成不同的组(簇),使得每个组内的数据点相似度较高,而不同组之间的相似度较低。聚类问题的目标是找到合适的簇划分,以最大程度地减小组内的差异,同时最大程度地增大组间的差异。在聚类问题中,并没有像监督学习中那样明确定义的损失函数,因为聚类问题通常是无监督学习,没有预先定义的目标变量。而聚类问题的损失函数通常用于度量簇划分的质量,并提供一种可优化的指标来衡量聚类结果的好坏。损失函数度量了每个簇内数据点的相似度,即簇内数据点之间的相似程度。原创 2023-11-02 14:37:23 · 6048 阅读 · 32 评论 -
Prompt提示工程上手指南:基础原理及实践(一)
在AI语境中,"Prompt"通常指的是向模型提出的一个请求或问题,这个请求或问题的形式和内容会影响模型的输出。例如:在一个文本生成模型中,提示可以是一个问题、一个话题或者是一段描述,模型根据这个提示生成相应的文本。Prompt工程是指人们向生成性人工智能(AI)服务输入提示以生成文本或图像的过程中,对这些提示进行精炼的过程。任何人都可以使用文言一心和DALL-E这样的生成器,通过自然语言来进行操作。这也是AI工程师在使用特定或推荐提示对大型语言模型(LLMs)进行精炼时使用的技术。原创 2024-01-05 11:36:17 · 4081 阅读 · 68 评论 -
机器/深度学习模型最优化问题详解及优化算法汇总
其实最优化问题,从小学开始学习数学的时候就可以说已经接触到了,在我印象中有个问题,用一个平底锅煎饼,每次只能放2只饼,煎一只饼要2分钟(正反各用1分钟),煎三只饼要几分钟。这个问题其实已经可以归为最优化问题,我们实际计算出的时间,和真实最节省的时间不断对比去调整煎饼方案,得到时间花费最短的方案,得到最优解。其实这个问题将对象换一下,将煎饼时间换为损失函数,将煎饼换为训练模型,那这个问题就是最优化问题了。原创 2023-11-10 08:45:58 · 5690 阅读 · 26 评论 -
Prompt提示工程上手指南:基础原理及实践-思维树 (ToT)策略下的Prompt
此篇文章已经是本系列的第五篇文章,之前我们已经将检索增强生成(RAG)策略,逐渐我们掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整。较为主流的LLM模型框架设计基于链式思考(CoT)、思维树 (ToT)和检索增强生成 (RAG)这三大框架我们现在要开始了解学习思维树 (ToT)。如何建立一个[解决通用问题的语言模型]?如何能够让LLM能够深思熟虑的解决问题?我们人类通过搜索一个组合式问题空间来解决问题。原创 2024-04-16 14:33:36 · 4316 阅读 · 17 评论 -
Prompt提示工程上手指南:基础原理及实践(五)-思维树 (ToT)策略下的Prompt
此篇文章已经是本系列的第五篇文章,之前我们已经将检索增强生成(RAG)策略,逐渐我们掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整。较为主流的LLM模型框架设计基于链式思考(CoT)、思维树 (ToT)和检索增强生成 (RAG)这三大框架我们现在要开始了解学习思维树 (ToT)。如何建立一个[解决通用问题的语言模型]?如何能够让LLM能够深思熟虑的解决问题?我们人类通过搜索一个组合式问题空间来解决问题。原创 2024-04-09 11:34:24 · 2052 阅读 · 40 评论 -
Prompt提示工程上手指南:基础原理及实践(三)-Prompt个性知识库引导
Prompt系列的第二期文章已经将所有的Prompt工程主流策略讲解完毕,共涉及到六种Prompt类别模型以及具体生产内容详解。再结合系列第一篇文章具体对Prompt工程的详细介绍,也就可以达到Prompt工程师的初步入门,现在如果掌握了这些基础技能那么就可以去学习一些更高阶的Prompt技能,伴随GPT-4 Turbo达到可生成自定义的GPTs,能够搭建属于业务目标的知识。原创 2024-03-18 10:47:00 · 2539 阅读 · 21 评论 -
Prompt提示工程上手指南:基础原理及实践(二)-Prompt主流策略
在上篇文章中我们了解到Prompt基本种类有以下几种:如果大家经常用语言大模型的一些原生应用或者是去看过一些Prompt模板,开头的第一句往往都是说:我想让你担任xxx或者是你是一名xxx诸如此类定义人设的话:诸如此类的Prompt模板,为方便其中指定人设这段话我称之为System message,System message包含着Prompt开头,用于为模型提供上下文、指令或与使用案例相关的其他信息。原创 2024-03-14 09:19:59 · 2206 阅读 · 35 评论 -
Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt
想象一下,当你在写一篇文章或解决一个问题时,如果遇到了难题,你会怎么做?可能会去搜索引擎查找信息,然后基于找到的信息来构建你的答案。这个过程,其实很像是RAG框架在做的事情。化繁为简,我们先来了解RAG到底是什么。先从字母意思开始理解,RAG——Retrieval Augmented Generation,正如其名,是一种将检索(Retrieval)和生成(Generation)结合起来的技术。它首先从一个巨大的知识库中检索出与提出的问题最相关的信息,然后基于这些信息来生成回答。原创 2024-03-25 10:22:46 · 4593 阅读 · 17 评论 -
如何优雅的在页面上嵌入AI-Agent人工智能
IDEA启动!大模型的title想必不用我多说了,多少公司想要搭上时代前言技术的快车,感受科技的魅力。现在大模型作为降本增效的强大工具,基本上公司大多人都想要部署开发一把,更多的想要利用到这些模型放到生产中来提高生产力。但是对于我们开发者来说,找到实际落地场景可以说是产品的活,我们需要思考如何高效维护AI这个模块,如何建立项目层级结构才能更好的解耦。正巧最近遇到了这个需求,来和大家分享项目搭建流程,此项目将运用到我个人开发的网页和网站上面,感兴趣的同学可以去体验一下,再来看看项目设计结构会更有心得。原创 2024-08-23 09:45:50 · 3991 阅读 · 48 评论 -
GBI(生成式商业智能)实际业务生产落地运用上的探索和实践
最近在探索如何发展AI在业务上的驱动力时了解到了生成式商业智能这一概念,同时本人也在探索ChatBI这一技术的实际落地运用,其实二者几乎在实现效果层面是一个意思,GBI(Generative Business Intelligence)是偏向业务方面,而ChatBI更多是偏向技术方面。二者最终导向都是实现让企业可以更加快速地实现从数据到决策的转化,满足企业在不同场景下的数据分析需求。具体来说前者核心功能是通过生成式模型自动化地生成多层次的业务洞察、深度分析和预测结果。原创 2024-09-13 10:24:39 · 3984 阅读 · 0 评论 -
一文速学-零成本与数据沟通NL2SQL的概念和实现技术
NL2SQL的出现,彻底改变了人与数据交互的方式。它通过将复杂的SQL查询隐藏在自然语言输入背后,极大地降低了数据获取的门槛,让业务人员无需依赖技术背景就能直接获取所需的信息。随着自然语言处理技术的不断进步,NL2SQL的应用场景将愈加广泛,覆盖从企业报表到智能客服等各个领域。未来,随着模型的泛化能力增强和实时性能优化,我们可以期待NL2SQL技术在数据驱动的决策中扮演更加重要的角色,让“零成本与数据沟通”真正成为可能。原创 2024-08-26 16:02:22 · 3737 阅读 · 7 评论 -
一文速学-知识图谱从零开始构建实战:知识图谱搭建构架实践-信息抽取
根据系列上篇文章,我们已经了解了知识图谱的基本概念,以及现在知识图谱发展状况,与前沿AI结合方向。现在就差真正实践构建知识图谱这临门一脚,基本上就会对知识图谱这一产品有更加清晰的认识。那么工欲善其事必先利其器,就像我们对编程语言的掌握程度,更高级的用法和熟练度能更进一步提高我们做出项目产品的质量,在本篇文章将从开发环境部署写到初级知识图谱搭建实践,完成从无到有的知识图谱构建过程。原创 2024-10-18 17:26:28 · 1827 阅读 · 3 评论 -
如何优雅的在页面上嵌入AI-Agent人工智能
IDEA启动!大模型的title想必不用我多说了,多少公司想要搭上时代前言技术的快车,感受科技的魅力。现在大模型作为降本增效的强大工具,基本上公司大多人都想要部署开发一把,更多的想要利用到这些模型放到生产中来提高生产力。但是对于我们开发者来说,找到实际落地场景可以说是产品的活,我们需要思考如何高效维护AI这个模块,如何建立项目层级结构才能更好的解耦。正巧最近遇到了这个需求,来和大家分享项目搭建流程,此项目将运用到我个人开发的网页和网站上面,感兴趣的同学可以去体验一下,再来看看项目设计结构会更有心得。原创 2024-11-05 15:37:14 · 1792 阅读 · 0 评论 -
一文速学-知识图谱从零开始构建实战:知识图谱的基本概念
知识库:是一个用于存储和管理信息的系统,可以是结构化(如数据库)或半结构化(如文档库)的形式。它集中存储特定领域的事实、规则和信息,方便查询和管理。知识图谱:是一种以图形化方式表现知识的结构,通过节点(实体)和边(关系)来展示信息,强调实体之间的关联性和上下文。原创 2024-09-27 16:00:48 · 1349 阅读 · 0 评论 -
一文速学ChatBi“与数据库对话“大模型技术原理及框架一览
上期写了NL2SQL,相信看过的朋友应该都对现在大模型在数据交互办公层面的探索和发展都十分感兴趣,在此商业化的产品市场上也有很多,比如阿里云的析言GBI:腾讯云的ChatBI:像此类的产品可以说是最贴切业务的。在许多业务场景中,用户最关心的是如何快速获取最终的数据结果,而不是去理解数据是如何被提取和处理的。学习数据获取的复杂过程往往是一个高成本的障碍,而降低这一成本直接关系到产品的吸引力和用户的转化率。对于我们技术人员而言,尽管研发思维是核心,但我们开发的服务最终还是为了更好地服务于业务需求。原创 2024-09-03 10:02:00 · 4994 阅读 · 17 评论 -
一文速学-知识图谱从零开始构建实战:知识图谱搭建构架实践-知识展示
系列文章的上一篇我们已经进行了UIE抽取,非结构化知识抽取整理,转化。但是目前仅在于通过分词提取实体、属性、关系,还没有通过大模型来进一步高效率高精准度来提取这些关键字段,因此后续我们都整个流程优化空间都很大,最终我们的目标就是集成数据库以及大模型,对非结构化知识(包含图片,PDF等通过OCR算法识别)自动化抽取,再落库分发接口展示。目前我们需要进一步认识知识存储数据库,这里使用Neo4j进行讲解演示。如觉得项目有用请不吝支持。Neo4j 是一个开源的图数据库管理。原创 2024-11-05 15:26:59 · 1878 阅读 · 1 评论 -
Prompt提示工程上手指南(七)Prompt编写实战-基于智能客服问答系统下的Prompt编写
本系列文章从最初的基础原理与入门实践切入,一直延伸到主流策略、引导策略、RAG(检索增强生成)、思维树(ToT)与避免幻觉(Hallucination)的策略这种渐进的结构方便了对初学者和进阶者的双向照顾。初学者可以先理解基本概念,然后慢慢深入;有一定经验的读者则可以快速跳到策略章节,获取更高阶的经验和方法。在熟练掌握以上技能和熟悉概念理论之后,我们需付出实践,结合场景来实际操作检验一遍,达到融会贯通。原创 2024-12-27 10:05:11 · 2581 阅读 · 11 评论 -
深度洞察与精确匹配:基于HAI部署DeepSeekR1的公考岗位推荐与智能分析
DeepSeekR1强大的语义理解能力DeepSeekR1在预训练过程中利用了海量中文数据,具备对中文文本语义、上下文以及专业术语的深度理解能力。例如,面对“综合管理”与“综合执法”这样的相似概念时,传统模型可能会混淆,但DeepSeekR1则能结合上下文以及岗位说明做出更准确的区别,帮助系统在推荐岗位时更精准地匹配考生需求。对岗位职责与能力需求的深度解析公务员与事业单位的岗位描述通常包含多个条件维度,如学历、专业、工作经历、政治面貌、执业资格等。原创 2025-02-08 15:49:50 · 997 阅读 · 0 评论 -
大模型微调与RAG检索增强:从基础原理到案例分析全面详解
如果你一直在跟着Fanstuck博主的脚步探索AI大模型的相关内容,从最初的大模型Prompt工程解析,DeepSeek全面解析,到实际的私有化大模型开发部署,再到深入NL2SQL、知识图谱大模型和ChatBI等更高阶应用.我是Fanstuck,致力于将复杂的技术知识以易懂的方式传递给读者,热衷于分享最新的行业动向和技术趋势。简单来说,大模型微调就是在通用的大模型(如GPT、DeepSeek等)已经具备一定知识的基础上,让模型能够更精确地处理特定领域或特定任务的数据,从而提高其在实际应用中的表现。原创 2025-04-02 09:09:36 · 1219 阅读 · 0 评论 -
基于HAI部署DeepSeekR1的招标文书智能辅助生产开发与应用
主要内容目录结构:标明文书各章节标题、页码,方便评审方快速定位关键内容。招标项目背景简介:简要描述本项目的来龙去脉、背景意义。写作说明:说明文书的适用范围、引用法规或标准等。特点与写作要求强调可读性:将核心章节和附录分类清晰地列出,一目了然。前言语言风格:既要有概要性介绍,也可以适当结合项目特色,让后续章节的阐述更具逻辑衔接。半规则化:目录部分相对固定,可由DeepSeek调用模板生成;但“项目背景简介”常需要根据项目实际情况进行非规则化的创作,建议重点突出背景痛点和项目必要性。原创 2025-02-06 15:39:06 · 2178 阅读 · 4 评论 -
一文速览-合成数据在大模型训练和性能优化中的运用
如果你一直在跟着博主的脚步探索AI大模型的相关内容,从最初的大模型Prompt工程解析,到实际的开发部署,再到深入NL2SQL、知识图谱大模型和ChatBI等更高阶应用,应该已经感受到了我们一步一个脚印,从迈过一道道技术难关,到搭建起属于自己的技术桥梁的过程。合成数据,简单来说,就是通过算法和技术生成的数据,目的是模仿真实世界中的数据特征。一个典型的例子是 OpenAI 的 Codex 模型,它使用合成代码片段来丰富训练数据,结果证明,合成数据的加入让 Codex 在理解和生成代码方面的能力更上一层楼。原创 2025-01-26 10:58:56 · 1146 阅读 · 0 评论 -
探索DeepSeek:从核心技术到应用场景的全面解读
想象你有一位无所不知的数学教授(教师模型),他能在黑板上推导出最复杂的定理,但他的知识全部存储在一个装满草稿纸的房间里。现在,我们需要把这些知识浓缩成一本便携的《考点精讲》(学生模型),让普通学生也能快速掌握核心方法。这就是知识蒸馏的意义——让笨重的大模型“轻装上阵”,同时保留核心能力。大模型蒸馏的核心思想是通过让较小的学生模型模仿较大的教师模型的行为,从而在保留模型性能的前提下,降低计算资源的消耗。原创 2025-02-19 09:20:13 · 1126 阅读 · 0 评论 -
损失函数(Loss Function)一文详解-分类问题常见损失函数Python代码实现+计算原理解析
我们举一个通俗的例子:”假如你玩一个抽卡游戏,这段时间新活动刚好出了一个新的角色你想要抽到她,一般来说抽到这个角色基本都要保底,大部分人都需要一个648才能抽到,但是你的手气实在太非了,氪了两个648才抽到了,那么这和你预估的结果少了一个648的钱,也就是你大抵损失的金额。“通过上面这个例子我们再将大部分人预估抽到的金额设定为Y,而且实际用到的抽奖金额为Y',那么两者的差距|Y-Y'|就是损失函数了。原创 2023-04-17 14:38:25 · 2283 阅读 · 46 评论
分享