- 博客(357)
- 资源 (3)
- 收藏
- 关注
原创 为什么AI需要连接真实世界?
所以你问它复杂加法,它可能靠记忆答对前100道题,但本质上是模仿,不是真正的逻辑推理。模型训练的数据总是有遗漏,更新周期又长,比如GPT-4的知识截至是2023年10月,这就意味着,它无法获取最新的知识、最新的世界变化。这些工具的核心逻辑,其实就是让大模型拥有“Function Calling”的能力,让它能像程序一样调用外部函数、系统,执行复杂任务。除了OpenAI的方案,还有国产替代,比如Coze(字节跳动出品),支持工作流、API,还有开源的Dify,适合本地部署。你必须理解:连接,才是智能的开始。
2025-04-05 12:05:16
116
原创 看懂Function Calling,才知道AI多强大
但理解还不够,AI 得“懂你在说什么”,还得“动起来”。比如你说“发照片”,它不只知道“你要发”,还知道“发什么、给谁、用哪个App”。再后来就是现在火爆的 NLI,自然语言接口,像 ChatGPT、Siri,我们直接说话它就能理解。你说人话,AI帮你动手,它充当你的智能助理+调度总管。这背后,不只是懂语言,还能理解任务,拆解步骤,调用函数,完成执行!你有没有想过,未来你对手机说一句“把周六烧烤的照片发给张大海”,它就真的能帮你找到照片、打开通讯录、点选联系人,然后发出去?
2025-04-03 11:03:17
122
原创 如何进行Prompt调优?
GPTs是OpenAI官方提供的一个工具,可以帮助我们无需编程,就创建有特定能力和知识的对话机器人。在输入prompt前,加入下面这一段“神奇的咒语”,中文或者英文,就能帮你优化提示词。三、字节跳动火山引擎进行Prompt调优。四、好用的Prompt学习网站。二、 用GPTs调优。
2025-03-28 23:32:15
277
原创 如何防御大模型中的 Prompt 攻击?
一旦你不加限制地把用户的输入传给模型,它就有可能被Prompt 攻击(Prompt Attack)控制,从而输出你原本不希望它说的话,甚至泄露敏感信息。如果你在开发大模型应用,千万别让模型“太听话”,否则它听到的可能不是你说的,而是别人给它偷偷塞进去的指令。Prompt 攻击并不是黑客才会做的事,普通用户只要足够“聪明”,也能不经意间控制模型。攻击者通过伪装、诱导或情感话术,让模型在“角色扮演”中松懈警惕,输出本不该输出的信息。我们可以对用户的输入做包装,再传给模型,强行强调角色边界,避免模型被绕开。
2025-03-22 12:02:22
529
原创 如何提升AI模型正确率
简单来说,它的核心思想是:同一个问题,我们让模型回答多次,并通过投票选出最合理的答案。例如,给定一道数学题,模型可能会得出不同的答案,但我们可以设置较高的 temperature(如 0.9)来增加多样性,然后统计哪个答案最常出现,以此获得更稳定的结果。传统的思维链是一条直线式的推理路径,而思维树则是让模型在每一步推理时探索多个分支,并通过搜索算法筛选最优解。这种方法类似于人类在做决策时的思考过程,大幅提升了复杂推理任务的准确率。总的来说,这些方法可以让模型的推理更加稳健、减少错误,提升AI的实用性。
2025-03-18 21:34:41
133
原创 大模型思维链及其应用
提示词:首先,分析当前城市交通存在的问题,如拥堵、污染和公共交通不足;它通过分步分析、层次化推理和跨领域联想,使回答更加清晰、严谨。不同于简单的直接回答,思维链让模型像人类一样逐步拆解问题,最终提供更深入的见解。这样,模型不会给出表面的答案,而是分步骤推理,使回答更具逻辑性和可操作性。1、分解问题:让模型按逻辑顺序回答,如“先分析现状,再提出对策”。2、明确推理路径:要求模型先假设,再验证,而不是直接给出结论。3、跨领域联想:结合不同学科的知识,如科技、环保和经济。问题:如何设计可持续的城市交通系统?
2025-03-17 00:17:01
315
原创 和 AI 聊天,它会“记住”你吗?
同时,虽然大模型不会变聪明,但对话数据可能会被用于后续的模型训练,因此如何保护数据隐私也是一个值得思考的问题。在大模型的应用开发中,很多人会误以为,只要我们不断和大模型对话,它就会变得更聪明,甚至可以适应我们的需求。但事实上,每一次我们发送的 prompt,并不会改变大模型的权重,它不会因为我们说得多,就学得多。换句话说,我们的对话不会直接让它变聪明,或者变笨。这其实取决于具体的业务需求和成本考虑,但可以肯定的是,优化 prompt 设计,减少不必要的 token 消耗,才是大模型应用开发中最关键的问题。
2025-03-14 10:13:58
308
原创 如何构建高质量的提示词?
在Prompt的构成中,定义角色很重要,因为它有助于设定交流的基调和范式,确保双方在正确的角色预设下进行交互。比如,在客服对话中,定义AI为助理,用户为提问者,可以使对话更加高效和目标明确。此外,把重要信息放在输入的开始或者结尾处也极为关键。研究表明,语言模型在处理输入时,通常对首尾的信息更加敏感,因此在首尾放置关键信息可以提高处理的效率和准确度。构建高质量的提示词(prompt)是至关重要的,因为它决定了生成内容的质量和准确性。1、试玩地址:https://hong.greatdk.com。
2025-01-11 16:29:24
288
原创 深入理解大模型提示词
这表明,虽然设计Prompt的门槛较低,任何人都可以向模型提出问题,但要精确地得到所需的答案或结果,需要深入了解模型的工作机制和语言理解能力,其实践的“天花板”非常高。未来,随着科技巨头如苹果、微软将这些大模型集成到操作系统中,用户可能通过简单的Prompt与自己的计算机或智能手机交互。在学习和使用大模型中,能熟练掌握Prompt的设计和优化,无疑是走在技术前沿的重要一步。Prompt,即“提示词”,是指在与大型语言模型(LLM)交互时,向模型提供的输入信息。
2025-01-09 10:19:23
202
原创 如何选择AI技术方案?
首先,当面对一个新的AI项目时,重要的是确定我们的需求和目标。一旦这些被明确,接下来的步骤包括准备测试数据、验证AI模型的可行性,以及根据需要选择适合的AI技术。假设我们的项目需要补充知识库,以增强对话系统的响应质量,那么我们可以选择使用Retrieval-Augmented Generation(RAG)。通过Function Calling,我们的AI模型可以直接调用外部功能或服务,实现更复杂的任务。通过这些步骤,我们不仅能够建立一个功能强大的AI系统,还能确保它在实际应用中的效果和效率。
2025-01-06 10:00:26
204
原创 大模型的常见技术架构
大模型微调是通过在特定数据集上继续训练已预训练的大型语言模型(如GPT或BERT),来适应特定应用需求的技术。接下来是Function Calling,这项技术允许AI调用外部系统的API,执行特定的功能或任务。例如,当你问AI去天安门怎么走,AI能够通过调用高德系统的API获取路线,并将返回信息提供给大模型,最后进行语义化输出。简单来说,你问AI一个问题,它根据已经学习的信息给出答案,就像查询一个超级详尽的数字大脑。通过这些技术,AI变得更加强大和灵活,能够更好地服务于我们的日常生活和工作需求。
2025-01-03 11:54:11
191
原创 大模型的三种产品架构
在这种模式下,AI不仅执行基本任务,还能管理整个工作流程,优化决策和操作。首先,AI Embedded模式,这种方式中,人工智能直接嵌入到工作任务中,像是一个静默的助手,在需要时提供帮助。在这个模式中,AI扮演的是一个更主动的角色,它不仅提供信息,还会参与到决策过程中。这三种AI集成模式,从简单的任务助手到复杂的自主操作者,展示了人工智能在现代工作场所的多样化角色和广泛应用。今天,我们将探讨三种主要的人工智能集成模式:AI Embedded模式、AI Copilot模式和AI Agent模式。
2024-12-30 09:49:33
256
原创 为什么要把AI当人看?
例如,RWKV尽管在某些任务上表现出独特的优势,但可能由于缺乏足够的商业推广和技术验证,而未能达到Transformer的知名度。生物神经网络通过复杂的电化学过程,能在极低的能量消耗下处理复杂的信息,这是数字神经网络目前难以企及的。总的来说,将AI视为具有人类特质的实体,不仅有助于我们更深入地理解和设计更好的AI系统,还能激发出关于如何使这些系统更加高效和智能的创新思考。此外,了解不同AI架构的特点和适用场景,可以使我们更加合理地选择和应用这些技术,推动AI领域的发展。
2024-12-28 16:03:22
243
原创 大模型如何训练和推理?
因此,针对大模型的输出,我们人类应该进行严谨评估和测试,并对大模型进行持续优化,确保其输出质量和准确性。在推理过程中,我们给推理程序若干token,程序会加载大模型权重文件,算出概率最高的下一个token是什么。在训练过程中,大模型会把不同token出现的概率存入“神经网络”文件,保存的数据就是“参数”。通常情况下,参数越多,意味着大模型能够学习和记住更多的信息,其表现能力和处理复杂问题能力也越强。为了便于理解,我们可以将大模型想象成一个勤奋的学生,这个学生通过阅读大量的书籍和资料来学习知识。
2024-12-26 09:35:55
221
原创 大模型项目如何成功落地?
随着人工智能的快速发展,大模型已经成为企业转型和提升效率的关键工具。要让大模型成功落地,需要几个关键要素,以及明白如何组建一个高效的团队。要搭建一个能够有效落地大模型的团队,关键是组建一个既懂业务又精通AI和编程的团队,通过快速沟通和灵活协作迅速解决问题,发挥AI的最大潜力。此外,团队的编程能力也至关重要,它可以加速想法的实现和快速迭代。首先,成功的关键在于业务人员的积极参与,这是项目成功的起点。其次,团队需对AI的能力有准确的认识,以便正确应用技术。最后,推行新技术需要耐心等待其调整和优化。
2024-12-22 13:16:09
226
原创 超越聊天,AI的无限可能
通过利用AI的多功能性,我们可以在多领域实现创新和效率的飞跃。使用这些AI模型时,应采取“用人思维”,将任务交给AI并根据表现反馈。我们可以把大模型视为功能强大的函数,接收各种数据作为输入,并生成所需输出。大模型不仅处理文本,还能理解和生成图像、视频、3D模型和动画。在这个快速变化的时代,人工智能(AI)已成为生活中不可或缺的一部分。提到通用人工智能(AGI),我们指的是理论上能完成任何人类智能活动的AI。此外,大模型还能处理语音和音频信息,用于语音识别、生成语音回应或音乐,让AI交互更自然。
2024-12-20 08:19:08
148
原创 怎样学习AI?
例如,一个希望利用AI提升客户体验的产品经理,应该优先学习“Assistants API”如何提升服务,而一名软件工程师则可能更需要掌握“多模态大模型”的技术细节。AI时代有三个行业共识:第一,确定未来,AI必然会深刻地影响世界的发展,我们要以开放的心态迎接这场变革;第三,落地关键在业务,代码只是AI的一部分,真正的价值在于如何结合业务场景实现落地应用。在AI的学习过程中,我们只有将原理、实践和认知结合起来,才能真正成为AI时代的弄潮儿。学习AI的过程需要全面的思考和实践,而不仅仅局限于代码的掌握。
2024-12-10 13:55:04
203
原创 AGI时代三大职业分层
有专家乐观预测,AGI可能明年就会实现;主流观点则认为需要3到5年,比如OpenAI、DeepMind等团队也持这种看法;最悲观的预测是需要10年。但是,不管什么时候实现,AGI将无处不在,并带来全新的社会分层。今天我们来聊聊AGI,也就是通用人工智能时代即将到来!你有没有想过,AGI离我们有多远?如果你懂编程,建议向业务靠近,了解市场与客户;如果你懂业务,建议学习编程,提高自主性。那么,如何成为一名合格的AI产品开发者呢?AGI的时代正在加速到来,现在行动,未来才能抢占先机!
2024-12-06 10:48:12
329
原创 什么是AI?
在国内,已经涌现出许多优秀的大语言模型,比如百度的文心一言、阿里的通义千问、华为的盘古大模型,以及科大讯飞的星火认知模型。近年来,AI的快速发展改变了各行各业,比如医疗、金融、教育等领域,AI都在提升效率和创造价值。其中,大模型是AI领域的重要突破。它们具有强大的语言理解和生成能力,可以完成写作、翻译、代码生成等任务,比如GPT、ChatGPT等。未来,随着技术不断进步,大模型将更加贴近我们的生活,让AI更智能、更人性化。如果你想了解更多关于AI的知识,记得关注我的账号,一起探索这个改变世界的领域!
2024-12-01 11:01:35
369
原创 AI编程和AI绘画哪个更适合创业?
例如,开发专注于AI绘画生成工具的平台,既能利用编程技术提供工具,又能进入艺术和创意市场。AI编程和AI绘画各有优势,适合创业的方向取决于你的资源、兴趣、市场需求和技术能力。借助现有的AI绘画工具(如Stable Diffusion、DALL-E),可以快速创建作品。可应用于品牌设计、数字艺术、NFT、游戏开发、广告营销等领域,市场需求新颖多样。涉及自动化、数据分析、自然语言处理、计算机视觉等多个领域,市场需求大。成功的AI程序可以在多个行业和场景中重复应用,如医疗、教育、金融等。
2024-11-23 23:42:56
375
原创 AI数字人使用的技术及应用场景
这使得AI数字人能够与用户进行多轮对话,完成复杂的交互任务。2、计算机视觉:AI数字人通过视觉识别技术,能够捕捉和识别人脸、表情、手势等信息,并适应不同场景的视觉变化,使其在用户面前表现出更加自然的反应。5、情感计算:部分AI数字人具备情感识别与反馈能力,通过语音和表情识别用户的情绪状态,从而适时调整回应的语气和内容,使对话更加自然和人性化。3、3D建模与渲染:通过3D建模技术,AI数字人拥有高质量的虚拟形象,使用实时渲染技术展现流畅的面部表情、肢体动作等,从而提升真实感。
2024-11-13 23:56:50
696
原创 应用开发平台Dify能做什么?
Dify 是一个开源的大语言模型(LLM)应用开发平台,旨在简化和加速生成式 AI 应用的创建和部署。2、模型管理:支持与数百种专有或开源的 LLMs 以及多种推理提供商和自托管解决方案的无缝集成,涵盖 GPT、Mistral、Llama3 等模型。4、RAG 管道:具备从文档摄入到检索的全面功能,支持从 PDF、PPT 和其他常见文档格式中提取文本。6、LLMOps 功能:监视和分析应用程序日志和性能,根据生产数据和标注持续改进提示、数据集和模型。
2024-11-10 22:53:19
876
原创 在行业应用中,如何解决大模型AI生成结果不准确问题?
4、引入专家审查与规则系统:在模型生成结果之后,由行业专家进行审核,或者在模型生成后加入规则引擎(例如,将一些业务逻辑和规则嵌入到模型后端)来检测并过滤掉不符合要求的生成结果。3、多模型融合与投票机制:使用多种模型的组合,或者同一模型在不同设定下的生成结果,采用投票或评分机制来提高答案的准确性。5、基于知识图谱的增强:知识图谱可以为生成模型提供更多的背景知识和语义关联信息,将其与大模型结合,可以增强生成结果的合理性与准确性。建立反馈系统,利用用户反馈纠正生成内容的偏差,逐渐提升模型在特定任务或领域的表现。
2024-11-07 23:42:13
813
原创 在AI时代,如何解决人的工作岗位被AI替代的问题?
未来,很多岗位将由人类和AI共同完成,而不是完全被替代。许多被替代的岗位是相对重复、标准化的工作,而AI和自动化往往难以替代更高层次的、需要创造力、复杂决策和情感互动的工作。此外,共享经济领域的业务,比如共享空间、共享技能等,能够容纳更多非全职的就业形式,为人们提供更多收入来源。通过政策支持、技能提升、人机协作、社会保障等多方面的努力,未来的工作环境可以更有包容性、更多元化,并创造出更加满足人类精神需求的就业机会。随着技术的不断进步,许多传统的工作变得自动化,这带来了效率的提升,但也引发了就业方面的挑战。
2024-11-06 23:32:13
866
原创 Angular 中 UntypedFormGroup和FormGroup的区别?
2、UntypedFormGroup:这是 Angular 14 引入的一个新的版本,允许创建一个没有类型检查的 FormGroup。当我们不希望在编译时进行类型检查,或者表单结构动态变化、类型不确定时,可以使用 UntypedFormGroup。它允许我们在表单控件中使用类型检查,即每个控件的类型在编译时就会被检查,这对于严格类型的应用程序来说是有帮助的。在代码中使用 FormGroup 时,表单结构的类型会被明确指定,这可以防止输入错误,并提高代码的可靠性。
2024-11-02 22:45:29
465
原创 大模型开发中将企业数据发送给Open AI是否有安全风险?
3、模型训练数据的保护:许多大模型可能会将用户数据用于进一步的模型改进和训练,除非明确说明不会存储或再利用传入的数据。因此,在使用前需要清晰了解 OpenAI 的数据存储和处理策略,并确保所使用的 API 不会保留企业的数据,或者选择合适的“不保存数据”的选项(如 OpenAI 的企业解决方案中可能提供的设置)。1、数据隐私和合规性:企业的数据可能包含敏感信息,涉及客户隐私、知识产权等。为此,建议在 OpenAI 账户和 API 接口的管理上采取严格的权限管理和访问监控措施,避免未经授权的数据访问或泄漏。
2024-11-01 23:41:49
863
原创 AI会助力元宇宙的发展吗?
1、虚拟角色和智能交互:AI技术可用来创造智能化虚拟角色,如NPC(非玩家角色),通过自然语言处理和情绪识别技术,这些角色可以与用户进行更真实和有情感的互动,让元宇宙更加生动和有趣。5、智能管理和安全保护:元宇宙需要一个安全、稳定的环境,而AI在网络安全、身份验证、内容审核等方面发挥重要作用,有效管理虚拟空间,确保用户体验的安全性和规范性。2、内容生成和创意支持:AI能自动生成丰富多样的内容,如3D场景、动画、服装设计等,从而降低创建元宇宙的成本和时间,使个人和企业更容易创建个性化的虚拟世界。
2024-10-31 23:41:24
313
原创 javascript中!!有何作用?举例说明
在 JavaScript 中,!的作用是将一个值转换为布尔类型(true 或 false),通过两次取反操作来实现。这个双重取反的用法常用于确保变量是一个明确的布尔值。会将值转换为布尔值的反值,例如,!true 会变成 false,而!的作用就是将任何值强制转换为 true 或 false,无论值的原始类型是什么。会再取反,恢复原来含义的布尔值,最终得到 true 或 false。这种写法在代码中可以使条件表达更简洁,尤其是用于布尔判断时,使代码更具可读性。示例 2:判断对象的属性是否存在。
2024-10-28 10:39:23
381
原创 ngrx store中createSelector的用法?
在ngrx的store中,createSelector用于从状态树中选择和派生数据。它允许创建高效的选择器,在状态变化时,仅当相关数据发生变化时才重新计算。这能有效避免不必要的渲染,提高性能。这种方式在ngrx状态管理中高效、灵活,特别适合大型应用的复杂状态选择需求。选择器可以是单个状态字段的简单选择器,也可以组合多个选择器生成复杂数据。createSelector支持组合和派生数据,减少不必要的计算。在组件中通过Store调用选择器,可以自动管理订阅和状态更新。
2024-10-25 23:52:05
428
原创 微软开源的GraphRAG能做什么?
3、适用于复杂领域:GraphRAG在需要深入理解和分析复杂关系的场景中表现出色,比如金融服务、保险行业中的风险评估和欺诈检测。1、深度数据理解:GraphRAG使用大语言模型(LLMs)从未见过的专有数据中生成知识图谱,帮助分析复杂的关系。4、开放且可定制:GraphRAG是一个开源的模块化系统,用户可以根据特定的使用场景进行自定义,并通过Azure的加速器工具包进行快速部署。微软开源的GraphRAG是一种结合图结构和检索增强生成(RAG)的技术,它能够从文本中提取结构化的数据,并生成知识图谱。
2024-10-23 23:34:25
384
原创 文本转语音工具ChatTTS简介
ChatTTS 是一款先进的文本转语音工具,专为用户提供便捷、高效的文本转换语音服务。通过 ChatTTS,用户可以快速生成高质量的语音内容,适用于各类场景,如播客、有声书、在线课程等。2、语音多样化:用户可选择不同的语音风格,如男性、女性、年轻、成熟等多种音色。3、语音质量高:生成的语音自然、流畅,带有真实情感,适合高质量音频内容需求。1、多语言支持:支持多种语言的文本输入,自动转换成相应的语音输出。4、快速转换:支持实时转换文本为语音,适合需要即时语音播报的场景。
2024-10-22 23:13:00
342
原创 AI大模型是否有助于攻克重大疾病?
例如,通过分析患者的基因组、医疗影像或电子病历,AI可以辅助医生识别出癌症、心脏病等重大疾病的早期症状,从而大幅提高早期干预的可能性。2、药物研发:传统药物研发周期长、成本高,而AI大模型可以通过模拟和分析大量化合物的特性,快速筛选出可能有效的候选药物,缩短药物研发时间。3、个性化治疗:AI大模型能够通过对患者数据的深度分析,帮助医生设计更为精准的个性化治疗方案,尤其是在癌症治疗中,AI已经能够帮助医生选择最适合患者的靶向药物和免疫疗法。
2024-10-21 23:20:49
328
原创 用大模型中的function calling实现语义化查询有哪些问题?
这在某些场景中会产生有用的结果,但在特定的、严格的查询需求中,过度泛化可能导致结果偏离用户的原意。总的来说,大模型中的 function calling 为语义化查询带来了强大的灵活性,但在实际使用中,需要充分考虑模型的准确性、效率、上下文处理、边缘情况处理和安全性问题,才能实现良好的用户体验和查询效果。在多轮对话中,语义查询可能需要保持前后文的连贯性,但在实际应用中,管理和维护多轮对话中的上下文可能会出现问题,尤其是当用户的查询逐渐复杂化或变更意图时,模型可能无法很好地适应这些变化。
2024-10-18 23:48:49
344
原创 AI大模型带来哪些创业机遇?
低代码开发平台:创业者可以构建基于大模型的低代码或无代码平台,帮助用户快速生成应用程序、自动化工作流程,尤其是为中小企业提供高效的数字化转型方案。数据治理工具:帮助企业管理和优化大数据集,确保数据的质量、安全性和隐私保护,特别是在医疗、金融等对数据合规性要求较高的领域。自动化写作:为市场营销、新闻、广告、社交媒体等行业开发自动内容生成工具,帮助企业快速生成高质量的文案、广告词和新闻稿。AI 艺术生成:通过大模型生成数字艺术作品、视频剪辑、音乐,帮助创作者快速创作,并提供创意工具给个人和企业用户。
2024-10-16 23:49:24
750
原创 LLaMA 3 和 OpenAI有哪些相同点和不同点?
LLaMA 3(Meta 的 LLaMA 系列)和 OpenAI 的模型(如 GPT 系列)都是先进的 大语言模型(LLMs),它们在训练、应用场景和能力上有很多相似之处,但也存在显著的不同点。总结来看,LLaMA 3 和 OpenAI 的 GPT 系列都在大语言模型领域处于领先地位,它们在模型架构和任务处理上有很多共同点,但在开放性、商业化和研究应用上有不同的策略和重点。LLaMA 3 提供的权重和训练模型可以更灵活地在不同的硬件和环境下进行调整和部署,尤其是在本地部署和调整上更具可操作性。
2024-09-29 22:00:55
646
原创 RAG和Function calling使用的不同场景?
这种方式结合了检索的准确性和生成的灵活性,非常适合回答复杂问题,尤其是需要从外部文档或数据库中获得信息的场景。问答系统: 当需要回答涉及到外部知识库、文档或数据库中的具体信息时,RAG 可以先检索相关文档片段,再生成回答。它们可以在某些复杂场景下互补使用,例如通过 Function Calling 获取结构化的实时数据,而通过 RAG 来补充更广泛的上下文信息。当用户想要获取与特定文档、论文或网站相关的详细信息时,RAG 可以先从大量文档中检索到相关片段,然后通过生成式模型输出整合的信息。
2024-09-28 23:15:00
554
原创 什么是多模态大模型?
多模态大模型(Multimodal Large Model)是指能够处理和理解多种类型数据的人工智能模型,通常包含文本、图像、音频、视频等不同模态的数据。传统的人工智能模型通常只处理单一模态的数据,比如只处理文本或只处理图像,而多模态大模型可以同时处理多种类型的数据,并结合它们进行综合分析与理解。3、语音-图像-文本互换:通过将不同模态的信息进行转换,比如从一段语音生成相应的文字或图像,或将视频内容生成对应的文本描述。4、自动驾驶:多模态大模型可以结合摄像头、雷达、声呐等多种传感器的数据,做出准确的决策。
2024-09-18 23:53:28
560
原创 如何进行大模型训练和微调?(实战)
以下是针对function calling的slot,评估准确率(识别准确度)、召回率(全面率),F1值。1、在项目中,如果prompt和function calling足够好,尽量不要微调,节约成本。4.数据增强,可以用chatgpt对以上数据库改写,得到增强数据库,更加口语化。从中可以看出,训练微调并不能比function calling增强太多。3、模型训练数据,以开源数据库为例,包含酒店,景点,餐馆等信息。7、连接租用的容器后即可进行训练、微调。2、大模型训练和微调工具。6、训练、微调代码示例。
2024-09-13 23:39:52
381
分步实现struts2 mvc 框架源码.7z
2021-11-21
dynamicCreateComponent.7z
2020-01-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人