- 博客(77)
- 收藏
- 关注
原创 【AI大模型系列】DeepSeek V3的混合专家模型机制-MoE架构(八)
的核心思想是将输入数据分配给不同的专家子模型,然后将所有子模型的输出进行合并,以生成最终结果。这种分配可以根据输入数据的特征进行动态调整,确保每个专家处理其最擅长的数据类型或任务方面,从而实现更高效、准确的预测。
2025-03-30 17:08:29
547
原创 【Python学习系列】基础概念学习(一)
在Python中,引号用于定义字符串。Python支持单引号(‘)、双引号(")和三引号(’‘’ 或 “”")来创建字符串。Python使用缩进来定义代码块,而不是像其他语言那样使用大括号 {}。
2025-01-12 15:53:46
627
原创 【AI资讯汇总】2025年01月第二周
目录开源推理AI模型Sky-T1横空出世,训练成本不到 450 美元NVIDIA 与联发科联手推出迷你 AI 超级计算机智谱GLM-4-9B模型幻觉率仅1.3%,在全球大模型评测中夺魁谷歌AI平台再升级,AI Studio和Gemini团队转入DeepMind加速研发开源推理AI模型Sky-T1横空出世,训练成本不到 450 美元NVIDIA 与联发科联手推出迷你 AI 超级计算机智谱GLM-4-9B模型幻觉率仅1.3%,在全球大模型评测中夺魁
2025-01-12 13:30:52
771
原创 【AI大模型系列】AI Agent与LangChain框架介绍(七)
LangChain是一个用于开发由语言模型驱动的应用程序的框架。LangChain 库:Python 和 JavaScript 库。包含了各种组件的接口和集成,一个基本的运行时,用于将这些组件组合成链和代理,以及现成的链和代理的实现。LangChain 模板:一系列易于部署的参考架构,用于各种任务。(类似于SpringCloud)LangServe:一个用于将 LangChain 链部署为 REST API 的库。(类似于API网关)LangSmith。
2025-01-01 17:06:46
866
原创 【AI大模型系列】提示词高级技巧(六)
对于ChatGPT和国内公司推出的绝大多数AI大语言模型而言,中文都是其支持得较为不错的语言之一,因此对于绝大多数问题(95%以上),使用中文完全没有问题。但如果你发现某些回答不尽如人意,转用英文提问是一种可尝试的方案,因为英文是大多数AI大语言模型训练语料最丰富的语言之一,即使是国内大模型也使用了很多英文语料进行训练。在与AI大语言模型交互时,有时会遇到幻觉现象,即AI大语言模型输出的内容可能并不一定是真实存在的,AI大语言模型可能会给出看似合理但实际上是错误的回答。
2025-01-01 10:49:00
395
原创 【AI大模型系列】提示词进阶技巧一(四)
在学术界,举例的方法包括:少量样本提示(Few-shot Prompting)、单样本提示(One-shot Prompting),通常随着样本提示数量的增加,样本生成的准确性也会相应的提升,通常而言,7~10个样本提示会取得较好的效果。少量样本提示虽然解决了AI大语言模型理解上的问题,能够适用于许多任务,但如果遇到了需要推理的复杂任务时,少量样本提示就无能为力了,因为模型无法从少量样本提示中学习到完整的推理过程。通过这样的方式,你可以从多个维度获取全面的信息和建议,帮助你更好地进行决策和规划。
2024-12-29 15:47:50
455
原创 【AI资讯汇总】2024年12月第四周
目录OpenAI发布o3:AI 推理能力的重大突破,得分高达 87.5%阿里通义千问Qwen开源视觉推理模型QVQ-72B-PreviewOpenAI推出ChatGPT新记忆功能:能跨对话回忆用户交流OpenAI发布ChatGPT宕机故障详细报告:只因一个小更改导致https://www.aibase.com/zh/news/14162OpenAI发布o3:AI 推理能力的重大突破,得分高达 87.5%阿里通义千问Qwen开源视觉推理模型QVQ-72B-PreviewOpenAI推出ChatGPT新记忆功能
2024-12-29 13:42:01
613
原创 【AI大模型系列】提示词基础技巧(三)
在分步提问的过程中,你可以和AI大语言模型“协同思考”,在每次提问获得AI大语言模型反馈后,利用自己的智慧结合AI大语言模型的回答,分析并及时调整下一步的提问方向,以便得出比AI大语言模型自身推理所能得到的更好的最终答案。5W是指When(什么时间)、Who(什么人)、Where(什么地方)、Why(什么原因)、What(什么事情),1H是指How(怎么做)使用角色扮演是一种效果非常显著的策略,AI大语言模式不仅能采用与角色相符的语言风格和表达方式,还能模拟特定角色的思维模式和行为。
2024-12-29 12:25:33
511
原创 【AI大模型系列】常用的提示词框架(二)
输入部分包含了AI执行任务所需的数据或信息。:这是框架的第一部分,它明确了你希望AI执行的具体任务或动作。这可以包括任务的背景、目的、历史信息或其他任何有助于AI更好地理解和执行任务的信息。:提供关于请求的详细上下文和背景信息,帮助AI更准确地理解需求和面对的具体情境,使得生成的回答更加贴近实际问题和目的。:定义AI在对话中扮演的角色,如专家、顾问、朋友等,为对话建立框架,让AI知道应该以何种专业角度或风格来回答。:设定的可量化或具体的结果,用于衡量是否达到了目标,确保得到的答案是可衡量和实际的。
2024-12-28 23:35:57
2630
原创 【AI大模型系列】初识AI大模型(一)
在过去1~2年的时间中,被各种AIGC、AGI、LLM、大模型、生成式AI等概念刷屏,包括:那么到底什么是AI大模型?AI大模型的特点是训练数据量级大、参数量级大,这些模型通常具备较高的通用性,可以被应用于自然语言处理、图像识别、语音识别等领域。
2024-12-15 13:37:25
487
原创 【PlantUML系列】部署图(七)
下面是一个完整的PlantUML示例,它展示了一个简单的图书馆系统的部署图。这个系统包括两台服务器,一个用于运行Web应用程序,另一个用于运行数据库系统,以及一些配置文件。在这个部署图中:
2024-12-14 23:26:16
594
原创 如何做好技术方案设计
作为一名软件开发工程师,技术方案设计的重要性不言而喻。技术方案是我们从全局到局部去理解项目需求、技术挑战和解决方案的关键步骤。它确保了项目的每个环节都能有序衔接,每个细节都能得到充分考虑,从而提高开发效率和产品质量。技术方案也是企业的数字资产,不仅记录了项目的设计思路和实现细节,还沉淀了设计过程中遇到的问题和权衡决策。这些宝贵的信息对于后来者来说,是理解和维护系统的重要参考,也是传承知识、避免重复错误的关键。一个好的技术方案应该包括:概要设计、详细设计两部分;
2024-12-14 12:18:20
1203
原创 【AI资讯汇总】2024年12月第二周
OpenAI正式上线Sora,ChatGPT Pro用户可无限生成、最长20秒;谷歌发布新一代大模型Gemini 2.0,掀了AI圈牌桌,全力狙击OpenAI;OpenAI向所有用户开放ChatGPT Canvas 功能,新增支持Python代码运行;王者降临!苹果全家桶接入ChatGPT,重塑iPhone、iPad 、Siri;OpenAI 推出全新 ChatGPT Projects,集成多项实用工具;
2024-12-14 10:26:01
1108
原创 【AI资讯汇总】2024年12月第一周
Pro版本用户可以无限制使用所有高阶模型,包括高级语音模式,以及o1模型的Pro版本,结果可靠性小幅提升。:o1模型正式版相比预览版在智能能力上有所增强,特别是在编程能力方面,错误率降低了约34%。推出ChatGPT Pro服务,月费200美元,提供无限制高阶模型使用。:o1模型新增识别图片功能,能够从手绘草图中识别数据并进行推理。发布o1模型正式版,具备更高智能和响应速度,新增图片识别功能。Pro版本用户将获得o1模型Pro版,提升结果可靠性。OpenAI启动12天连续直播,发布12项新功能。
2024-12-10 00:53:55
808
原创 【设计模式系列】状态模式(二十三)
状态模式(State Pattern)是一种行为设计模式,。这种模式通过将每个状态相关的行为封装在独立的类中,使得对象在不同状态下可以有不同的行为表现,而不需要在对象内部使用大量的条件判断语句。
2024-12-08 15:57:42
1204
原创 【PlantUML系列】流程图(四)
是用来定义分区的关键字,它允许你将多个活动组合在一起。关键字,其中包含水平模式、垂直模式;是你为该步骤定义的名称。使用PlantUML语法通常使用。在PlantUML中,使用。在PlantUML中,start 关键字;
2024-12-08 13:59:20
1319
原创 【设计模式系列】访问者模式(二十二)
访问者模式(Visitor Pattern)是一种行为型设计模式,它允许你将算法与对象结构分离,从而在不修改对象结构的情况下,可以添加新的操作。这种模式特别适用于处理一个对象结构(比如组合结构)中的多个对象,并且希望在不改变对象结构的前提下,能够对这些对象执行新的操作。
2024-12-07 22:35:41
1347
原创 【PlantUML系列】序列图(二)
使用actorboundarycontrolentity和database等关键字来定义不同类型的参与者。:代表与系统交互的外部用户或外部系统。在用例图中,参与者通常用来表示系统的用户或利益相关者。在序列图中,参与者可以表示系统的外部用户或系统。:代表系统的边界,通常用来表示系统的控制范围。在用例图中,边界用来定义系统的责任和范围。在序列图中,边界可以用来表示系统的控制层,例如用户界面或系统的外部接口。:代表系统的控制结构,通常用来表示系统的内部控制机制或流程。
2024-12-01 16:15:19
1590
原创 【PlantUML系列】类图(一)
定义抽象类,抽象类中可以包含抽象方法和具体方法。定义类,类名后跟大括号,声明类的属性和方法。定义接口,接口中的方法只能声明,不能实现。关键字定义包,并在包中定义类或接口。关键字设置类图的外观,典型配置如下。关键字为类或关系添加注释。:表达格式为在方法前增加。使用interface。使用abstract。
2024-12-01 15:38:18
1114
原创 【设计模式系列】工厂方法模式(二十一)
工厂方法模式(Factory Method Pattern)是一种创建型设计模式,其核心目的是定义一个创建对象的接口,但让实现这个接口的子类来决定实例化哪一个类。工厂方法模式让类的实例化推迟到子类中进行,从而提高了代码的灵活性和可扩展性。
2024-12-01 14:59:31
905
原创 【设计模式系列】单例模式(二十)
单例模式(Singleton Pattern)是一种常用的软件设计模式,属于创建型模式。它的目的是确保一个类只有一个实例,并提供一个全局访问点来获取这个实例。
2024-12-01 12:06:18
598
原创 【设计模式系列】备忘录模式(十九)
备忘录模式(Memento Pattern)是一种行为型设计模式,它允许在不暴露对象内部状态的情况下保存和恢复对象的状态。备忘录模式通过将对象的状态封装在备忘录对象中,使得可以在需要时将对象恢复到之前的某个状态。
2024-12-01 11:00:01
611
原创 【设计模式系列】中介者模式(十八)
中介者模式(Mediator Pattern)是一种行为型设计模式,其核心思想是通过一个中介者对象来封装一系列对象之间的交互,使这些对象不需要相互显式引用。中介者模式提供了一个中介层,用以协调各个对象之间的通信,从而减少它们之间的耦合度。
2024-11-30 23:33:41
935
原创 【设计模式系列】解释器模式(十七)
解释器模式(Interpreter Pattern)是一种行为型设计模式,它的核心思想是分离实现与解释执行。
2024-11-30 08:55:31
1777
原创 【设计模式系列】责任链模式(十六)
责任链模式(Chain of Responsibility Pattern)是一种行为型设计模式。其核心思想是将请求的发送者和接收者解耦,通过一个中介链来传递请求,使得多个对象都有可能接收请求,从而避免请求发送者和接收者之间的耦合关系。抽象处理者(Handler)角色:作为责任链模式的核心,这个接口定义了统一的处理请求的方法,并定义了如何将请求传递给下一个处理者。具体处理者(Concrete Handler)角色:实现抽象处理者的处理方法,判断能否处理本次请求。如果可以处理请求,则直接处理;否则,将请求传递
2024-11-23 22:04:55
1188
原创 【设计模式系列】桥接模式(十三)
桥接模式的核心目的是将抽象部分与实现部分分离,使它们可以独立地变化。这种模式主要用于处理那些在设计时无法确定实现细节的场合,或者需要在多个实现之间进行切换的场景。
2024-11-03 11:04:52
714
原创 【设计模式系列】原型模式(十一)
原型模式(Prototype Pattern)是一种创建型设计模式,它使得一个对象可以复制自身,从而创建一个与自己属性一致的新对象,而无需知晓对象创建的细节。(例如,涉及复杂的初始化过程)。
2024-11-02 17:32:00
960
原创 【设计模式系列】建造者模式(十)
建造者模式(Builder Pattern)是一种创建型设计模式,用于构建复杂对象。它将一个复杂对象的构建和表示分离,使得同样的构建过程可以创建不同的表示。
2024-11-02 17:18:08
1452
原创 【设计模式系列】适配器模式(九)
适配器模式(Adapter Pattern)是一种结构型设计模式,它允许将不兼容的接口转换为一个客户端期望的另一个接口,从而使得原本不兼容的类可以一起工作。这种模式通常用于实现类之间的兼容,让它们可以无缝地协同工作。适配器模式涉及到一个单一的类,该类负责加入独立的或不兼容的接口功能。
2024-10-28 22:49:23
1009
原创 【设计模式系列】代理模式(八)
代理模式(Proxy Pattern)是一种结构型设计模式,它为其他对象提供一种代理以控制对这个对象的访问。通过引入一个代理对象来间接操作实际对象,可以在不改变实际对象代码的前提下,增加额外的功能操作,如访问控制、延迟初始化、日志记录等。
2024-10-27 21:11:35
701
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人