自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 资源 (1)
  • 收藏
  • 关注

原创 Datawhale coze-ai-assistant:Task 5 发布

4、发布到微信小程序操作:打开编辑好的coze智能体选API发布,进入「小微智能体」小程序选发布智能体,通过个人访问令牌方法配置,完成后可查询、预览、发布。2、官方渠道发布内容:涵盖智能体发布和应用发布,涉及多个平台,如发布智能体到豆包、飞书、抖音等,应用发布到抖音小程序、微信小程序等。3、API服务内容:包括发布智能体为API服务、发布到Chat SDK,发布应用为API服务、通过API运行应用工作流等。1、发布方式分类:coze发布方式分三类,官方渠道发布如抖音、微信小程序等;

2025-03-20 15:58:23 287

原创 Datawhale coze-ai-assistant:Task 4 应用

学习网址:​​​​​​​​​​​​​​​​​​​​​Docs。

2025-03-17 14:27:06 839

原创 Datawhale coze-ai-assistant:Task 3 工作流

通过以上步骤,你可以在Coze平台上创建和配置一个基于大模型的聊天机器人工作流,使其具备强大的功能和交互性。

2025-03-16 19:34:07 475

原创 Datawhale coze-ai-assistant:Task 2 智能体 + 资源的进阶

Agent智能体是一种能够自主感知环境、做出决策并采取行动以实现目标的系统。其基本概念包括自主性、感知能力、决策能力和行动能力。操作流程通常涉及感知环境、选择行动、执行行动、接收反馈和更新策略。智能体在强化学习、多智能体系统和自动驾驶等领域有广泛应用,展现了其在复杂环境中的适应性和高效性。

2025-03-16 18:10:55 728

原创 Datawhale coze-ai-assistant:Task 1 了解 AI 工作流 + Coze的介绍

工作流是一种高效的自动化工具,适用于需要重复性和标准化操作的业务场景。它通过分解复杂任务为简单步骤,并按照固定顺序执行,确保任务的高效完成。与智能体相比,工作流更注重全局流程的管理和优化,而智能体则更适合处理局部任务。通过合理设计和应用工作流,可以显著提升业务效率和创新能力。扣子(Coze)是字节跳动推出的一款新一代AI应用开发平台,旨在帮助用户快速搭建基于大模型的AI应用,无需编程基础即可实现从创建到发布的全流程。

2025-03-16 16:44:55 610

原创 DataWhale 速通AI编程开发:(进阶篇)第4章 MCP服务

MCP(Model Context Protocol)是模型上下文协议的简称,它是一种允许Roo Code与本地运行的MCP服务器进行通信的协议。这些服务器提供额外的工具和资源,可以显著扩展Roo Code的功能。功能扩展:添加Roo Code原生不支持的新功能数据整合:将外部数据源与Roo Code连接自定义工具:创建适合特定工作流程的专用工具在第2章中,我们简单提到过MCP服务是Roo Code菜单栏的一部分,现在让我们深入了解它的工作原理和实际应用。

2025-03-16 14:11:20 886

原创 DataWhale 速通AI编程开发:(进阶篇)第3章 提示词(Prompts)配置项

这个配置项用于配置大语言模型回答的语言,默认是中文,也可以根据自己需求选择其他语言。这个配置项用于配置大语言模型在各个模式下(第二章提到的Code、Architect、Ask、Debug模式)要遵循的规则。这些指令适用于所有模式。它们提供了一套基础行为,可以通过下面的模式特定指令来进行增强。这个功能笔者认为没必要使用,因为下方一行小字:也就是说,我们可以通过在项目里新建.clinerules文件,将项目要求、技术栈等写入这个文件,让大语言模型依据特定的项目需求、技术栈等,生成符合要求的代码。

2025-03-15 15:54:43 1125

原创 DataWhale 速通AI编程开发:(基础篇)第2章 用Roo Code跑通你的第一个程序

通过以上步骤,我们使用Roo Code从零到一开发了一个番茄时钟项目,并进行了迭代优化。事实上,AI编程开发的过程就是从需求分析-项目开发-迭代升级-添加新需求的过程循环往复,最终得到一个满足用户需求的产品。至此,大家已经通关了AI编程开发,可以尝试使用上述方法,开发一个属于自己的AI编程项目。接下来的部分为“进阶”章节,让大家了解Roo Code的更多功能,同时让大家深入了解AI编程开发的一些技巧。

2025-03-15 15:05:44 695

原创 DataWhale 速通AI编程开发:(基础篇)第1章 环境下载、安装与配置

目前绝大多数deepseek非官方渠道均兼容openai的api格式,这里以。为例进行演示,其他非官方渠道同理。点击链接注册账号之后,点击“vscode 更新为最新版。“完成实名,然后点击左侧的。,输入描述信息之后,点击“”,即可完成密钥创建。

2025-03-14 18:16:38 331

原创 DataWhale 大语言模型 - 长上下文模型和新型架构

全局和局部自注意力(Global and Local Self-Attention):Longformer结合了全局自注意力和局部自注意力,全局注意力用于处理序列中的关键部分,而局部注意力则用于处理更广泛的上下文。相对位置编码(Relative Positional Encoding):相对于原始Transformer的绝对位置编码,Transformer-XL使用相对位置编码,这使得模型能够更好地处理长序列。随着研究的深入,未来可能会有更多创新的模型架构被提出,以更好地解决长文本处理的问题。

2025-03-14 17:31:26 637

原创 DataWhale 大语言模型 - 模型详细配置

本课程围绕中国人民大学高瓴人工智能学院赵鑫教授团队出品的《大语言模型》书籍展开,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。此外,随着技术的发展,新的优化技术和工具可能会出现,进一步影响模型配置的选择。隐藏单元数(Hidden Units):每个注意力头和前馈网络中的隐藏单元数决定了模型的容量,更多的单元可以提升模型的表达能力。层数(Depth):模型的层数越多,能够捕捉到的语言特征通常越复杂,但同时也增加了计算成本和过拟合的风险。

2025-03-14 17:21:01 749

原创 DataWhale 大语言模型 - Transformer模型介绍

多头自注意力(Multi-Head Self-Attention)机制:这是Transformer的核心,允许模型在不同位置上同时关注输入序列的不同部分,以捕捉序列内部的依赖关系。编码器-解码器注意力(Encoder-Decoder Attention):在解码器的某些层中,除了自注意力层,还有一个注意力层专门用于关注编码器的输出,以获取输入序列的全局信息。前馈神经网络(Feed-Forward Neural Network):在每个自注意力层之后,都会接一个简单的前馈网络,对每个位置进行相同的计算。

2025-03-14 17:13:28 1089

原创 DataWhale 大语言模型 - GPT和DeepSeek模型介绍

本课程围绕中国人民大学高瓴人工智能学院赵鑫教授团队出品的《大语言模型》书籍展开,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。并且,课程内容基于大量的代码实战与讲解,通过实际项目与案例,学员能将理论知识应用于真实场景,提升解决实际问题的能力。课程地址:https://www.datawhale.cn/learn/summary/107赵鑫教授团队:http://aibox.ruc.edu.cn/

2025-03-14 17:05:19 936

原创 DataWhale 大语言模型 - 大模型技术基础

本课程围绕中国人民大学高瓴人工智能学院赵鑫教授团队出品的《大语言模型》书籍展开,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。大语言模型预训练:预训练是大语言模型构建的初始阶段,通过海量无标注文本数据(如网页、书籍、对话记录)训练模型,学习语言的统计规律、语法结构和语义知识。涌现能力:涌现能力是指在复杂系统中,随着系统规模的增加或者系统复杂度的提升,系统会出现一些新的性质或行为,这些性质或行为在系统较小或较简单时是不明显的。

2025-03-14 16:45:24 391

原创 DataWhale 大语言模型 - 语言模型发展历程

本课程围绕出品的《大语言模型》书籍展开,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。并且,课程内容基于大量的代码实战与讲解,通过实际项目与案例,学员能将理论知识应用于真实场景,提升解决实际问题的能力。

2025-03-12 20:11:28 261

原创 DataWhale 动手学AI辅助编程 Task1:动手体验AI辅助编程:番茄钟

学习提要, 本次和大家一起探索 和AI协作设计应用、编写代码、完成应用开发 的魅力~内心有一种想做些东西的“冲动”或“需求”,但没有思路,想 学会引导AI按照自己的想法实现:有想法做一些程序,同时了解编程语言,但缺少实际开发的经验,想通过AI高效提升编程能力和开发经验:想学会引导AI协作编程,融入自己的开发工作流提升效率点击了解AI辅助编程是什么AI 是什么?

2024-12-24 08:30:12 721

原创 Tiny-universe 2:TinyRAG

LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。正是在这样的背景下,检索增强生成技术(Retrieval-Augmented Generation,RAG)应时而生,成为 AI 时代的一大趋势。RAG 通过在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程,极大地提升了内容的准确性和相关性。

2024-09-23 18:29:06 894

原创 Tiny-universe 1:Qwen整体介绍Qwen-blog

Qwen的整体架构与Llama2类似,如下图所示:tokenizerembeddingCasualseqclsmodelLinear。

2024-09-19 20:09:02 1972 1

原创 InternLM2_PracticalCamp_L2_task1_探索 InternLM 模型能力边界

在中选择双模型对话,与InternLM2.5及另外任意其他模型对话,收集InternLM2.5 输出结果不如其他模型的对话案例,以及 InternLM2.5 的Good Case,并写成一篇提交到:也可以自行部署收集 bad case 和 good case。

2024-08-25 18:22:15 800

原创 InternLM2_PracticalCamp_L2_task5_茴香豆:企业级知识库问答工具

是由书生·浦语团队开发的一款开源、专门针对国内企业级使用场景设计并优化的知识问答工具。在基础 RAG 课程中我们了解到,RAG 可以有效的帮助提高 LLM 知识检索的相关性、实时性,同时避免 LLM 训练带来的巨大成本。在实际的生产和生活环境需求,对 RAG 系统的开发、部署和调优的挑战更大,如需要解决群应答、能够无关问题拒答、多渠道应答、更高的安全性挑战。因此,根据大量国内用户的实际需求,总结出了的茴香豆知识问答助手架构,帮助企业级用户可以快速上手安装部署。

2024-08-25 17:47:09 650

原创 Datawhale AI 夏令营(第五期) 李宏毅苹果书 Task 3 《深度学习详解(进阶)》

卷积神经网络是一种强大的深度学习模型,在图像识别、围棋、语音识别等领域取得了显著的成果。通过感受野和参数共享的概念,卷积网络可以有效地提取图像特征,并减少过拟合风险。然而,卷积神经网络也存在局限性,需要根据具体任务进行优化和调整。

2024-08-24 14:43:14 187

原创 Datawhale AI 夏令营(第五期) 李宏毅苹果书 Task 2 《深度学习详解(进阶)》

TBD。

2024-08-24 14:42:29 177

原创 Datawhale AI 夏令营(第五期) 李宏毅苹果书 Task 1 《深度学习详解(进阶)》

TBD。

2024-08-24 14:22:19 138

原创 Datawhale AI 夏令营(第五期) 李宏毅苹果书 Task 3 《深度学习详解(入门)》- 2 机器学习框架&实践攻略

深度学习详解》的第二章,主要探讨了机器学习实践中的方法论,以及如何解决模型训练过程中可能出现的问题。

2024-08-24 14:15:14 139

原创 Datawhale AI 夏令营(第五期) 李宏毅苹果书 Task 2 《深度学习详解(入门)》- 1.2 了解线性模型

线性模型是深度学习的基础,虽然其局限性限制了其应用范围,但通过改进可以构建更复杂的非线性模型。深度学习模型具有强大的模型表达能力和泛化能力,是当前机器学习领域的研究热点。

2024-08-24 14:14:32 147

原创 Datawhale AI 夏令营(第五期) 李宏毅苹果书 Task 1 《深度学习详解(入门)》- 1.1 通过案例了解机器学习

在机器学习中,首先需要定义一个函数集合,这相当于确定可能解决问题的范围和方法。这个集合包含了所有可能的函数形式,机器学习的目标是从这个集合中找出最合适的函数。

2024-08-24 14:12:40 703

原创 InternLM2_PracticalCamp_L2_task6_MindSearch 快速部署的到 Hugging Face Space

和相比区别是把internstudio换成了github codespace。随着硅基流动提供了免费的 InternLM2.5-7B-Chat 服务(免费的 InternLM2.5-7B-Chat 真的很香),MindSearch 的部署与使用也就迎来了纯 CPU 版本,进一步降低了部署门槛。那就让我们来一起看看如何使用硅基流动的 API 来部署 MindSearch 吧。

2024-08-24 11:20:40 5057

原创 InternLM2_PracticalCamp_L2_task4_InternVL 多模态模型部署微调实践

InternVL 是一种用于多模态任务的深度学习模型,旨在处理和理解多种类型的数据输入,如图像和文本。它结合了视觉和语言模型,能够执行复杂的跨模态任务,比如图文匹配、图像描述生成等。通过整合视觉特征和语言信息,InternVL 可以在多模态领域取得更好的表现。

2024-08-22 20:47:20 756

原创 InternLM2_PracticalCamp_L2_task3_LMDeploy量化部署进阶实践

点选开发机,自拟一个开发机名称,选择镜像。我们要运行参数量为7B的InternLM2.5,由查询InternLM2.5-7b-chat的config.json文件可知,bfloat16所以我们需要大于14GB的显存,选择(24GB显存容量),后选择,等状态栏变成运行中,点击,我们即可开始部署。在终端中,让我们输入以下指令,来创建一个名为lmdeploy的conda环境,python版本为3.10,创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。

2024-08-22 20:37:22 1123

原创 InternLM2_PracticalCamp_L2_task2_Lagent 自定义你的 Agent 智能体

Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。Arxiv 搜索Bing 地图Google 学术搜索Google 搜索交互式 IPython 解释器IPython 解释器PPTPython 解释器在本节中,我们将带大家基于 Lagent 自定义自己的智能体。Lagent 中关于工具部分的介绍文档位于。继承BaseAction类实现简单工具的run方法;

2024-08-22 20:10:07 886

原创 Datawhale AI夏令营第四期 魔搭-AIGC方向 task03 进阶上分-实战优化

GUI 是 "Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI是GUI的一种,是基于节点工作的用户界面,主要用于操作图像的生成技术,ComfyUI 的特别之处在于它采用了一种模块化的设计,把图像生成的过程分解成了许多小的步骤,每个步骤都是一个节点。这些节点可以连接起来形成一个工作流程,这样用户就可以根据需要定制自己的图像生成过程。

2024-08-15 13:25:04 906

原创 Datawhale AI 夏令营第四期 大模型技术-微调 task3 数据增强与评分

如果你对baseline1的解读仍然充满困惑,那么推荐你从学习python开始,打好基础再来尝试也不迟~你可以学习《聪明办法学python第二版》打扎实深度学习相关的python基础知识~

2024-08-15 10:13:25 966

原创 Datawhale AI 夏令营第四期 大模型技术-微调 task2 baseline1精讲

大语言模型(英文:Large Language Model,缩写LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。通常,大语言模型 (LLM) 指包含数十亿Billion或更多)参数的语言模型,这些模型在大量的文本数据上进行训练,例如国外的有GPT-3 、GPT-4、PaLM 、Galactica 和 LLaMA 等,国内的有ChatGLM、文心一言、通义千问、讯飞星火等。大模型的能力和特点(1)大模型的能力。

2024-08-14 19:52:51 1155

原创 Datawhale AI夏令营第四期 大模型应用开发 Task3.3 案例:司法大模型

姓名性别手机号学校学历专业项目职责吴彦祖男xxxDataWhale研究生计算机应用技术项目策划、代码编写、文档撰写刘德华男xxxDataWhale本科生计算机科学技术项目参与、代码编写、文档撰写。

2024-08-14 16:07:34 741

原创 Datawhale AI夏令营第四期 大模型应用开发 Task3.2:案例:AI科研助手

姓名性别手机号学校学历专业项目职责xxx女xxxDataWhale研究生计算机科学技术项目策划、文档撰写xxx男xxxDataWhale本科生计算机科学技术代码编写、文档撰写。

2024-08-14 13:27:05 983

原创 Datawhale AI夏令营第四期 大模型应用开发 Task3.1:源大模型RAG实战

在上一节,我们成功搭建了一个源大模型智能对话Demo,亲身体验到了大模型出色的能力。然而,在实际业务场景中,通用的基础大模型可能存在无法满足我们需求的情况,主要有以下几方面原因:知识局限性:大模型的知识来源于训练数据,而这些数据主要来自于互联网上已经公开的资源,对于一些实时性的或者非公开的,由于大模型没有获取到相关数据,这部分知识也就无法被掌握。数据安全性:为了使得大模型能够具备相应的知识,就需要将数据纳入到训练集进行训练。

2024-08-14 13:19:10 1820

原创 Datawhale AI夏令营第四期 大模型应用开发 task1.2 提交作品规则 & Task1案例:智能编程助手

TBD。

2024-08-14 09:48:01 351

原创 Datawhale AI夏令营第四期 魔搭-AIGC方向 task02 精读代码,实战进阶

首先,我们来看下它的自我介绍。通义千问是具有信息查询、语言理解、文本创作等多能力的AI助手。我们可以看到,编程与技术支持能力是它的强项之一。(P1:通义千问自我介绍)接下来我们把场景聚焦到编程与技术支持这个方向,让他详细介绍下自己可以如何帮助大家编程。(P2:编程能力介绍)。通义千问的自我介绍 编程能力介绍话剧场景结合AI内容,自己在AI结果上做一些调整,最终整理出来场景表格场景 1现代足球。

2024-08-13 14:08:30 842

原创 InternLM2_PracticalCamp_L1_rask6_OpenCompass 评测 InternLM-1.8B 实践

接下来,我们将展示 OpenCompass 的基础用法,分别用命令行方式和配置文件的方式评测InternLM2-Chat-1.8B,展示书生浦语在C-Eval基准任务上的评估。更多评测技巧欢迎查看快速开始 — OpenCompass 0.3.0 文档文档~我们下节课再见!

2024-08-12 17:55:58 755

原创 InternLM2_PracticalCamp_L1_rask5_XTuner 微调个人小助手认知

下面我们将根据项目的需求一步步的进行修改和调整吧!在 PART 1 的部分,由于我们不再需要在 HuggingFace 上自动下载模型,因此我们先要更换模型的路径以及数据集的路径为我们本地的路径。为了训练过程中能够实时观察到模型的变化情况,XTuner 贴心的推出了一个。

2024-08-12 17:02:29 1018

An Event-Driven Approach for E-Services System Design

a paper about saas in e-services

2012-11-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除