- 博客(109)
- 收藏
- 关注
原创 Datawhale Hello-Agents入门篇202512第2次作业
PSSH认为智能必须且只需符号操作,但符号主义实践中的问题显示它可能不够用,而LLM用非符号方式实现了智能,打破了PSSH的“必要性”。
2025-12-21 22:56:45
639
原创 Datawhale 用Markdown语法轻松开发AI应用202512 第1次作业
目录: E:\Datawhale\Markdown202512\vibe-coding-app\demo。单独安装charset-normalizer(自动适配Python 3.12的版本)# 将.env.example 文件复制为 .env。# 修改 .env 文件中的内容。# 2. 修改配置文件。
2025-12-16 18:47:57
758
原创 Datawhale Hello-Agents入门篇202512第1次作业
Case A 不属于智能体,因为它缺乏自主性和目标导向行为。Case B、C 和 D 都属于智能体,但类型不同:B 侧重于自主和反应式,C 侧重于理性和规划,D 侧重于社交和对话。这些分类维度帮助理解智能体的多样性和应用场景。2. 假设你需要为一个"智能健身教练"设计任务环境。这个智能体能够:请使用 PEAS 模型完整描述这个智能体的任务环境,并分析该环境具有哪些特性(如部分可观察、随机性、动态性等)。
2025-12-16 18:07:41
662
原创 不要将包含API密钥的 .env 文件提交到版本控制系统中
永远不要将包含API密钥的 .env 文件提交到版本控制系统中- 如果您计划使用Git,建议创建一个 .gitignore 文件并添加 .env 条目。
2025-12-16 14:45:36
417
原创 Datawhale 吴恩达Agentic AI 202511第1次作业
比如你让它“生成一张女孩以特定姿势读书的图片”,它会自己决定先提取姿势,再生成图片,最后合成。派出好几个“分身”,一个去搜资料A,一个去搜资料B,一个去整理图片,最后再汇总。虽然步骤多了,但因为能“多线程”并行工作,总时间反而大大缩短。比如,一个智能体当“研究员”负责查资料,一个当“写手”负责起草,一个当“编辑”负责润色和挑错。给AI配备各种“武器”,让它能搜索网络、查询数据库、执行代码、发送邮件等,不再只是“空想”。在“写作”步骤用GPT-4,在“总结”步骤用Claude,挑每个环节最擅长的模型来用。
2025-11-11 02:25:36
320
原创 Datawhale hello-agents202511 第1次作业
Case A 不属于智能体,因为它缺乏自主性和目标导向行为。Case B、C 和 D 都属于智能体,但类型不同:B 侧重于自主和反应式,C 侧重于理性和规划,D 侧重于社交和对话。这些分类维度帮助理解智能体的多样性和应用场景。2. 假设你需要为一个"智能健身教练"设计任务环境。这个智能体能够:请使用 PEAS 模型完整描述这个智能体的任务环境,并分析该环境具有哪些特性(如部分可观察、随机性、动态性等)。
2025-11-11 01:53:33
983
原创 Datawhale人工智能的数学基础 202510第5次作业
text可交换性二维旋转:可交换(R(θ)R(φ) = R(φ)R(θ))三维及以上:一般不可交换应用领域机器人学:关节控制计算机图形学:物体变换数据处理:坐标变换抽象→几何:把代数概念可视化有限维→无限维:向量→函数数据理解:投影=信息提取,旋转=视角变换。
2025-10-24 17:19:40
1107
原创 Datawhale人工智能的数学基础 202510第4次作业
text💡对比发现同一个向量在不同内积下长度不同!这就像用不同单位的尺子测量同一物体公式💡几何意义两点之间的距离 = 连接它们向量的长度核心公式💡几何意义夹角余弦值 = 两向量的"相似度"指标值越接近1,方向越相似;越接近-1,方向越相反数学保证在[0, π]范围内,角度与余弦值一一对应正交〈x, y〉 = 0⇔x ⊥ y单位正交:正交 + 两个都是单位向量 (text💡关键发现同一个向量对在不同内积下可能正交,也可能不正交!
2025-10-23 23:46:44
791
原创 Datawhale OpenAI官方智能体框架202510 作业5
并行执行机制:通过asyncio.gather等Python原生方式并行运行多个智能体,适用于无依赖关系的批量任务加速。构建处理链:将任务分解为串联的智能体流水线,比如博客写作可拆分为研究->大纲->撰写->润色->改进等环节。使用结构化输出:生成规范数据供代码逻辑判断,例如先让智能体对任务分类,再根据类别选择后续智能体。实现评估循环:在while循环中,执行智能体与评估智能体持续交互,直到输出满足预设标准。输出护栏:在最终智能体输出时运行。护栏对用户输入进行检查和验证。输入护栏:在初始用户输入时运行。
2025-10-22 12:45:58
220
原创 Datawhale OpenAI官方智能体框架202510 作业4
代码2可以自定义handoff工具的名称和描述代码1使用系统默认的工具名称和描述。
2025-10-21 13:58:47
1067
原创 Datawhale OpenAI官方智能体框架202510 作业3
在某些情况下,您可能希望在将工具代理的输出返回给中央代理之前对其进行修改。如果您想: 从子代理的聊天历史中提取特定信息(例如JSON payload)。转换或重新格式化代理的最终答案(例如,将Markdown转换为纯文本或CSV)。当代理的响应缺失或格式错误时,验证输出或提供回退值。import os# 加载环境变量# 从环境变量中读取api_keyname="信息抽取",instructions="抽取name和position信息为json格式",model=llm,
2025-10-20 00:07:06
1000
原创 Datawhale人工智能的数学基础 202510第1次作业
如果他只是背下了所有题目的答案(记忆训练数据),但没理解背后的知识点,遇到新题型就会考砸。这意味着我们不是一条一条地写死规则(比如“如果天气是晴天,且温度高于25度,则推荐冰淇淋”),而是设计一个通用的方法,让电脑自己从大量数据里找出规律。比如,我们认为“房价”和“面积”是线性关系,那么就可以选择一个“线性模型”:房价 = a × 面积 + b。比如:把描述一个人喜好的100个指标,压缩成“动漫迷”、“运动达人”等2-3个标签。比如:根据用户的消费数据,判断他属于“高消费群体”的概率有多大。
2025-10-14 22:05:09
766
原创 Datawhale OpenAI官方智能体框架202510作业1
import os# 1. 加载环境变量和初始化客户端raise ValueError("❌ 请在 .env 文件中设置 DASHSCOPE_API_KEY")# 2. 定义所有 PromptSYS_PROMPT = """你是一个聪明的客服。您将能够根据用户的问题将不同的任务分配给不同的人。您有以下业务线:1. 用户注册。如果用户想要执行这样的操作,您应该发送一个带有"registered workers"的特殊令牌。并告诉用户您正在调用它。2. 用户数据查询。
2025-10-13 23:18:25
858
原创 datawhale RAG技术全栈指南 202509 第6次作业
将结构化知识图谱融入RAG流程的新范式——KG-RAG应运而生。通过利用知识图谱的显式语义关系和图结构优势,KG-RAG能够提供更精准的上下文检索和更强的推理能力,在多跳查询和事实性要求较高的场景中表现尤为出色。大多数KG-RAG框架遵循一个通用的三阶段流程:知识图谱构建、图谱检索与增强生成。
2025-10-04 23:49:57
876
原创 datawhale RAG技术全栈指南 202509 第5次作业
2025-10-03 12:38:46,361 - rag_modules.index_construction - INFO - 正在初始化嵌入模型: E:/Datawhale/All in rag 202509/code/all-in-rag-main/models/bge-small-zh-v1___5。如果直接用整个文档分块,就失去了检索的精确性优势。菜品分类: ['水产', '早餐', '调料', '饮品', '荤菜', '其他', '汤品', '主食', '素菜', '甜品']
2025-10-03 12:43:15
945
原创 datawhale RAG技术全栈指南 202509 第4次作业
简单说,就是数据的"身份证信息":视频:标题、作者、时长、观看次数文档:来源、日期、类别、作者商品:价格、品牌、评分、库存。
2025-10-01 00:45:33
1080
原创 Datawhale Happy-LLM 202509 第8次作业
架构就像一位专业的"作家",它不需要深度理解输入,而是专注于如何流畅地生成文本。正是这种专注,让它成为了当今大语言模型的基石。想象一下,如果AI模型不是"全才",而是专攻"创作"的"作家",会是什么样子?让GPT掌握了语言的生成规律,成为真正的"文本创作专家"。——当今所有大语言模型(如ChatGPT)的核心架构!模型通过看例子就能学会判断,不再需要大量训练数据。当GPT系列闭源发展时,Meta公司推出了开源的。实现"涌现能力",开启大模型时代。,让更多人能够接触和使用大模型。让AI的使用变得极其简单。
2025-09-27 13:08:53
590
原创 Datawhale 理工科-大模型入门实训课程 202509 第4次作业
因此,当我们进行 LLM SFT 以提升 LLM 在指定下游任务的表现时,我们需要将训练数据构造成上述格式,并对数据集进行处理来支持模型微调。接下来,我们以角色扮演任务(要求 LLM 扮演甄嬛,以甄嬛的语气、风格与用户对话)为例,演示如何进行微调数据集构造。请大家选择一个 NLP 经典任务(例如情感分类、命名实体识别等),收集该任务的经典训练数据对 Qwen3-4B 进行微调,并评估微调后模型在该任务上的效果。小姐,别的秀女都在求中选,唯有咱们小姐想被撂牌子,菩萨一定记得真真儿的——<|im_end|>
2025-09-27 02:43:16
597
原创 Datawhale Happy-LLM 202509 第7次作业
这就像给AI的思维过程加上了一个"稳定器",确保它在处理信息时不会"想歪了"。T5模型告诉我们:有时候,最复杂的问题往往有最简单的解决方案——把一切都看作是"从A到B"的转换。想象一下,如果有一个AI模型,既能做翻译,又能写摘要,还能回答问题,就像一位精通所有语言任务的"万能翻译官"。结构让T5既能深度理解输入内容,又能流畅地生成输出结果,就像既有专业的"听力理解员",又有优秀的"口语表达员"。这种训练让T5掌握了语言的深层规律,为它的"万能"能力打下了基础。T5的模型设计非常巧妙,就像一套。
2025-09-27 00:47:03
1444
原创 datawhale RAG技术全栈指南 202509 第3次作业
下载安装时勾选:✅(推荐)✅安装完成后重启电脑💡 需要 Windows 10/11 64位,且启用 WSL2(Docker Desktop 会自动配置)。
2025-09-25 23:54:53
496
1
原创 datawhale玩转通义四大新模型 202509 第6次作业
探索Qwen3-30B-A22B的玩法作业:帮我用 HTML/CSS 设计一个响应式的作品集网站prompt:帮我用 HTML/CSS 设计一个响应式的作品集网站当然可以!下面是一个简洁、现代且的个人作品集网站(Portfolio Website)的完整 HTML/CSS 代码。
2025-09-24 20:59:23
180
原创 Datawhale Happy-LLM 202509 第6次作业
白话搞笑版本笔记:嘿,同学们!还记得我们上次聊到的那个叫Transformer的“AI超级大脑”吗?它就像一家超级厉害的“语言公司”,里面有两个核心部门:一个是专门负责深度理解的Encoder(理解部),另一个是专门负责流畅创作的Decoder(创作部)。最初,这个“超级大脑”两个部门配合得天衣无缝。但后来,AI江湖里的高手们发现:“咦?如果让它们各自专精一项,会不会更厉害?”于是,一场精彩的“AI武林大会”拉开了序幕,演化出了三大名震江湖的门派!江湖绰号: “完形填空”学霸独家秘籍: 只用理解部(Enc
2025-09-24 11:40:59
748
原创 Datawhale 理工科-大模型入门实训课程 202509 第3次作业
写好一条提示词,本质上是把人类意图翻译成模型可执行的“程序”。当你熟练运用“任务—主体—细节—形式”这一最小公式后,再复杂的场景也能被拆解成四个可填空的位置,像搭积木一样快速拼装。最后再根据任务的特性,使用一些提示词技巧来让提示词更有效。下一次打开对话框时,不妨先写下四行字:“ 做什么?对谁做?要做到哪一步?要以什么形态交?” 当这四问都有答案,模型便不再是黑箱,而是你手中最听话的笔。
2025-09-23 23:43:04
340
原创 datawhale玩转通义四大新模型 202509 第4次作业
帮我用P5.j5写一个酷炫的流体画笔粒子特效,鼠标点击拖搜过的地方触发画笔效果。帮我用P5.js写一个浪漫烟花的粒子特效,鼠标点击触发爆炸,烟花用爱心形状的。
2025-09-22 23:33:17
213
原创 datawhale玩转通义四大新模型 202509 第3次作业
功能操作目标输出用途高清修复提升图像清晰度3D 建模参考图智能抠图分离人物主体贴图、动画绑定艺术风格生成卡通/素描版本低多边形模型参考背景替换替换为纯色或虚化背景更专注的人物建模。
2025-09-22 16:12:55
676
原创 Datawhale Happy-LLM 202509 第5次作业
Embedding 层的输入往往是一个形状为 (batch_size,seq_len,1)的矩阵,第一个维度是一次批处理的数量,第二个维度是自然语言序列的长度,第三个维度则是 token 经过 tokenizer 转化成的 index 值。在注意力机制的计算过程中,对于序列中的每一个 token,其他各个位置对其来说都是平等的,即“我喜欢你”和“你喜欢我”在注意力机制看来是完全相同的,但无疑这是注意力机制存在的一个巨大问题。在深度学习中,承担这个任务的组件就是 Embedding 层。
2025-09-22 10:48:30
802
原创 Datawhale Happy-LLM 202509 第4次作业
第二个注意力层是一个多头注意力层,该层将使用第一个注意力层的输出作为 query,使用 Encoder 的输出作为 key 和 value,来计算注意力分数。最后,再经过前馈神经网络,搭建一个 Decoder 块。残差连接,即下一层的输入不仅是上一层的输出,还包括上一层的输入。完成上述 Encoder、Decoder 的搭建,就完成了 Transformer 的核心部分,接下来将 Encoder、Decoder 拼接起来再加入 Embedding 层就可以搭建出完整的 Transformer 模型啦。
2025-09-21 08:44:41
583
原创 conda激活虚拟环境
在项目目录下,推荐使用前面配置好的 Miniconda 来创建 Python 虚拟环境。如果严格安装上述流程当前应该在项目根目录,进入code目录安装依赖库。
2025-09-19 15:16:38
531
原创 Datawhale Happy-LLM 202509 第3次作业
例如,当我们有一篇新闻报道,我们想要找到这个报道的时间,那么,我们的 Query 可以是类似于“时间”、“日期”一类的向量(为了便于理解,此处使用文本来表示,但其实际是稠密的向量),Key 和 Value 会是整个文本。通过对 Query 和 Key 进行运算我们可以得到一个权重,这个权重其实反映了从 Query 出发,对文本每一个 token 应该分布的注意力相对大小。而在自然语言处理领域,我们往往也可以通过将重点注意力集中在一个或几个 token,从而取得更高效高质的计算效果。究竟什么是注意力机制?
2025-09-19 11:31:19
255
原创 如何下载huggingface的文件
在运行Python脚本之前,在命令提示符中使用。右键点击"此电脑"或"我的电脑",选择"属性"在"系统变量"部分,点击"新建"在PowerShell中,使用。# 然后继续您的代码...点击"确定"保存所有更改。# 其余代码保持不变。点击"高级系统设置"点击"环境变量"按钮。
2025-09-19 10:19:15
382
原创 在vscode中,在powershell 下,如何进入子目录?
在VS Code的PowerShell终端中切换目录很简单。这样可以确保PowerShell正确地将整个带空格的路径名识别为一个参数。在PowerShell中处理带空格的路径时,:如果你在文件管理器复制了文件夹路径,可以直接在终端中。如果你希望每次在VS Code中新建终端时,它都自动在。这是最方便快捷的方式,终端会自动切换到该目录。这样,终端就会在当前活动文件所在的目录中打开了。:如表格中所述,在文件资源管理器中。,确认你是否进入了正确的地方。在切换目录后,你可以使用。
2025-09-19 09:08:43
631
原创 datawhale玩转通义四大新模型 202509 第2次作业
阿黑表情凶狠(龇牙、瞪眼)/ 开心(咧嘴大笑、摇尾巴幅度夸张),舌头收回 / 位置怪异,耳朵下垂 / 弯折,背景有杂物(如地毯纹路、家具边角),毛发粗糙无光泽 / 结块,光影怪异(面部一半亮一半暗、有明显阴影断层),对话框字体过大 / 过小、颜色异常(如红色、蓝色),画面模糊(边缘锯齿状、细节模糊),特写范围过大(包含身体大部分),眼睛无神(瞳孔过小、无反光)。漫画风格,狗是黑贝品种,背是黑色,腿的内部是棕色,嘴是棕色,耳朵里面是棕色,耳朵是立着的。正向 Prompt。正向 Prompt。
2025-09-18 11:14:04
307
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅