自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 AI应用开发工程师必懂常识

大家可以提前注册阿里云百炼,获取 dashscope apikey,用于后续的使用。完成认证后,在左下角有 API-Key,创建我的 API-Key 即可。

2025-12-08 19:50:16 792

原创 优快云的在线客服入口(3秒找到)

摘要:通过优快云官网可快速联系在线客服,只需访问官网首页,滚动页面至左侧找到在线客服入口,输入"人工服务"即可与客服人员实时沟通。该方法简单直接,适合需要快速解决问题的用户。

2025-12-07 16:03:17 73

原创 DeepSeek数据飞轮大揭秘

数据飞轮是一种AI持续优化的机制,通过"数据收集-处理-模型更新-反馈"的闭环实现智能进化。以智能咖啡馆为例,顾客反馈帮助系统自动调整咖啡配方,形成良性循环。海天瑞声与华为昇腾合作的数据飞轮智能体,将传统数天的数据处理缩短至10分钟,模型性能提升35%。某医院智能问诊系统应用后,准确率从75%提升至92%,患者满意度显著提高。这种机制让AI像不断进化的智能咖啡馆,用户反馈越多系统越精准,形成自我强化的增长飞轮。

2025-12-07 15:28:21 578

原创 AI模型-MCP详解(秒懂版)

摘要: MCP(模型上下文协议)是AI领域的通用接口标准,类似"USB-C",支持跨模型工具集成;Function Call则是模型内置的单一功能(如查天气)。核心区别在于:MCP支持多轮对话和复杂任务(如自动生成分析报告),具有开放生态和企业级安全;Function Call适合简单需求但缺乏上下文记忆。MCP让AI从执行单次命令升级为连贯处理复杂流程,如同从"点菜"进化到"自主做饭"。两者互补,MCP侧重长期生态,Function Call适合

2025-12-05 15:28:58 961

原创 Agent与Copilot的区别(秒懂版)

摘要: Agent与Copilot在金融场景中的核心差异在于自主决策与执行能力。Agent是“智能管家”,能自动完成数据查询、报告生成、邮件发送等闭环操作(如10秒生成专业报告);Copilot仅是“智能助手”,仅提供文本补全建议(如补全“今日市场涨了”),无法调用系统或验证数据。 关键区别: Agent:自主规划→执行→反馈(如自动处理客户投诉); Copilot:仅补全文字,需人工干预(如建议报告开头但无数据支撑)。 金融价值: Agent提升效率20倍(自动化闭环),Copilot仅辅助输入(效率有限

2025-12-04 01:03:27 930

原创 Cursor相关知识解答

本文对比了Cursor、Trae、CodeBuddy、PyCharm和VS Code等开发工具在语言支持、AI功能、适用场景等方面的差异。重点介绍了Cursor的中文设置方法、基础界面操作,以及其三种工作模式(Agent、Ask、Manual)的特点和适用场景。同时说明Cursor需要注册但非强制购买会员,并推荐了Trae等免费替代工具。文章为开发者提供了工具选型参考和使用指南。

2025-12-03 18:01:51 997

原创 CodeBuddy-Rules配置

本文介绍了CodeBuddy IDE中Rules功能的定义与使用方法。Rules分为User Rules(个人全局规则)和Project Rules(项目级别规则)两种:User Rules适用于所有项目,定义个人编码偏好;Project Rules包含三种触发类型(Always、Agent Requested、Manual),用于定义项目规范。用户可通过@符号手动引用Manual类型的Rules。文章最后提供了个人常用的Rules配置示例,包括项目规则(如保留原有功能、中文注释等)和全局规则(如中文回复、

2025-12-02 19:57:13 409

原创 DeepSeek的创新-DeepSeek-MoE大揭秘

DeepSeek-MoE是一种创新的混合专家模型,采用类似医院分诊系统的智能架构。该系统包含三个核心组件:智能分诊台(Router)负责初步判断问题类型,专科专家(Expert)专注于特定领域问题,基础专家(Shared Expert)处理通用任务。与传统模型不同,它通过动态激活相关专家而非全部参数,显著提升效率。其创新点包括细粒度专家划分、共享专家分离和优化的任务分配机制,既节省计算资源又提高专业度。类比智能音箱的工作原理,DeepSeek-MoE确保每个问题都能被最合适的专家处理,实现高效精准的AI推理

2025-12-01 12:30:06 542

原创 DeepSeek的创新-混合精度框架

DeepSeek混合精度框架创新性地将AI模型训练比作"智能厨房",通过关键步骤高精度(BF16/FP32)与普通步骤低精度(FP16/FP8)的智能组合,实现了三大突破:显存占用降低40-60%、计算速度提升2-3倍、同时保持模型精度。该框架采用动态梯度缩放技术,像"智能调味师"般精准控制关键参数,成为首个在超大规模模型上验证FP8训练有效性的方案,将训练成本从数亿美元降至557万美元。这种"精确+高效"的混合策略,为AI大模型训练提供了更经济的

2025-12-01 12:26:25 434

原创 DeepSeek-蒸馏和量化详解

摘要: 蒸馏和量化技术可大幅压缩大模型,使其适用于移动设备。蒸馏如同美食大师传授精髓(关键知识),学生模型只需学习核心要点而非全部细节,即可接近教师模型性能。量化则将高精度模型(如FP32)压缩为低精度格式(如INT8),如同高清电影转为MP3,体积缩小但效果相近。两者结合后,模型显存占用可降低93.3%,推理速度提升20%,性能损失仅3%。这使大模型能高效运行于手机等资源受限设备,实现"小模型,大能力"。 (150字)

2025-11-30 14:10:38 744

原创 什么DeekSpeek居然自己会学习?

摘要: SFT(监督微调)和RL(强化学习)是两种不同的AI训练方法。SFT如同老师手把手教学,提供标准答案让AI模仿,结果稳定但缺乏创造性;RL则让AI通过试错自行探索,虽然学习过程较慢但更具适应性和创新性。实际应用中,SFT适合标准化任务,RL更适合需要个性化的复杂场景。研究表明,RL在复杂任务中的表现(97%)优于SFT(90%)。理想的AI训练应结合两者:先用SFT打好基础,再用RL提升灵活性,使AI既安全又智能。

2025-11-30 14:01:12 550

原创 AutoDl算力平台使用教程(保姆级)

autodl.com 是中国最大的面向 C 端租云端 GPU 的平台,在 autodl 上可以直接租一个带有 GPU 的服务器(通常会配备同样水平的cpu,内存),Autodl 平台主要用来运行需要下载本地模型的实验。

2025-11-29 13:01:22 1425

原创 为什么在Prompt优化中用CoT(思维链)

摘要: CoT(思维链)提示词通过拆解复杂问题为小步骤,提升AI回答的准确性和可解释性。核心优势包括:1️⃣ 避免跳步错误,如数学题分步计算;2️⃣ 增强透明度,展示推理过程;3️⃣ 解决复杂任务,如旅行规划分步分析。生活化案例显示,CoT让AI推荐更合理(如选手机时对比参数)且易理解(如减肥方案评估)。对比普通Prompt,CoT输出更可靠,用户信任度更高,是优化AI交互的实用工具。

2025-11-29 03:00:58 848

原创 DeepSeek的创新-MLA详解

摘要:MLA(Memory-efficient Linear Attention)工作原理可通过"智能导购系统"类比理解:传统MHA需要记忆每个零食精确位置(显存占用大),而MLA像超市导购系统,只需记住"薯片在A区"这类压缩信息(显存占用小)。系统先定位类别区域(潜在向量),再在指定区域解码具体位置(Key/Value),实现快速检索(推理效率高)。这种方法既保持效果又显著降低显存需求,如同智能导购用"类别记忆"替代"精确位置记忆&qu

2025-11-28 15:20:07 430

原创 ChatGPT是如何训练出来的?

chatgpt训练过程

2025-11-28 12:56:59 643

原创 为啥通义灵码插件返回的数据是英文?

摘要: PyCharm中通义灵码返回英文的问题,主要是由于PyCharm默认语言设置为英文,且插件未适配中文或未更新所致。解决方法分三步:1)将PyCharm系统语言改为中文(关键步骤);2)检查通义灵码插件语言设置并调整为中文;3)更新插件至最新版(如v2.3.1)。金融从业者尤其受益于中文输出,可节省翻译时间,提升效率。30秒操作即可解决问题,确保插件返回中文内容。

2025-11-27 14:08:24 541

原创 LLM(大模型)中Message参数详解

📝 摘要(148字) messages参数是LLM的"对话笔记本",记录每轮对话(用户提问+AI回复)。以Qwen-Max为例: 1️⃣ 容量:上限32,768 tokens(约655轮对话),实际推荐50-100轮避免溢出 2️⃣ 限制:超限后自动删除最早消息(阿里云硬性截断) 3️⃣ 解决方案: 代码自动清理旧消息(保留最近20轮) 直接依赖DashScope的自动截断功能 4️⃣ 类比:类似微信聊天记录,LLM只"记得"近期对话,超长部分自动遗忘。新手需注意控

2025-11-26 15:25:02 424

原创 阿里云的DashScope详解

阿里云DashScope是一个AI服务调用平台,用户无需训练模型或部署服务器,通过简单API调用即可快速获取AI能力。它提供文本生成、情感分析、代码解释等功能,就像"AI外卖平台"一样随点随用。与阿里云百炼不同,DashScope专注于直接调用现成AI服务,而非模型训练管理。用户只需获取API Key,复制代码示例,就能在30秒内体验AI服务,适合需要快速应用AI能力而无需底层开发的场景。

2025-11-26 12:31:13 546

原创 Coze相关问题

Coze平台常见问题摘要:数据库不支持直接导出本地,可通过HTTP插件同步保存;工作流查询问题可能因模型不稳定性导致,建议检查中间节点输出;多用户模式下需注意数据库节点配置和渠道隔离;插件JSON格式错误需按标准格式调整;界面跳转功能目前仅支持固定页面,下拉组件无法引用不同工作流。

2025-11-26 07:45:00 158

原创 安装Python代码依赖

在 Python 开发中,“依赖包”(也叫第三方库、模块、库)是指别人已经写好、可以被你直接使用的代码。这些功能如果你自己从头写,可能要花几周甚至几个月。而用别人写好的包,一行就能用。比如,numpypandasflaskmatplotlibpip 是 Python 官方推荐的包管理工具(Package Manager),它的作用就像:手机上的“应用商店”(App Store / 应用宝),能自动从(Python Package Index)下载你需要的包。在终端执行pip list来查看所有安装的包。

2025-11-25 14:47:33 365

原创 Python相关问题

本文解答了Python使用中的常见问题:1)推荐使用Python 3.10及以上版本;2)遇到模块缺失报错时,可通过pip安装对应包,建议使用清华源加速;3)解释了.py和.ipynb格式的区别及转换方法;4)详细说明了Windows系统环境变量设置步骤;5)提供使用镜像源加速库安装的方法;6)介绍了Anaconda的下载安装流程及Jupyter/Spyder的启动方式。

2025-11-24 17:40:57 474

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除