- 博客(15)
- 收藏
- 关注
原创 架构演进:从RNN到Transformer 之 RNN
大模型技术的核心生成算法并非新概念,早期语音模型如Siri采用的RNN架构已暴露出明显局限。这种架构在处理长文本时效率低下,且记忆功能受限,无法有效存储大量上下文信息,导致理解复杂语言和多义词时存在困难。这些技术瓶颈预示着RNN无法满足现代语言处理的复杂需求,也为后续更先进模型的发展指明了方向。
2025-11-05 02:45:54
232
原创 重塑日常:大语言模型的“涌现”与“应用”
本文探讨了大语言模型(LLM)的应用潜力与发展趋势。文章指出,LLM不仅具备基础的词语预测功能,更具有高度的"可玩性",通过组合不同模块可实现多样化应用,如信息检索、语言互译、代码生成等交互功能。同时分析了模型规模与性能的关系,指出小模型经过微调也能在特定领域达到专业水平,就像专家一样精准。文章强调,模型选择应根据实际需求而定,既需要考虑通用性,也要关注专业化程度。这种灵活适配的特性,使得大语言模型在各领域展现出广阔的应用前景。
2025-11-05 00:30:05
289
原创 生成式人工智能与LLM
本文基于吴恩达LLM课程笔记,介绍了大语言模型(LLM)的核心概念与应用。LLM通过数十亿参数形成的复杂关系网络,模拟人类语言和知识的统计规律。其运作机制分为三个关键步骤:输入编码将文本转换为数学向量;多层处理通过注意力机制和前馈网络进行信息加工;最终解码输出概率最高的词。文章阐述了LLM的两种使用方式:直接调用开源模型或进行任务微调,并强调了提示词编写的重要性。通过"法国首都"的案例,详细展示了模型如何通过数学计算实现看似智能的应答。本质上,LLM的"思考"是信息在
2025-11-04 01:40:17
993
原创 React Native Expo 初级开发指南
React Native Expo是一个基于React Native的开发平台,旨在简化跨平台移动应用开发流程。它由Expo SDK、CLI和Go应用组成,提供开箱即用的开发环境、60+个API模块和云端构建服务。相比原生React Native,Expo显著降低了开发门槛,无需配置原生工具即可快速启动项目。典型功能包括设备功能访问(如相机、位置)、UI组件和开发服务(Expo Go、Snack等)。通过统一API接口和简化构建流程,Expo提高了开发效率,适合Web开发者快速构建移动应用。实际案例展示了如
2025-09-07 23:14:31
853
原创 Python进阶篇:Scikit-Learn 线性回归详解
线性回归是一种用于预测连续数值的机器学习算法,它通过找到一条最佳拟合直线来描述自变量(特征)和因变量(目标)之间的关系。yw_0。
2025-06-09 01:35:21
1268
原创 Python进阶篇:Scikit-Learn K近邻分类算法详解
动手实践在Jupyter Notebook中运行示例代码尝试修改参数观察效果变化可视化学习# 二维数据分类边界可视化plt.title('KNN分类边界')plt.show()探索进阶应用使用构建邻居图结合KNN和距离进行异常检测在分布式环境下部署大规模KNN。
2025-06-09 00:57:43
925
原创 Python进阶篇:Scikit-Learn 机器学习流程详解
关键要点了解数据集结构(特征/目标变量)正确处理数据预处理(特别是归一化/标准化)始终使用独立的测试集评估模型根据任务类型选择合适的评估指标保存重要参数(如随机种子)确保结果可复现。
2025-06-09 00:47:24
787
原创 Python基础篇:大模型训练基础——数据可视化(折线图)
本文介绍了使用Python的Matplotlib库进行数据可视化的基础知识。首先讲解了如何导入matplotlib.pyplot模块(简写为plt)来调用绘图工具。接着以折线图为例,详细解析了plot()函数的参数设置:包括核心数据参数x/y、格式字符串参数(颜色/标记/线型组合)以及精细控制的关键字参数(线宽、标记大小等)。文章还强调了图像输出的正确顺序:先保存(savefig)后显示(show),并提供了保存高质量图片的参数设置技巧。最后通过一个正弦曲线绘制的完整代码示例,展示了如何综合运用这些参数创建
2025-06-08 19:42:07
1168
原创 Python基础篇:大模型训练基础——数据可视化(散点图)
摘要:本文介绍了使用Python的matplotlib库绘制散点图的方法。首先需导入matplotlib.pyplot模块(简写为plt),重点讲解了scatter()函数的核心参数(x/y坐标、点大小、颜色、形状)和样式控制参数(透明度、边缘线宽等)。文章强调随机数在散点图中的作用(模拟数据、测试模型、教学演示等),并提供了完整的代码示例,包括数据生成、图表绘制(两组不同颜色/形状的数据点)、坐标轴设置、图例添加等步骤,最后展示了图像保存和显示方法。通过固定随机种子确保结果可复现。
2025-06-08 18:19:24
1288
原创 上海市星光杯:人工智能训练师(模拟题题库)
【解析】提示工程(Prompt Engineering)是一种通过精心设计和优化输入提示,使人工智能系统能够更好地理解和响应用户需求的技术。72.在安装书生灵笔多模态大模型所需的 Python 库时,( )版本的 PyTorch 是推荐的。69.书生灵笔 2.5 的“思维链”(CoT)和“直接偏好优化”(DPO)技术主要用于( )75.在高分辨率图像处理的应用场景中,书生灵笔多模态大模型的功能包括以下的方面是( )111.文生图技术中的“Text-to-Image Synthesis”是指的是( )
2025-05-27 21:21:35
1957
原创 Agent和LLM之间的关系
致谢Datawhale社区提供的开源学习资料,以及每一位社区共建者coze-ai-assistant-课程详情 | Datawhale(摘抄自本人《认识Ai工作流》摘取自《从ChatGPT到Manus》感知能力:智能体能够感知或观察环境状态(流程图中的“观察”步骤),并获取任务完成的反馈信息。自主决策:智能体具备自主规划能力(“计划”步骤),能够根据当前环境和任务要求制定执行方案。执行能力:智能体能够根据计划执行相应动作(“执行”和“工具调用”步骤),并实际影响环境或完成任务。反馈循环。
2025-05-15 02:37:10
1054
原创 认识AI工作流
文章摘要:本文探讨了工作流和智能体(Agent)在业务流程中的应用及其区别。工作流通过结构化流程、条件分支、模块化设计等特点,实现任务的自动化和高效执行,适用于规则明确、步骤固定的业务处理。而智能体则具备感知、决策、执行和反馈的自主智能行为体系,适合需要动态调整和自主决策的复杂场景。文章通过实例说明,工作流在电商数据处理和制造业供应链分析等业务中的重要性,强调设计好工作流是提升整体业务效率的关键。
2025-05-13 01:12:54
1297
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅