自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(385)
  • 收藏
  • 关注

原创 【自然语言处理与大模型】LangChainV1.0入门指南:AgentState介绍

AgentState是LangChain中用来表示智能体在执行过程中描述当前状态的核心数据结构。它是整个工作流的“上下文容器”或“共享内存”,在各个节点之间传递,并随着流程推进不断被读取、修改和持久化。所以我一般叫他“运行时上下文状态对象”

2025-12-24 23:46:30 301

原创 【学习心得】Python的TypedDict(简介)

如果只需要静态类型提示,TypedDict更轻量;如果需要运行时数据验证,建议使用Pydantic。

2025-12-24 23:09:15 208

原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Messages

LangChain中的Messages是模型交互的基本单元,包含角色(role)、内容(content)和元数据(metadata)。支持多种提示词类型:文本提示、消息对象提示和OpenAI格式提示。消息对象包括HumanMessage(用户输入)、AIMessage(模型响应)、SystemMessage(系统指令)和ToolMessage(工具调用),支持多模态内容(文本/图像等)。通过标准化消息类型确保跨模型一致性,同时保留直接使用字符串或元组的兼容性。

2025-12-22 22:39:02 247

原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Tools

本文介绍了LangChainV1.0中三种创建工具的方法及其在大模型和智能体中的使用方式。

2025-12-22 22:25:34 679

原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Agents

本文介绍了如何使用LangChain快速搭建基于ReAct范式的智能体。主要内容包括:1)通过create_agent函数创建智能体,只需指定语言模型和系统提示词;2)演示了智能体的基本使用方法,通过inputs字典传递用户消息并获取响应。文章还指出智能体可扩展工具功能,当前示例为基本版本,仅能基于模型知识回答问题。

2025-12-20 23:57:06 357

原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Models

本文介绍了LangChain的核心组件Models,并给出了接入Chat模型和Embedding模型的方法。

2025-12-20 23:15:13 1048

原创 【学习心得】基于FunASR推理的SenseVoiceSmall模型来实现语音识别

SenseVoiceSmall是一款工业级多语言音频理解模型,支持语音识别、情感分析等功能,覆盖中文、英语等多种语言,可通过魔搭社区下载。FunASR是阿里巴巴开源的语音识别工具包,提供多种语音处理功能。使用示例包括文件转录和实时麦克风输入识别,支持GPU加速和自动语言检测。安装需配置相关依赖库如sounddevice和PortAudio。模型支持文本后处理和分段合并优化,适合研究和工业应用。

2025-12-17 23:59:04 695

原创 【学习心得】Python好库推荐——pyttsx3

pyttsx3是一个跨平台的Python文本转语音库,支持Windows、macOS和Linux系统。通过pip install pyttsx3安装后,即可在本地实现TTS功能,无需联网。

2025-12-17 12:45:17 358

原创 【学习心得】基于VOSK的唤醒词检测

本文详细介绍了VOSK的安装方法、核心功能和使用教程,包括音频采集、模型加载和唤醒词检测的实现步骤,并提供了Python代码示例。

2025-12-16 19:49:21 757

原创 【学习心得】Python好库推荐——Radon

 Radon 是一个专门用于分析 Python 源代码质量的工具库。

2025-12-12 11:38:13 408

原创 【学习心得】Python好库推荐——Pylint

 Pylint 是一个用于 Python 代码静态分析的强大工具,主要用于代码质量检查和风格规范。本文介绍了如何安装并快速使用。

2025-12-07 15:11:24 967

原创 【自然语言处理与大模型】多模态RAG的核心概念

多模态 RAG 是将检索增强生成技术扩展至多模态数据场景的系统架构。主要涵盖以下两个关键维度:富媒体文档问答和多模态输入问答

2025-12-07 12:33:36 941

原创 【自然语言处理与大模型】三种实现多模态技术的路线

当前多模态领域,尤其是在信息检索和处理场景下,最具代表性的三条主流技术路线。它们代表了三种不同的思想:空间对齐、路径并行和模态转换。

2025-12-07 04:10:16 1346

原创 【学习心得】UV包和项目管理工具

uv是一个用 Rust 编写的极速 Python 包和项目管理工具

2025-12-04 23:34:47 420

原创 【学习心得】Python好库推荐——pipx

pipx是一个用于安装和运行 Python 命令行工具的工具

2025-12-04 22:38:14 444

原创 【学习心得】vllm serve 命令常用CLI参考

vLLM 部署参数说明

2025-12-02 16:49:52 935

原创 【机器学习300问】137、L1和L2正则的区别是什么?用了不同的正则项对权重w的影响是什么?

两者的主要区别体现在惩罚的形式、对权重的影响以及产生的模型特性上。

2025-11-26 15:47:43 272

原创 【学习心得】让Windows 11 右键默认“显示更多”

Windows11简化了默认右键菜单,隐藏许多功能。可通过运行两条命令恢复完整菜单:1)添加注册表项启用完整菜单;2)重启资源管理器使更改生效。要恢复默认简化菜单,只需删除注册表项并重启资源管理器。

2025-11-17 18:04:16 119

原创 【自然语言处理与大模型】BERTopic主题建模

BERTopic是什么?核心原理与关键步骤?

2025-11-17 11:02:52 961

原创 【自然语言处理与大模型】主题建模 Topic Modeling

NLP任务之主题建模是什么?

2025-11-17 10:44:34 363

原创 【学习心得】conda打包进行环境迁移遇到conda包和pip包管理冲突问题

conda打包进行环境迁移遇到conda包和pip包管理冲突问题

2025-11-15 16:57:10 638

原创 【自然语言处理与大模型】LlamaIndex快速入门②

给大家介绍LlamaIndex的数据加载、数据连接和文本分割。

2025-09-27 23:17:04 345

原创 【自然语言处理与大模型】LlamaIndex快速入门①

LlamaIndex四行代码实现一个简单的RAG

2025-09-27 23:02:33 468

原创 【学习心得】离线Linux安装conda环境教程

需要给离线的Linux服务器安装好miniconda并且创建虚拟环境。

2025-09-26 23:11:45 615

原创 【自然语言处理与大模型】RAG发展过程中的三个范式

初级 RAG(Naive RAG)、高级 RAG(Advanced RAG)、模块化 RAG(Modular RAG)

2025-09-26 11:13:55 1115

原创 【自然语言处理与大模型】RAFT(Retrieval Augmented Fine Tuning)方法

RAFT 的本质是用检索增强来生成高质量训练数据,再通过微调把“外挂知识”变成“内功修为”。

2025-09-25 19:49:43 1326

原创 【自然语言处理与大模型】不同阶段提升RAG质量方法

构建索引阶段、知识检索阶段、增强生成阶段,在不同阶段提升RAG质量方法。

2025-09-25 02:59:11 1066

原创 【自然语言处理与大模型】大模型应用开发四个场景

大模型应用开发的4个场景:Prompt、RAG、Agent、微调。

2025-09-19 20:35:05 1250 1

原创 【自然语言处理与大模型】开关推理模型的思考功能

开关推理模型的思考功能的两种方法:1、/no_think 2、enable_thinking

2025-09-10 03:32:57 737

原创 【自然语言处理与大模型】如何通过微调来提升Agent性能?

如何通过微调来agent性能?高效微调提升 Agent 工具调用能力的关键是什么?如何设计强化学习中的奖励函数来优化Agent性能?关于为什么强化学习比纯指令微调更适合提升 Agent 的性能?

2025-09-08 02:12:24 1093

原创 【自然语言处理与大模型】开源大模型config文件(Qwen3为例)

开源大模型的配置参数中都写了些什么

2025-09-08 01:10:47 1171

原创 【自然语言处理与大模型】多机多卡分布式微调训练的有哪些方式

一、分布式微调训练的有哪些方式?二、工程实践中通信带宽不足对分布式训练的影响?三、如何有效处理多机多卡训练中的单节点故障?四、在多机多卡微调场景中,ZeRO优化器发挥着什么作用?

2025-08-30 19:11:44 808

原创 【自然语言处理与大模型】如何进行大模型多模态微调

一、如何进行大模型多模态微调?二、多模态微调的数据集该怎么构建?三、多模态微调的典型应用场景有哪些?

2025-08-30 13:22:59 1402

原创 【自然语言处理与大模型】微调数据集如何构建

1、微调数据集如何构建?2、大模型微调数据集规模如何预估?3、工业环境下微调数据集应该如何创建?4、强化学习微调需要如何准备数据集呢?

2025-08-26 13:44:25 1293

原创 【自然语言处理与大模型】微调与RAG的区别

1、什么时候用微调?什么时候用RAG?2、微调的优缺点?RAG的优缺点?3、微调与RAG并不对立,常常结合使用。4、模型微调可能存在哪些风险?5、模型微调和模型蒸馏的区别?

2025-08-21 17:12:55 868

原创 【自然语言处理与大模型】大模型Agent四大的组件

Agent System Overview:大模型Agent四大的组件

2025-05-26 23:54:57 1125 2

原创 【自然语言处理与大模型】大模型(LLM)基础知识⑤

如何保证大模型生成内容的合规性?如何对超长文本进行微调训练?

2025-05-26 23:27:09 1282

原创 【自然语言处理与大模型】向量数据库:Milvus使用指南

Milvus使用指南

2025-05-19 01:20:48 800 1

原创 【自然语言处理与大模型】向量数据库:Chroma使用指南

Chroma使用指南

2025-05-18 23:36:38 1140

原创 【自然语言处理与大模型】向量数据库技术

介绍了向量数据库技术是什么,并推荐了4个目前使用最广的向量数据库。

2025-05-18 22:28:00 1584

“阴阳怪气”语气风格DPO数据集

用两个模型互搏,生成的DPO数据集。 - 一个大模型模仿“直肠子”,"system_prompt": "你是一个说话直来直去、不拐弯抹角的AI助手。你的回答简洁明了,不带情绪修饰,有什么说什么。" - 一个大模型模仿“阴阳家”,"system_prompt": "你是一个擅长阴阳怪气、明褒暗贬的AI助手。你说的话表面客气,实则内涵满满,让人听着像夸奖,细品却不是滋味。讽刺要有分寸,不能涉及性别、外貌、身体特征等敏感内容。" 数据集示例如下: [ { "instruction": "室友半夜和对象视频娇喘,怎么提醒?", "input": "", "chosen": "嗯,这个情况确实有点微妙。我建议你可以采取一种既不尴尬又能传达意图的方式,比如说:“哎呀,我刚刚听到你那边声音挺大的,是不是有什么好听的歌或者电影啊?我这边有点困了,需要安静一会儿。”这样既没有直接指出问题,又暗示了需要安静的环境。", "rejected": "直接而礼貌地提醒:“室友,现在比较晚了,我们可能需要保持安静,不要影响其他人休息。”" }, { "instruction": "亲戚说我不生孩子就是自私,好想掀桌!", "input": "", "chosen": "哎呀,这亲戚真是‘金玉良言’啊,真是让人‘茅塞顿开’呢。不过,掀桌嘛,还是算了吧,毕竟桌面上的东西掀不起多大风浪,倒是可能溅你一身水。保持风度,理性沟通才是王道。", "rejected": "理解你的情绪。面对这种无理指责,保持冷静,不必理会。每个人都有自己的选择和理由。" } ]

2025-05-18

手语识别-深度学习-自建ASL数据集-模型训练(分卷压缩第一卷)

内容概要: 本资源是一套自建美国手语(American Sign Language, ASL)手势数据集,通过OpenCV实现每秒30帧的高清视频录制,精准捕捉并记录了连续且细腻的手部动作变化,旨在用于深度学习算法对手势识别的研究与训练。数据集中所有图片均为720p分辨率(1280x720像素),确保了手部细节特征在图像中的高清晰度展现。为进一步提升模型的学习效果和泛化能力,我还对手语图像采用了尺度归一化,高斯滤波,肤色提取和二值,四种方式来进行数据增强。 适用人群: 此数据集适用于机器学习工程师、人工智能研究人员、计算机视觉领域的学者以及致力于开发智能手语识别系统的开发者和团队。 使用场景及目标: 该数据集适用于训练和测试深度学习模型,目标在于提高手语识别系统的识别精度和实时性能。 其他说明: 为了增强模型泛化能力和应对不同环境下的识别挑战,数据集中的手势样本在多种拍摄角度下采集,并特意设置了简洁单一的背景以减少干扰因素。每个手势类别都提供了丰富的变体,大约包含1000张不同情境下的图像,总计涵盖了约2万张手势数据图片,充分满足大规模训练和验证的需求。

2024-04-01

手语识别-深度学习-自建ASL数据集-模型训练(分卷压缩第二卷)

内容概要: 本资源是一套自建美国手语(American Sign Language, ASL)手势数据集,通过OpenCV实现每秒30帧的高清视频录制,精准捕捉并记录了连续且细腻的手部动作变化,旨在用于深度学习算法对手势识别的研究与训练。数据集中所有图片均为720p分辨率(1280x720像素),确保了手部细节特征在图像中的高清晰度展现。为进一步提升模型的学习效果和泛化能力,我还对手语图像采用了尺度归一化,高斯滤波,肤色提取和二值,四种方式来进行数据增强。 适用人群: 此数据集适用于机器学习工程师、人工智能研究人员、计算机视觉领域的学者以及致力于开发智能手语识别系统的开发者和团队。 使用场景及目标: 该数据集适用于训练和测试深度学习模型,目标在于提高手语识别系统的识别精度和实时性能。 其他说明: 为了增强模型泛化能力和应对不同环境下的识别挑战,数据集中的手势样本在多种拍摄角度下采集,并特意设置了简洁单一的背景以减少干扰因素。每个手势类别都提供了丰富的变体,大约包含1000张不同情境下的图像,总计涵盖了约2万张手势数据图片,充分满足大规模训练和验证的需求。

2024-04-01

手语识别-深度学习-自建ASL数据集-模型训练(分卷压缩第三卷/最后一卷)

内容概要: 本资源是一套自建美国手语(American Sign Language, ASL)手势数据集,通过OpenCV实现每秒30帧的高清视频录制,精准捕捉并记录了连续且细腻的手部动作变化,旨在用于深度学习算法对手势识别的研究与训练。数据集中所有图片均为720p分辨率(1280x720像素),确保了手部细节特征在图像中的高清晰度展现。为进一步提升模型的学习效果和泛化能力,我还对手语图像采用了尺度归一化,高斯滤波,肤色提取和二值,四种方式来进行数据增强。 适用人群: 此数据集适用于机器学习工程师、人工智能研究人员、计算机视觉领域的学者以及致力于开发智能手语识别系统的开发者和团队。 使用场景及目标: 该数据集适用于训练和测试深度学习模型,目标在于提高手语识别系统的识别精度和实时性能。 其他说明: 为了增强模型泛化能力和应对不同环境下的识别挑战,数据集中的手势样本在多种拍摄角度下采集,并特意设置了简洁单一的背景以减少干扰因素。每个手势类别都提供了丰富的变体,大约包含1000张不同情境下的图像,总计涵盖了约2万张手势数据图片,充分满足大规模训练和验证的需求。

2024-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除