自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 资源 (1)
  • 收藏
  • 关注

原创 LLM的工具调用能力(如Function Calling)

核心机制LLM通过生成符合工具接口的指令(如JSON参数),触发外部工具执行。例如,用户提问天气时,模型生成{"location": "北京", "date": "2025-03-22"},系统调用天气API获取数据。分工明确:LLM仅负责决策和参数生成,实际执行由业务系统完成。技术演进提示工程:通过Few-shot示例引导模型输出特定格式(如ReAct框架)。例如,动态选择语义相似的示例可提升准确率。模型微调:如Toolformer模型通过插入API调用标记训练LLM,使其自主决定何时调用工具。

2025-03-21 15:56:38 414

原创 LLM之向量数据库Chroma milvus FAISS

需求优先级快速开发选Chroma,超大规模选Milvus,极致性能选FAISS。技术栈适配若需结合图数据库或多模态搜索,可考虑 Weaviate(未在问题中提及,但常与 Milvus 对比)。

2025-03-20 14:24:47 512

原创 大模型量化 - BitsandBytesConfig

BitsandBytesConfig 是 Hugging Face Transformers 库中用于配置大模型量化参数的核心类,通过调整量化位宽、数据类型等参数,可在保持模型性能的同时显著降低显存占用。

2025-03-20 13:33:18 349

原创 AI与GPU 之 CUDA

CUDA通过降低GPU编程门槛、提供高效计算库和持续生态建设,成为加速计算的行业标准。其技术壁垒不仅体现在硬件性能,更在于构建了从开发工具到应用生态的完整体系。

2025-03-20 13:25:31 378

原创 LLM大模型下载方式

如需具体模型的完整下载步骤或更多开源 LLMs 列表,可参考 [网页1] 的 15 款热门模型盘点及 [网页2][网页4] 的技术文档。提供中文界面及国内服务器加速,支持直接搜索并下载主流模型(如 Qwen、ChatGLM 等),适合不熟悉命令行的用户。命令克隆仓库,但需注意此方式不支持断点续传且会包含历史版本,可能占用更多存储空间。此方式自动缓存模型文件,适合开发者快速集成到项目中。

2025-03-20 09:40:11 721

原创 大模型LLM部署方式

建议根据实际需求选择方案,企业级服务优先考虑vLLM或TGI,个人用户可尝试Ollama或Hugging Face本地加载。若需完整代码示例,可参考网页2的VLLM实战或网页5的TGI部署案例。:高并发、低延迟的API服务,需分布式推理支持。:快速创建可分享的Web应用。:个人开发、快速原型验证。

2025-03-20 09:16:30 268

原创 Gemma3、QwQ、DeepSeek-R1、Llama3.3和Phi4五大模型对比

如需进一步技术细节(如训练方法、量化方案),可参考各模型的官方文档或技术报告。

2025-03-20 08:52:19 1332

原创 检索增强生成(2)本地PDF & 本地嵌入模型

【代码】检索增强生成(2)本地PDF & 本地嵌入模型。

2025-03-19 16:11:32 318

原创 使用huggingface-cli下载模型

通过上述步骤,可高效下载并管理 Hugging Face 模型。若需进一步优化速度,可参考镜像站手动下载或结合多线程工具(如。输入从 Hugging Face 官网生成的 Token(Settings → Access Tokens)。或系统环境变量以持久生效。此配置将覆盖默认缓存路径。

2025-03-19 16:10:03 497

原创 RAG评估指标 Recall、MRR、NDCG

指标核心目标适用场景局限性Recall减少漏检疾病诊断、安防检测忽略误检,需与 Precision 平衡MRR优化首位结果质量导航搜索、事实查询忽略后续结果,仅关注首个命中NDCG多等级排序质量评估推荐系统、个性化搜索计算复杂,需明确相关性等级定义参考资料:Recall 的定义与目标检测应用;:MRR 的计算与搜索场景;:NDCG 的原理与代码实现。

2025-03-19 14:14:22 796

原创 数据集 MS MARCO

MS MARCO通过真实数据、复杂场景和开放性设计,成为机器阅读理解领域的标杆数据集。它不仅推动了问答系统的技术进步(如百度RocketQA、猿辅导MARS模型),还为智能搜索、虚拟助手等实际应用提供了训练基础。其影响力可类比ImageNet在计算机视觉领域的地位。

2025-03-19 14:07:34 920

原创 检索增强生成RAG with LangChain、OpenAI and FAISS

【代码】检索增强生成RAG with LangChain、OpenAI and FAISS。

2025-03-18 16:37:01 334

原创 系统架构定义

体(结构):系统是由组件组成,完成某一特定功能或一组功能的组件集。组件集还包括连接件和约束规范。体(结构):系统中组件的组织方式和设计原则。组织方式包括组件间的关系,以及组件和环境的关系。用(功能、作用):系统用于完成环境中(上下文)的一个或多个任务。用(功能、作用):对系统功能进行抽象,指导系统的设计和实现。3.长生命周期系统的扩展问题。1. 复杂的需求分析问题。2.非功能属性的设计问题。5.业务流程再造难的问题。

2024-03-16 21:31:52 246

原创 Rust入门 - 所有权 ownership

内存模型引用解引用通用错误。

2024-02-20 13:38:35 176

原创 Rust入门 - function

2024-02-18 15:30:09 177

原创 Rust 入门- 数据类型 data types

scalar tyoes:compound types:

2024-02-18 09:29:28 276

原创 RUST入门 - Prelude & 变量,常量,变量遮蔽

【代码】猜数字RUST。

2024-02-06 16:52:26 253

原创 java 版本切换脚本

【代码】java 版本切换脚本。

2023-12-19 15:11:54 454

原创 rust实现web服务器(代码注解版)- 1.2

【代码】Rust web服务器 代码注释。

2023-12-13 10:20:22 591

原创 rust实现web服务器(代码注解版)- 1

【代码】rust实现web服务器(代码注解版)- 1。

2023-12-01 16:07:23 571

原创 闭包 Closure

闭包是一种匿名函数,它可以将函数赋值给变量作为参数传递给其它函数允许捕获调用者作用域中的值let x = 1;assert_eq!

2023-11-30 14:31:43 396

原创 Rust 删除排序数组中的重复项

【代码】Rust 删除排序数组中的重复项。

2023-03-08 09:16:12 656 1

原创 Rust 移动零

移动到数组的末尾,同时保持非零元素的相对顺序。,必须在不复制数组的情况下原地对数组进行操作。,编写一个函数将所有。

2023-03-06 17:29:35 133

原创 Rust 加一

给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。你可以假设除了整数 0 之外,这个整数不会以零开头。

2023-03-06 16:36:17 269

原创 缓存技术 - Redis

Redis 缓存

2022-10-15 16:27:16 712

原创 负载均衡技术

负载均衡技术

2022-10-15 14:49:12 377

原创 OpenSSL 证书

X.509 OpenSSL 证书

2022-10-11 16:47:49 6191

转载 设计模式介绍

设计模式 设计模式 设计模式

2022-10-10 13:40:50 114

原创 软件架构风格

软件架构风格 4+1视图架构

2022-10-05 22:45:40 393

原创 软件工程 - 需求工程

需求工程

2022-10-04 22:52:02 733

原创 内存管理 (Memory Management)

内存管理 (Memory Management) 页式存储段式存储段页式存储

2022-09-20 23:55:17 9618

原创 ELK教程4 - filebeat

ELK教程4 - filebeat, 输出到logstash

2022-09-15 15:41:39 1315

原创 ELK教程2 - kibana

ELK教程 - 2.安装Kibana

2022-09-13 13:56:50 1071

原创 ELK教程1 - elasticsearch

ELK教程 - 1.安装elasticsearch

2022-09-13 13:50:57 738

原创 ELK教程3 - logstash

ELK教程 - 1.安装logstash

2022-09-13 13:41:54 781

原创 数据校验码

数据校验码 奇偶校验码 循环冗余码(CRC码) 海明校验码

2022-09-09 09:51:41 1095

原创 流水线计算公式及吞吐量

流水线计算公式及吞吐量

2022-09-08 22:08:37 6143

原创 软件许可(License)授权方案

软件许可(License)授权方案

2022-09-08 16:48:58 2871 1

转载 专利的定义和申请

专利的定义和申请

2022-09-08 09:36:24 161

转载 机械磁盘结构与组成

机械磁盘结构与组成

2022-09-08 09:03:51 1672

Notepad++ _6.4.1

Notepad超强的文本编辑器,支持各种语言

2013-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除