AI基础
文章平均质量分 84
编程和AI相关的基础概念和知识。
火云牌神
20年以上工作经验,担当过Linux操作系统、嵌入式软件、游戏开发、企业级应用开发等技术工作。
擅长系统性逻辑思维,长于解决复杂的系统性软件问题,编写比较复杂稳定的底层软件系统。
最近几年专注于大数据和人工智能技术领域的研究。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
如何选择FAISS的索引类型
本文将在**语义检索**领域探讨更加接近实战的话题:如何如何选择FAISS的索引类型。原创 2025-12-15 09:30:21 · 852 阅读 · 0 评论 -
程序员应该熟悉的概念(9)向量相似度(vector similarity)
由于这些向量相当于将文本做了分类:**语义相近的距离越近**,所以这些向量就可以很方便的应用于**语义检索**场景了。原创 2025-12-15 09:23:18 · 857 阅读 · 0 评论 -
程序员应该熟悉的概念(8)嵌入和语义检索
**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具,旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口,使用不同大模型。原创 2025-12-14 13:18:47 · 1108 阅读 · 0 评论 -
程序员应该熟悉的概念(7)vLLM和ollama
**vLLM**(Virtual Large Language Model) 和 **Ollama** 都是用于运行大语言模型 **大语言模型/LLM** 的工具,旨在降低本地部署和使用大模型的门槛。应用程序可以通过它们的统一接口,使用不同大模型。原创 2025-12-14 13:09:00 · 276 阅读 · 0 评论 -
程序员应该熟悉的概念(6)Fine-tuning和RAG
**大语言模型/LLM** 通常是由海量通用知识(如语法、常识、逻辑)训练的,在面对具体场景(如医疗问诊、法律文书生成)时,能力往往不足。 **Fine-tuning/微调** 正是为解决这一问题而生的核心技术,其本质是在预训练模型的基础上,用特定领域 / 任务的小数据集进一步训练,让模型 **适配具体需求**,最终输出更精准、更贴合场景的结果。原创 2025-12-12 11:46:50 · 991 阅读 · 0 评论 -
程序员应该熟悉的概念(5)MoE
**MoE**(Mixture of Experts,专家混合模型))是当前大模型(尤其是 GPT-4、Gemini、Mixtral、DeepSeek 等)架构中非常核心的一个概念。 **MoE** 的思想非常直白:不同的 `专家/Expert` 只负责处理自己擅长的那一类输入,而不是让整个模型的所有参数都去处理所有任务。原创 2025-12-12 11:43:17 · 905 阅读 · 0 评论 -
程序员应该熟悉的概念(1)RESTful
在这个前后端分离(前端和后端均为独立的应用,只通过API/接口通信)成为应用编程主流的时代,**RESTful** 规范(REST全称是:Representational State Transfer)应该是程序员**必须掌握**的API/接口设计规范。原创 2025-12-09 11:27:48 · 373 阅读 · 0 评论 -
程序员应该熟悉的概念(2)OpenAI API
大名鼎鼎的 **OpenAI** 发布之后,其 **OpenAI API规范** 逐渐成了事实上的工业标准,很多大模型API都兼容这个规范。这也就意味着:OpenAI的SDK可以使用很多大模型。原创 2025-12-09 12:22:34 · 438 阅读 · 0 评论 -
大语言模型都能做什么
与一般的AI模型相比,大模型的参数特别多(通常在10亿以上),训练时需要大规模的数据(动辄百万计,往往还需要进行大量的人工标注),可见大模型的训练成本通常比较高昂。转载 2024-09-19 19:47:10 · 176 阅读 · 0 评论 -
程序员应该熟悉的概念(3)MCP简介
**MCP**(Model Context Protocol) 是由 Anthropic 在 2024 年 11 月提出并开源的一个协议标准,目的是统一 AI 模型(尤其是大语言模型) 与外部资源 / 工具 / 数据源之间的交互方式。原创 2025-12-10 09:14:08 · 804 阅读 · 0 评论 -
程序员应该熟悉的概念(4)MCP能做什么
本文将更加深入的介绍 **MCP** 的架构和功能。原创 2025-12-11 11:52:16 · 781 阅读 · 0 评论 -
大模型的最大特色:涌现能力
涌现能力是在模型参数增加到某一临界点后突然出现的,这些能力包括但不限于语言理解能力、生成能力、逻辑推理能力等,而这种能力是小模型所不具备的。 这也是为什么chat GPT出现后让人眼前一亮:和它聊天与真人无异,不像是机器了!这主要应该归功于大模型的涌现能力。原创 2024-09-19 19:42:46 · 1933 阅读 · 0 评论
分享