计算机发展历史

最新推荐文章于 2025-07-18 21:10:12 发布

梅塔鲁

最新推荐文章于 2025-07-18 21:10:12 发布

阅读量142

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/jamesryf/article/details/105063107

1.按照时间发展：

1946-----1957 电子管计算机

第一台埃尼阿克(ENIAC)

1975-----1964 晶体管计算机

晶体管由贝尔实验室科学家发明，第一台TX-0，诞生于MIT林肯实验室

1964-----1980 集成电路计算机

德州仪器的工程师发明了集成电路(IC)

1980-----至今超大规模集成电路计算机

未来可能的计算机

生物计算机：以蛋白质分子作为主要原材料

量子计算机：遵循量子力学的物理计算机

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

梅塔鲁

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Ollama部署Qwen3-Embedding和Qwen3-Reranker

没刮胡子的程序员专栏

06-12

880

wen3 Embedding系列是基于Qwen3开发的专有文本嵌入与排序模型，提供0.6B、4B和8B三种尺寸选择。该系列支持100+种语言，具备32k上下文长度，并允许自定义输出维度（32-4096）。

参与评论您还未登录，请先登录后发表或查看评论

别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！

2301_81888214的博客

02-13

851

别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！

Qwen3深夜上新，Embedding系列全新登场！

m0_63171455的博客

06-06

964

阿里推出Qwen3-Embedding系列模型，包含0.6B/4B/8B三种尺寸，专为文本表征和检索排序任务设计。8B版本在MTEB多语言榜单排名第一，支持119种语言。模型采用双塔/单塔结构设计，结合Embedding和Reranker模型可优化检索效果。该系列已在HuggingFace等平台开源，同时阿里云提供商业服务。模型训练采用三阶段范式，并创新使用动态Prompt生成弱监督数据。此外，文章还分享了大模型学习资源，包括路线图、视频教程和技术文档等。

不积跬步，无以至千里！

06-15

1254

Qwen3 Embedding 与 Rerank 模型开源，助力搜索、排序技术革新！

Qwen3-Embedding：原理解读和检索场景测试，零基础小白收藏这一篇就可以了！！

bugyinyin的博客

07-03

1063

Qwen3-Embedding 的模型输入输出如下，报告中，没有具体说明其内部结构，估计和 Qwen3 基座模型本身保持一致。

云上玩转Qwen3系列之二：PAI-LangStudio搭建联网搜索和RAG增强问答应用

科技很有意思

05-07

978

本文详细介绍了如何使用LangStudio和Qwen3构建基于RAG和联网搜索的AI智能问答应用。该应用通过将RAG、web search等技术和阿里最新的推理模型Qwen3编排在一个应用流中。

【部署】dify+ollama部署Qwen3-Embedding-8B

u010593516的专栏

06-09

1032

本文介绍了如何部署Qwen3-Embedding-8B模型的详细步骤。首先确认ollama版本需0.9.0+，若版本过低会导致模型加载失败。通过卸载旧版本、下载新版ollama完成升级。其次提供两种模型获取方式：在线拉取或离线导入模型文件。完成部署后需确认模型导入成功，最后在dify平台进行模型配置。文章包含完整的命令行操作流程和注意事项，为部署Qwen3-Embedding-8B模型提供了清晰的指导。

python 本地运行Qwen3-Embedding-0.6B 模型提供API接口

modelmd的博客

06-10

819

该代码实现了一个基于 Flask 的 HTTP API 服务，用于将输入的文本转换为嵌入向量（embedding）。核心功能是通过 Qwen3-Embedding-0.6B 模型生成文本的向量表示。如果不配置环境变量，windows系统模型缓存到C盘的。先安装modelscope，然后使用命令行下载。下载完模型查看对应的配置路径是否有模型。输出了对应的路径，说明配置成功了。验证环境变量是否配置成功。

【小白教程】Ollama本地部署任意大模型（适合企业/个人），看到就是赚到！！

嘴巴吃糖了

05-26

987

5分钟，教你搭建专属AI助手！不管是个人还是企业，都能轻松部署DeepSeek、Gemma3、Qwen3等主流大模型。本地运行更安全，还能用手机随时访问，提升 10倍生产效率！

开源AI新协议！AI Agent与前端交互的轻量级协议，轻松构建交互式AI应用！

bugyinyin的博客

06-04

788

AI Agent 的兴起让前端交互需求激增，但传统开发中，连接Agent后端与前端需大量定制代码，效率低下。在 MCP（模型上下文协议）、A2A（Agent-to-Agent 通信协议）之后，AI Agent 的生态正在走向一个更完整的方向：AG-UI 协议横空出世，专为 Agent 与前端应用的通信交互而设计。

【AIGC】Qwen3-Embedding：Embedding与Rerank模型新标杆

LeeZhao的博客

06-12

1486

Qwen3-Embedding：文本嵌入与重排序模型的技术解析与应用实践

Ollama 安装Qwen3 系列

红血哥

05-09

1766

本文介绍了如何使用 Docker 安装 Ollama 并部署 Qwen3 系列模型（如 Qwen3、Qwen3-72B 等）。首先，确保系统已安装 Docker，并推荐使用 GPU 支持以运行大模型。接着，通过 Docker 拉取并启动 Ollama 容器，检查服务状态。Ollama 支持自动拉取主流模型，如 Qwen3，但也可手动部署。手动部署步骤包括下载模型、转换为 GGUF 或 GGML 格式、创建 Modelfile 文件，并通过 Ollama 加载和运行模型。最后，可通过 REST API 调用模

【自用】JavaSE--集合框架(一)--Collection集合体系

weixin_65466248的博客

07-17

789

由于无法进行排序，因此需要自己指定排序规则，如下图，之前在学习Arrays.sort时学过，这里方法一样如果两种方法都是用了，TreeSet会采用就近原则使用外部重写的Comparator规则，而不使用对象类内部重新的如果两个对象中出现的某一项相同，比如采用年龄排序，年龄都是16，则会丢失其中一个，因为Set的规则就是出现输入相同的数据时会保留先前输入的ComparableComparatorComparator是一个匿名内部类，在传入参数时直接重写，可以。

实现通讯录人员选择

hopefullman的博客

07-16

235

【代码】实现通讯录人员选择。

C#，List＜T＞与 Vector＜T＞

大语言模型掘墓人

07-15

713

总之，Vector<T>主要用于线性代数计算，而List<T>和Array更适用于常规编程任务。在大多数情况下，建议使用List<T>或Array而不是Vector<T>。然而，如果你需要进行复杂的线性代数计算，Vector<T>可能是一个更好的选择。性能：List<T>和Array在内存分配和性能方面通常优于Vector<T>。而Vector<T>的功能相对有限，可能需要额外的库或工具来实现类似的操作。功能：List<T>和Array提供了更多的功能，如排序、查找和转换等。

STL—— list迭代器封装的底层讲解

最新发布

2402_88489677的博客

07-18

495

本章重点讲解了STL中链表中的迭代器封装问题，以及list的底层实现

Java集合框架体系详解：List/Set/Map接口对比与核心实现原理

m0_58202543的博客

07-17

766

通过理解底层实现机制，能够更合理地选择集合类型，写出高效稳定的Java程序

LinkedList集合源码解析

mengyb个人文档记录

07-16

288

LinkedList源码解析

如果我要使用qwen作为agent的基底模型，我是使用qwen的全部还是使用qwen-embedding

06-11

<think>嗯，我现在要处理用户的问题：他想了解在使用Qwen作为Agent基底模型时，选择完整Qwen模型还是Qwen-embedding模型的适用场景。首先得明确这两个模型的区别。根据用户提供的引用和之前的知识，Qwen是完整的语言模型，能生成文本和推理，而Qwen-embedding可能只输出嵌入向量，用于检索或相似度计算。用户提到的引用[2]里详细说明了如何配置Qwen2-7B-Instruct-GPTQ-Int4模型，包括参数设置和使用vLLM引擎加载。这属于完整的生成模型，能处理复杂任务。引用[1]和[3]则讨论了模型能力评估，比如需要判断任务类型是否匹配模型的知识和训练情况。比如预训练阶段没学过的内容，微调也难补救。这提示在选基底模型时要看任务需求。接下来要分析两者的区别。完整Qwen适合需要推理、决策、生成响应的Agent任务，比如问答或多步规划。而embedding模型适合检索增强，比如从知识库中找相关文档，再结合生成模型。用户可能混淆了两种模型的用途，需要明确各自的作用场景。适用场景方面，引用[2]中的配置例子是生成模型的应用，如处理复杂指令。而embedding模型更偏向于在RAG架构中作为支持模块。用户的问题是否涉及Agent是否需要自主生成能力？如果需要动态交互，应选完整模型；如果是静态检索，用embedding模型。同时要考虑计算资源，生成模型消耗更大，引用[2]提到显存管理和张量并行配置，可能影响部署选择。还要考虑用户可能的场景。比如，如果用户构建的Agent需要理解用户问题并生成答案，完整模型更合适。如果需要从数据库匹配信息，embedding更有效。或者两者结合，比如RAG流程中先用embedding检索，再用完整模型生成答案。这时候的基底模型选择取决于Agent的设计架构。最后，根据引用[3]的迭代优化建议，用户可能需要测试两种模型在具体任务的得分，评估效果差异。比如在SFT后检查不同任务类型的表现，再决定哪种模型作为基底更合适。可能需要实际测试续写能力或知识掌握程度，如引用[1]提到的方法。</think> 下面从技术原理和应用场景分析Qwen完整模型与Qwen-embedding模型的区别及适用场景： --- ### **1. 核心区别** | **特性** | **Qwen完整模型** | **Qwen-embedding模型** | |-----------------------|--------------------------------------|-----------------------------------| | **输出类型** | 文本生成/推理结果 | 高维向量（Embeddings） | | **主要能力** | 自然语言理解、逻辑推理、文本生成 | 语义编码、相似度计算 | | **典型任务** | 问答、决策、代码生成 | 检索增强、语义匹配、聚类分析 | | **架构定位** | 通用大语言模型（LLM） | 专用嵌入模型 | | **计算资源需求** | 高（需GPU推理） | 较低（可CPU运行） | --- ### **2. 适用场景对比** #### **✅ Qwen完整模型适用场景** - **复杂任务代理（Agent）** 需要**多步推理**的任务（如数学计算、计划制定），例如： ```python # 场景：多轮决策Agent response = qwen_agent.generate("用户要求预订下周北京到上海的航班，预算2000元以内") # 输出：推理航班选择、日期建议、价格对比等结构化决策 ``` - **动态内容生成** 实时生成报告、邮件、代码等（依赖模型的生成能力）[^2] - **知识密集型问答** 直接结合预训练知识回答复杂问题（如"解释量子纠缠现象"） #### **✅ Qwen-embedding模型适用场景** - **检索增强架构（RAG）** ```mermaid graph LR A[用户问题] --> B(Embedding模型) B --> C{向量数据库} C --> D[检索相关文档] D --> E[Qwen完整模型生成答案] ``` **用途**：将用户问题转化为向量，从知识库中检索最相关信息 - **相似任务路由** 对用户请求聚类，路由到不同处理模块（如"翻译类请求"路由到翻译Agent） - **轻量化语义匹配** 快速比对文本相似性（如客服问题匹配知识库条目） --- ### **3. 选择建议** | **需求特征** | **推荐模型** | |----------------------------------|-----------------------| | 需实时生成文本/推理 | ✅ Qwen完整模型 | | 需处理结构化数据检索 | ✅ Qwen-embedding | | 部署资源受限（低算力设备） | ✅ Qwen-embedding | | 任务依赖预训练知识（如诗词创作） | ✅ Qwen完整模型[^1] | | 需构建RAG系统 | 🔄 **两者结合使用** | --- ### **4. 典型技术方案** 当需要构建完整Agent系统时，**混合架构**往往最优： ```python # 混合架构示例 from qwen_embedding import get_embedding from qwen_llm import generate_response user_query = "特斯拉2023年Q4财报亮点是什么？" # Step1：用Embedding模型检索知识库 query_vector = get_embedding(user_query) knowledge = vector_db.search(query_vector, top_k=3) # Step2：将检索结果输入完整模型生成答案 prompt = f"基于以下资料：{knowledge}，回答：{user_query}" answer = generate_response(prompt) # 使用完整Qwen模型 ``` --- ### **