Sophie'sCookingLab-优快云博客

原创 linux 安装open webui

（Ubuntu、Debian、CentOS 等）上安装。如果遇到问题，可以告诉我具体的错误信息，我帮你解决！如果你想用 Open WebUI 调用。容器正在运行，表示安装成功。并指定一个可用的模型，例如。

2025-03-27 13:40:37 618

原创 MacOS 安装open webui

它是一个独立的 Web UI 应用，通常通过。如果你只是想使用 Open WebUI 连接。确保你的 macOS 上安装了。在运行，则安装成功。

2025-03-27 13:04:17 743

原创 rerank

Listwise：优化整个文档列表的排序质量（如LambdaMART）Pairwise：学习文档对的相对顺序（如RankNet）Pointwise：预测单个文档的相关性分数。embdedding模型微调。为什么需要rerank?

2025-03-25 14:34:05 102

原创 GPU算力平台

https://funhpc.com/#/https://www.autodl.com

2025-03-25 10:20:12 93

原创 vscode连接远程服务器

这样，你就可以在 VS Code 里像本地开发一样操作远程服务器了！你要用它来做什么项目？在 VS Code 中连接远程服务器（Linux 服务器）通常使用。如果是首次连接，会提示输入密码或选择 SSH 密钥进行认证。如果需要经常连接服务器，可以配置。文件（Windows 在。

2025-03-25 10:16:47 747

原创 vscode连接远程服务器

这样，你就可以在 VS Code 里像本地开发一样操作远程服务器了！你要用它来做什么项目？在 VS Code 中连接远程服务器（Linux 服务器）通常使用。如果是首次连接，会提示输入密码或选择 SSH 密钥进行认证。如果需要经常连接服务器，可以配置。文件（Windows 在。

2025-03-25 09:22:00 475

BLEU（Bilingual Evaluation Understudy）是一种用于评估机器翻译、文本生成等任务的自动评测指标。它通过计算 n-gram 精确匹配率来衡量候选句子（模型输出）与参考句子（人类标准答案）的相似度。如果候选翻译的长度远短于参考翻译，直接使用 n-gram 精确率可能会导致过高的 BLEU 分数。为了平衡不同 n-gram 的影响，BLEU 计算 1-gram 到 4-gram 的精确度，并取。默认情况下，BLEU 计算 1 到 4-gram 的匹配率，权重均为。

2025-03-05 09:54:02 935

原创 LoraConfig参数说明

它是一种用于高效微调大语言模型（LLM）的技术，主要通过低秩矩阵分解来减少训练参数。配置的 LoRA 主要作用于。，适用于高效微调大语言模型。决定 LoRA 影响力，中，这些参数用于配置。

2025-03-04 14:15:48 458

原创详解准确率、精确率、召回率、F1值等评价指标的含义

详解准确率、精确率、召回率、F1值等评价指标的含义

2025-03-04 11:33:20 159

原创 7zip安装与使用

取决于你的操作系统发行版。

2025-03-03 20:37:37 389

原创模型微调注意事项(防止通用知识遗忘)

垂直领域数据多样性：任务多样性、prompt多样性。通用数据和垂直领域数据配比。参数高效微调 qlora。

2025-03-03 17:55:42 82

原创模型训练时，英伟达gpu状态解读

（NVIDIA System Management Interface）的输出，显示了。你当前是在训练还是推理？这张图片是 nvidia-smi。

2025-03-03 17:39:27 305

原创 ubuntu制作docker python镜像

ubuntu制作docker python镜像。

2025-03-03 15:54:34 116

原创 pytorch-gpu版本安装(英伟达gpu驱动安装)

如果没有相关输出，说明驱动未安装，建议安装最新的 NVIDIA 驱动。安装过程有点漫长😮‍💨😮‍💨😮‍💨。如果没有输出，可能你的服务器。

2025-03-03 15:15:27 341

原创大模型应用开发需要的知识和工具

微调：全量微调、参数高效微调 lora \qlora。RAG：向量数据库、embedding模型。

2025-03-03 12:24:48 179

原创大模型部署方法与工具

大模型部署工具（LLM Deployment Tools）可以帮助你在本地或云端高效部署和管理大语言模型（LLM）。除了之外，还有很多工具提供类似的功能，涵盖本地部署、推理加速、管理、监控等不同方面。

2025-03-03 12:16:58 544

原创大模型部署方法与工具

大模型部署工具（LLM Deployment Tools）可以帮助你在本地或云端高效部署和管理大语言模型（LLM）。除了之外，还有很多工具提供类似的功能，涵盖本地部署、推理加速、管理、监控等不同方面。

2025-03-03 10:28:16 690

原创大模型&大模型产品&大模型平台&大模型厂商

大模型

2025-03-03 10:25:09 111

原创为何现在大模型大部分是decoder only 结构

LLM 采用 Decoder only 架构原因

2025-02-28 12:18:31 105

原创大语言模型训练的目标（不同的结构和阶段）

大语言模型（Large Language Models, LLMs）的训练目标是其能力的核心来源，决定了模型如何从海量数据中学习语言规律和知识。以下是其训练目标的分类和详细说明：预训练是LLMs的基础阶段，通过无监督或自监督任务学习通用语言表示。常见目标包括：在预训练后，模型通过特定任务的数据进一步优化：从单一目标到统一框架从语言建模到多模态学习从静态训练到动态反馈大语言模型的训练目标设计是其能力的核心驱动力：未来趋势将更注重目标统一性（如UL2）、多模态扩展（如GPT-4V），以及低成本对齐方法（如DPO

2025-02-28 11:44:59 852

原创深度强化学习GRPO

GRPO vs PPO、DPO：强化学习算法的深度对决

2025-02-25 09:42:04 272

原创在linux环境上安装Ollama

参考官网：https://github.com/ollama/ollama/blob/main/docs/linux.md。

2025-02-20 14:46:51 434

原创 deepseek-r1系列模型私有化部署分别需要的最低硬件配置

‌适用场景‌：低资源设备部署（如树莓派、旧款笔记本）、实时文本生成（聊天机器人、简单问答）、嵌入式系统或物联网设备‌。‌适用场景‌：本地开发测试（中小型企业）、中等复杂度NLP任务（文本摘要、翻译）、轻量级多轮对话系统‌。‌适用场景‌：企业级复杂任务（合同分析、报告生成）、长文本理解与生成（书籍/论文辅助写作）‌。‌适用场景‌：高精度专业领域任务（医疗/法律咨询）、多模态任务预处理（需结合其他框架）‌。‌适用场景‌：需更高精度的轻量级任务（如代码生成、逻辑推理）‌。‌CPU‌：最低4核（推荐多核处理器）

2025-02-20 00:04:16 955

原创知识图谱与大模型

知识图谱与大模型结合方法概述

2025-02-19 15:34:38 391

原创处理器架构、单片机、芯片、光刻机之间的关系

这些术语都涉及到半导体和电子设备的设计与制造，但它们的含义和作用有所不同。

2025-02-18 16:57:19 1429

原创 arm架构和x86架构的异同

ARM：低功耗、高效能、适用于移动和嵌入式设备。x86：强大性能、支持复杂计算，主要用于高性能桌面计算和服务器。这两种架构各有优缺点，应用场景也不一样。你通常会根据需要的性能和功耗来选择。

2025-02-18 16:54:18 629

原创我国有哪些芯片使用的是arm架构处理器

我国在ARM架构处理器的研发和应用上取得了显著进展，覆盖了从高性能服务器到移动设备的广泛领域。飞腾、鲲鹏和麒麟等处理器在性能和能效上表现出色，推动了国产芯片的自主化和国际化发展。如果需要更详细的信息，可以参考相关来源。

2025-02-18 16:50:39 1035

原创为什么国产芯片都使用arm架构而不使用x86?

随着技术的进步，ARM架构在性能上的提升使其能够适用于更广泛的应用场景，包括高性能计算。：ARM架构的处理器性能每一代都有显著提升，加之制程技术的进步，使得基于ARM架构的CPU性能得到了飞速发展，已经能够与x86架构在某些领域竞争。综上所述，国产芯片选择ARM架构是基于技术授权的灵活性、低功耗高效能的特点、市场趋势、性能提升、自主可控需求以及全球合作机会等多方面考虑的结果。：对于国产芯片来说，采用ARM架构可以在一定程度上减少对外部技术的依赖，增强自主可控能力，对于国家安全和信息安全具有重要意义。

2025-02-18 16:36:20 464

空空如也

空空如也