自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

风信子的博客

只是想简单的记录一下

  • 博客(188)
  • 资源 (3)
  • 收藏
  • 关注

原创 如何使用 LLaMA-Factory 微调 LLaMA3

如何使用 LLaMA-Factory 微调 LLaMA3

2025-03-27 17:51:45 653

原创 Llama3大模型本地部署与调用

Llama3大模型本地部署与调用

2025-03-26 14:25:27 464

原创 数据可视化TensorboardX和tensorBoard安装及使用

TensorBoard 是 TensorFlow 官方提供的可视化工具,而 TensorBoardX 是其社区驱动的替代品,支持 PyTorch 等其他框架。通过 TensorBoard 或 TensorBoardX,你可以直观地监控模型训练过程,分析实验结果,从而更有效地优化模型。TensorBoard 通常与 TensorFlow 一起安装,但也可以单独安装。:可以通过 SSH 隧道将远程服务器的 TensorBoard 端口映射到本地。API 记录日志,然后使用 TensorBoard 可视化。

2025-03-26 13:21:42 1749

原创 Qwen大模型微调(QLora微调与GGUF模型转换)

GGUF 格式的全名为(GPT-Generated Unified Format),提到GGUF 就不得不提到它的前身GGML(GPT-GeneratedModelLanguage)。GGML 是专门为了机器学习设计的张量库,最早可以追溯到 2022/10。其目的是为了有一个单文件共享的格式,并且易于在不同架构的 GPU 和CPU 上进行推理。但在后续的开发中,遇到了灵活性不足、相容性及难以维护的问题。

2025-03-25 12:50:26 1484

原创 Qwen打包部署(大模型转换为 GGUF 以及使 用 ollama 运行)

Qwen打包部署(大模型转换为 GGUF 以及使 用 ollama 运行)

2025-03-25 12:49:10 209

原创 【随手记】支持多模态输入的 AI Chatbot App

官方文档:https://docs.streamlit.io/中文文档:https://blog.youkuaiyun.com/weixin_44458771/article/details/135495928开发环境PyCharm Community Edition 2024Win10/11Streamlit 1.39.0app.py3.2、启动应用设置参数:script:D:/software/python/python-3.12.4/.venv/Scripts/streamlitscript paramet

2025-03-25 00:00:00 387

原创 【简单学习】Prompt Engineering 提示词工程

定义:Prompt Engineering 是设计和优化输入提示(prompt)以获得预期输出的过程。在与大型语言模型(如 GPT-4)交互时,如何构造提示会显著影响模型的回答质量。例子简单提示"告诉我关于猫的事情。优化提示"请详细描述猫的生物学特征、行为习惯以及它们在不同文化中的象征意义。通过优化提示,用户可以引导模型生成更详细和有用的回答。Prompt Engineering 是设计和优化输入提示以获得预期输出的过程。应用场景:定义特定功能的函数。示例提示。

2025-03-25 00:00:00 844

原创 LangChain Tools学习与 Agent智能体学习

在构建代理时,您需要为其提供一个Tool列表,以便代理可以使用这些工具。除了实际调用的函数之外,Tool由几个组件组成:属性类型描述namestr在提供给LLM或代理的工具集中必须是唯一的。str描述工具的功能。LLM或代理将使用此描述作为上下文。可选但建议,可用于提供更多信息(例如,few-shot示例)或验证预期参数。boolean仅对代理相关。当为True时,在调用给定工具后,代理将停止并将结果直接返回给用户。LangChain 提供了三种创建工具的方式:使用。

2025-03-25 00:00:00 1060

原创 (windows)conda虚拟环境下open-webui安装与启动

(windonws)conda虚拟环境下open-webui安装与启动

2025-03-24 19:16:45 370

原创 【学习记录】大模型微调之使用 LLaMA-Factory 微调 Qwen系列大模型,可以用自己的数据训练

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调,框架特性包括

2025-03-24 15:44:12 1700

原创 LangChain Chat Model学习笔记

LangServe 🦜️🏓 帮助开发者将 LangChain 可运行和链部署为 REST API。该库集成了 FastAPI 并使用 pydantic 进行数据验证。Pydantic 是一个在 Python中用于数据验证和解析的第三方库,现在是Python中使用广泛的数据验证库。● 它利用声明式的方式定义数据模型和Python 类型提示的强大功能来执行数据验证和序列化,使您的代码更可靠、更可读、更简洁且更易于调试。。

2025-03-23 00:00:00 1236

原创 LangChain 基础

即,逐个处理输入块,并产生相应的输出块。这种处理的复杂性可以有所不同,从简单的任务,如发出 LLM 生成的令牌,到更具挑战性的任务,如在整个 JSON 完成之前流式传输 JSON 结果的部分。如果这与您构建的内容无关,您也可以依赖于标准的命令式编程方法,通过在每个组件上调用invoke、batch或stream,将结果分配给变量,然后根据需要在下游使用它们。对于某些链,这意味着我们直接从 LLM 流式传输标记到流式输出解析器,您将以与 LLM 提供程序输出原始标记的速率相同的速度获得解析的增量输出块。

2025-03-23 00:00:00 594

原创 【记一次】AI微调训练步数计算方式

AI微调训练步数计算方式

2025-03-22 16:08:04 947

原创 【记录一下】LMDeploy推理大模型学习笔记及遇到的问题

LMDeploy 是一个用于大型语言模型(LLMs)和视觉-语言模型(VLMs)压缩、部署和服务的 Python 库。其核心推理引擎包括 TurboMind 引擎和 PyTorch 引擎。前者由 C++ 和 CUDA 开发,致力于推理性能的优化,而后者纯 Python 开发,旨在降低开发者的门槛。LMDeploy 支持在 Linux 和 Windows 平台上部署 LLMs 和 VLMs,最低要求 CUDA 版本为 11.3。

2025-03-22 02:00:00 950

原创 【留一下记录】Vllm推理大模型在Linux环境下的学习笔记

Vllm学习笔记

2025-03-21 19:58:12 664

原创 【记录一下】Microsoft登录反复跳转【需要家长或监护人同意才能使用该帐户】页面

【记录一下】Microsoft登录反复跳转【需要家长或监护人同意才能使用该帐户】页面

2025-03-21 14:34:30 410

原创 linux环境安装ollama,Anaconda3【有点乱,大概只有自己看得懂】

如果需要使用 GPU 加速,需根据 CUDA 版本选择对应的 PyTorch 安装命令。你正在尝试安装 PyTorch 及其相关库。如果问题仍未解决,请提供完整的错误日志以便进一步诊断。如果仍有问题,请提供具体的错误信息,以便进一步诊断。,根据你的 CUDA 版本选择对应的安装命令。如果仍有问题,可以尝试重启终端或检查。如果是多环境的话,需要安装conda。激活的ollama环境下安装。找到profile.d文件,有个蓝色的图标表示已激活。

2025-03-21 10:28:28 1014

原创 【记录一下】jdk环境配置,老忘记

jdk环境配置

2025-03-20 10:28:30 292

原创 【笔记一下】RAG 专题基础学习

检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上,RAG 将其扩展为能访问特定领域或组织的内部知识库,所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法,让它在各种情境下都能保持相关性、准确性和实用性。CSVLoader接受一个csv_args。

2025-03-13 11:26:38 1217

原创 linux学习笔记,换电脑了,怕弄丢,留一下记录

版本控制(Revision control)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。实现跨区域多人协同开发追踪和记载一个或者多个文件的历史记录组织和保护你的源代码和文档统计工作量并行开发、提高开发效率跟踪记录整个软件的开发过程减轻开发人员的负担,节省时间,同时降低人为错误简单说就是用于管理多人协同开发项目的技术。

2025-03-11 15:39:59 515

原创 BERT(Bidirectional Encoder Representations from Transformers)的序列分类模型,简单学习记录

在神经网络中,线性层(Linear layer)是最基本的组件之一,它执行的是线性变换,通常用于从网络的某一层到下一层的映射。模型利用BERT的预训练表示能力,通过嵌入层、编码器层和池化层提取输入序列的特征,最后通过一个分类器层将这些特征映射到分类任务的标签空间。在这个例子中,线性层输出2个特征,这通常意味着该网络被配置为执行二分类任务(即,预测两个类别中的一个)。这些特征可能来自前一个隐藏层的输出。classifier:这是该线性层的名称或标识符,在这个上下文中,它可能表示这是一个用于分类任务的层。

2025-03-10 15:24:50 2196

原创 【简单记录】RAG与LLM的交互流程

该流程旨在通过结合用户查询、相关知识源和大型语言模型(LLM),生成一个增强上下文的文本响应。

2025-03-08 14:45:31 1201

原创 【记录一下】Hierarchical Navigable Small Worlds(HNSW)是什么玩意?

HNSW基于小世界网络(small-world networks)原理,通过构建一个多层次的图结构,能够快速找到与查询点相似的数据点。具体来说,HNSW将数据点组织成一个分层图结构,每一层的图结构代表数据的不同分辨率。在高层次,数据点的数量较少,连接关系较少,搜索效率较高;在底层,数据点的数量较多,连接关系更密集,能够更精确地找到最近邻。

2025-03-07 19:59:46 519

原创 【记录一下】Embeddings与向量数据库的关系

Embeddings,即嵌入,是一种数据降维技术,其核心思想是将高维数据映射到低维空间,同时保留数据的关键信息和结构关系。这种映射通常是通过神经网络中的Embedding层实现的,利用训练数据学习得到数据的向量表示。这些向量中的每个维度对应于数据的某种潜在特征,从而捕捉到了数据的内在关系。其原理基于分布式假设,即相似的对象在嵌入空间中也应该具有相似的表示。为了实现这一目标,通常需要学习一个映射函数,将输入的高维数据映射到低维向量空间中。这个向量空间被称为嵌入空间或特征空间。

2025-03-07 19:47:48 923

原创 【记录一下学习】Embedding 与向量数据库

Qdrant(读作:quadrant /'kwɑdrənt/ n. 象限;象限仪;四分之一圆)是一个向量相似度搜索引擎。它提供了一个生产就绪的服务,具有方便的 API 来存储、搜索和管理点 - 带有附加载荷的向量。专门支持扩展过滤功能,使其对各种神经网络或基于语义的匹配、分面搜索和其他应用非常有用。以下展示了如何使用与向量数据库相关的功能。有各种运行的模式,取决于所选择的模式,会有一些细微的差异。选项包括:本地模式,无需服务器Qdrant 云请参阅安装说明。

2025-03-07 15:53:01 1546

原创 【记录一下】chromedriver各个版本驱动下载

地址:googlechromelabs.github.io/chrome-for-testing/known-good-versions-with-downloads.json。地址:https://googlechromelabs.github.io/chrome-for-testing/地址:chromedriver.storage.googleapis.com/index.html。只有后面status是绿色对勾的才可以下载,只需点击版本名称即可跳转到对应的下载位置。

2025-02-20 10:46:39 1251

原创 【走过路过,不要错过哦】python制作的浪漫烟花,非常烂漫

这是一个基于Python制作的烟花绽放动画程序,可以用于表白祝福。

2025-02-17 20:25:45 1383

原创 【走过路过,点开看看】用Python制作的五彩气球,很五彩呢

基于Python Turtle模块的气球动画程序,用于儿童节祝福。通过气球类、漂浮函数和主函数的设计,实现气球动态漂浮和祝福语展示,展现Python的可编程性和动态性

2025-02-15 00:00:00 1060

原创 华为OD机试真题---战场索敌

有一个大小是N×M的战场地图,被墙壁'#'分隔成大小不同的区域。上下左右四个方向相邻的空地'.'属于同一个区域,只有空地上可能存在敌人'E'。请求出地图上总共有多少区域里的敌人数小于K。

2025-01-20 09:52:26 2735

原创 华为OD机试真题---一种字符串压缩表示的解压

有一种简易压缩算法:针对全部由小写英文字母组成的字符串,将其中连续超过两个相同字母的部分压缩为连续个数加该字母,其他部分保持原样不变。例如,字符串“aaabbccccd”经过压缩成为字符串“3abb4cd”。现在需要编写解压函数,根据输入的字符串,判断其是否为合法压缩过的字符串。若输入合法,则输出解压缩后的字符串;否则,输出字符串“!error”来报告错误。

2025-01-17 17:12:18 878

原创 华为OD机试E卷 ---最大值

给定一组整数(非负),重排顺序后输出一个最大的整数。

2025-01-17 17:12:11 2770

原创 Pycharm安装使用----真实亲测有效

Pycharm安装使用----真实亲测有效

2025-01-08 10:42:54 1654 3

原创 欢迎2025,再见2024

欢迎2025,再见2024。

2025-01-01 12:52:43 168

原创 华为OD机试真题---求字符串中所有整数的最小和

输入字符串s,输出s中包含所有整数的最小和。

2024-12-31 15:20:16 1546

原创 华为OD机试真题---服务器广播

服务器之间可以通过网络进行连接,连接方式包括直接相连和间接连接。给出一个N×N的数组(矩阵),代表N个服务器,matrix[i][j] == 1表示服务器i和服务器j直接连接,matrix[i][j] != 1表示服务器i和服务器j不直接连接。matrix[i][i] == 1,即服务器自己和自己直接连接。matrix[i][j] == matrix[j][i],即连接关系是对称的。

2024-12-30 16:38:00 2122

原创 华为OD机试真题---箱子之字形摆放

有一批箱子,用一个字符串来表示每个箱子上的编号(编号由字母和数字组成)。要求将这批箱子按照之字形顺序摆放在宽度为n的空地上,并输出它们的摆放位置。之字形摆放要求每行的箱子是交替从左到右,或者从右到左摆放的,形成类似“Z”字形的排列。

2024-12-23 20:46:24 2425

原创 华为OD机试真题---机房布局

小明正在规划一个大型数据中心机房,为了使得机柜上的机器都能正常满负荷工作,需要确保在每个机柜边上至少要有一个电箱。为了简化题目,假设这个机房是一整排,M表示机柜,I表示间隔,要求返回整排机柜至少需要多少个电箱。如果无解则返回-1。

2024-12-17 00:00:00 671

原创 华为OD机试真题---观看文艺汇演问题

为了庆祝某个重要节日(如中国共产党成立100周年),某公园将举行多场文艺表演。很多演出都是同时进行的,一个人只能同时观看一场演出,且不能迟到早退。由于演出分布在不同的演出场地,所以连续观看的演出之间最少有15分钟的时间间隔。小明是一个狂热的文艺迷,想观看尽可能多的演出。现在给出演出时间表,请计算小明最多能观看几场演出。

2024-12-17 00:00:00 1678

原创 华为OD机试真题---九宫格按键输入

九宫格按键输入,有英文和数字两个模式,默认是数字模式,数字模式直接输出数字,英文模式连续按同一个按键会依次出现这个按键上的字母,如果输入""或者其他字符,则循环中断,输出此时停留的字母。数字和字母的对应关系如下,注意0只对应空格:

2024-12-16 10:25:43 697

原创 华为OD机试真题---小明周末爬山

周末小明准备去爬山锻炼,地图上的0代表平地,山的高度使用1到9来表示。小明每次爬山或下山高度只能相差k及k以内,且每次只能上下左右一个方向上移动一格。小明从左上角(0,0)位置出发,目标是找到他能爬到的最高峰,并输出该峰的高度以及到达该峰的最短步数。如果有多座同高度的山峰,则输出步数较短的那座。如果没有可以爬的山峰,则高度和步数都返回0。

2024-12-16 09:47:13 1567

Redis的标准使用规范

Redis的标准使用规范,好好用,好好学,嗯就这样

2024-09-07

炸裂:Jenkins持续集成入门到精通居然如此简单,泪目了

Jenkins持续集成入门到精通,内容包含: 1、持续集成及Jenkins介绍 2、Jenkins安装和持续集成环境配置 3、Jenkins构建Maven项目 4、Jenkins+Docker+SpringCloud微服务持续集成 5、基于Kubernetes/K8S构建Jenkins微服务持续集成平台 以上内容非常详细,绝对能够帮助你从一个小白到大神的冲刺学习

2024-09-06

MySQL8.0参考手册中文版

打开百度网盘,免费下载不要钱 链接:https://pan.baidu.com/s/1loAoyceuxnOLVmsW41o72g?pwd=mnzg 提取码:mnzg

2022-09-26

Dynamsoft SourceAnywhere for VSS Standard ClientT免费下载

Dynamsoft SourceAnywhere for VSS Standard Client包含6.4和5.4版本,以及安装手册, 链接:https://pan.baidu.com/s/1f4amcjmjhxGuKEx0u2aEGw?pwd=9988 提取码:9988

2022-04-15

Oracle 6.5 静默安装11g数据库.pdf

适合广大运维工作者

2021-02-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除