在雨中612-优快云博客

原创【langchain】自用：自定义LLM和ChatModel

FastAPI部署LLM接口，然后调用接口。中的bind_tools函数。

2025-04-07 08:52:59 237

原创【EasyDataset】

打开浏览器访问：http://localhost:1717。把max_tokens从2028改成8196。

2025-03-31 17:07:55 177

原创【MinerU】可本地部署的PDF解析器

snapshot_download会有一个默认下载位置。export MODELSCOPE_CACHE=“目标地址”export HF_HOME=“目标地址”把pdf转换为markdown。从hugginface下载模型。

2025-03-30 22:43:34 457

原创【Ollama】大模型运行框架

GGUF是一种存储LLM的格式。ollama选用了这种格式。所以hugginface下下来的llm需要转换为gguf格式。然后把ollama/bin添加到path里。注意.gguf文件存储在model文件夹内部。

2025-03-30 21:56:51 463

原创【ES】Elasticsearch学习

官网：https://www.elastic.co/guide/en/elasticsearch/reference/current/targz.html。参考：https://blog.youkuaiyun.com/smilehappiness/article/details/118466378。

2025-03-21 17:10:05 386

原创【github】代码仓库

两种开分支的做法：https://www.cnblogs.com/qyf404/p/git_push_local_branch_to_remote.html。vscode里先输入commit messages，然后 ^X离开，选择Y来保存，最后enter退出。现在貌似下载自己代码仓库只用账号密码是不行的。我用的vscode，直接命令行git操作。或者commit全部。

2024-11-25 11:17:43 316

我感觉大多数空间复杂度要求特别高，或者要求原地置换的，就得利用输入数据空间，比如《缺失的第一个正数》用正负号来承载其他信息，比如《矩阵置零》用额外的一个bool表示首列是否置零，然后用0代表该行是否置零。我的做法也是O(n)，慢一点。找到最远（最左最右）的大于等于自己的点，然后就可以计算以height[i]为高度的最大的面积。要求复杂度O(n)。用的unordered_set，用的是哈希表，插入查询都是常数时间。维护的是每个高度的水位可以覆盖的最远范围区间，查询的是每个位置可以被覆盖的最高水位。

2024-09-10 15:55:46 358

原创【bib】论文参考文献整理

参考文献整理

2024-09-04 21:49:57 1602

原创【找工作】算法知识点-自用复习

双指针例题：双指针错开找倒数第x个节点

2024-08-24 22:20:57 895

原创【找工作】剑指offer刷题记录

记录一些自己可能会忘的解法

2024-08-19 12:32:45 291

原创【LLM微调】以llama3为例

smart_tokenizer_and_embedding_resize是alpaca自定义的函数，把自定义的token字典传到tokenizer中，并且修改模型中的token的embedding。我最开始以为这里的padding="longest"是写错了，后来明白它的意思是限制文本长度不超过tokenizer.model_max_length，并且不填充到model_max_length。注意，当前批次下，input_ids的pad是普通的pad，但是labels的pad是。

2024-08-08 14:59:31 874

原创个人自用防忘笔记

设置总值# 创建进度条对象，并设置总值# 模拟一个循环，更新进度条# 模拟一些处理时间# 更新进度条# 关闭进度条。

2024-08-05 14:33:32 250

原创【fastapi】的使用（部署LLM）

与WSGI类似，ASGI（ Asynchronous Server Gateway Interface）描述了Python Web应用程序和Web服务器之间的通用接口。与WSGI不同的是，ASGI允许每个应用程序有多个异步事件。常见ASGI如uvicorn，gunicorn，hypercorn。fastapi安装，需要安装自身包和一个ASGI的服务器。

2024-07-31 15:25:36 528

原创【neo4j】win/linux安装和使用+cypher+langchian+向量索引

进入http://localhost:7474后输入用户密码，用户名是neo4j，密码是刚刚设置的数据库密码。设置下环境变量，把解压后的neo4j-community-5.21.2/bin放到环境变量的path里。上述做法是在conf配置里取消一行内容的注释，但是我这版的conf根本没有这行内容。设置下数据库名和密码，我这里设置的数据库是test，密码是rootroot。照上面参考的使用就可以了，windows和linux两版的连接都没有问题。bolt://localhost:7687是bolt协议。

2024-07-24 22:40:04 1093

原创论文阅读2：RoG

KL散度是两个概率分布P和Q差别的非对称性的度量，在消息系统中称为相对熵。相对熵为非负数对于离散随机变量，概率分布P和Q的KL散度为：等价于。

2024-07-07 17:13:14 1101

原创论文阅读1：GNN-RAG

训练时，给定question-answer pairs，把QA当成node- classification任务来训练（判断每个实体是answer还是 not answer），即L层GNN后获得每个实体的分数，然后打分。推理时，把超过一个分数阈值的实体都当成候选答案，并且给出每个answer对应的最短路径（从question entity到当前的answer）。实际使用中，GNN retriever抽取的路径、LLM-based抽取的路径结合起来传到LLM中。本文训了2个GNN，一个用的是预训练的。

2024-07-04 20:45:46 1002

原创【ssh转发】如何在本地计算机上查看远程服务器上的网页？

ngrok不能用代理->关闭远程服务器的代理设置->远程服务器没网->ngrok需要有网->远程服务器需要设置代理->ngrok不能用代理。目前了解的可以端口转发或者快速构建web并支持端口转发的包有ngrok、flask、uvicorn、gradio。但是如果远程服务器上本来能联网不需要代理，可能可以正常使用ngrok。我使用的远程服务器上是没有网的，需要用我本地计算机的代理。ngrok的使用需要NGROK_AUTHTOKEN。但是我在远程服务器上没有管理员账号，所以我在个人账户下安装了ngrok。

2024-06-01 15:23:15 924

zt0612xd的博客

原创【langchain】自用：自定义LLM和ChatModel

原创【EasyDataset】

原创【MinerU】可本地部署的PDF解析器

原创【Ollama】大模型运行框架

原创【ES】Elasticsearch学习

原创【找工作】Codefun刷题记录

原创【找工作】C++和算法复习（自用）

原创【github】代码仓库

原创【报错信息】环境安装、python

原创【找工作】力扣热题100