- 博客(398)
- 收藏
- 关注
原创 数据库查询
本文介绍了三个SQL查询操作:1)查询CACHE_FAC2表中所有不重复的tagname列名;2)获取每个tagname对应的最新value和dtime数据;3)从CACHE_JD2表中查询最新的100条记录。这些查询主要用于获取数据库表中特定列的最新数据记录。
2025-12-05 17:20:33
56
原创 Linux 压缩 save 文件夹 为同名压缩文件
摘要:本文介绍了一种通过硬链接创建目录快照的方法,利用cp -al命令快速生成静态副本进行压缩。该方法首先创建空目录作为快照点,然后用硬链接方式"复制"原目录内容(几乎不占空间),再对快照进行压缩打包,最后清理临时文件。相比直接压缩,这种方案能避免因原目录变动导致的文件不一致问题,且处理大量文件时仅需数秒,仅在文件被修改时才占用额外空间。关键命令组合:mkdir创建快照目录、cp -al建立硬链接、tar -czf压缩快照。
2025-11-20 14:30:42
227
原创 怎么取消 git 添加但没提交的文件
摘要:Git中取消已暂存文件的添加操作可通过git reset HEAD <文件名>撤销单个文件,或git reset HEAD撤销所有暂存文件。这些命令仅将文件移出暂存区,保留工作区修改。若已提交则需使用git reset --soft/--hard回退。注意区分暂存与提交的不同撤销方式。
2025-10-22 09:25:00
172
原创 MobaXterm 端口转发密码验证错误
摘要:解决MobaXterm提示输入主密码时忘记密码的问题。若忘记密码导致无法登录,可前往官网下载密码重置工具(https://mobaxterm.mobatek.net/resetmasterpassword.html),解压后运行即可重置密码。
2025-09-15 10:38:46
487
原创 改 TDengine 数据库的时间写入限制
摘要:针对TDengine数据库的时间写入限制调整,首先通过SQL命令将默认的1个月写入期限延长至10年(3650天),需执行SHOW DATABASES、USE wi以及生成ALTER TABLE语句修改保留时间。其次需修改taos.cfg配置文件,主要调整days参数(控制数据保存天数,默认约10年)。这两个步骤共同解决了测试环境下的数据写入时间限制问题。
2025-09-05 13:54:17
295
原创 python // 和%区别
Python中//和%运算符都与除法相关但功能不同://返回整除结果(商),如7//3=2;%返回余数,如7%3=1。这两个运算符分别用于获取除法运算的整数部分和小数部分。
2025-08-27 17:33:44
298
原创 批量删除 word文档里面多个相同表格的特定行
【Word批量删除表格行的VBA宏解决方案】通过VBA宏可批量处理Word文档中200张表格的特定行删除需求,提供两种方法:1. 删除固定第3行:编写宏遍历所有表格,检查行数后删除指定行;2. 删除含特定文本行:设置关键词(如"备注"),倒序查找并删除匹配行。操作步骤:①Alt+F11打开VBA编辑器;②选择ThisDocument粘贴对应代码;③Alt+F8运行宏。注意事项包括备份文件、启用宏设置及处理表格行数判断。另附多行删除(如8/10/11行)的扩展代码示例。(149字)
2025-06-25 23:34:11
1179
原创 taos 数据库启动报错
显示TDengine数据库连接失败的问题,主要报错为"Unable to establish connection"。错误原因是缺少taos.cfg配置文件。解决方法是在配置目录中添加taos.cfg文件,配置内容包括时区、字符集、端口等基本参数。配置完成后,数据库连接恢复正常运行。该问题表明TDengine需要正确的配置文件才能建立连接,默认配置可能无法满足特定环境需求。
2025-06-16 09:28:24
781
原创 torch.randn vs torch.rand
PyTorch随机数生成对比:randn生成标准正态分布数据(均值0,标准差1),可产生任意正负数,适用于模拟噪声等自然现象;rand生成[0,1)区间的均匀分布数据,仅产生非负数,常用于概率建模和颜色值处理。两者主要区别在于数值分布类型(正态/均匀)和输出范围(无限区间/0-1区间),应根据具体需求选择。
2025-06-02 15:54:23
387
原创 矩阵乘法运算符 【@】
是 NumPy 中执行矩阵乘法的简洁运算符,优先使用它替代np.matmul。对于一维数组,它等同于点积;对于二维及以上数组,遵循矩阵乘法规则。注意示例中的数值可能存在问题,建议检查输入数据。
2025-05-24 13:15:56
478
原创 计算serise数据的唯一值数量
统计 Series 中唯一值的 数量(默认不包含 NaN)(用户可能误认为是列表,但实际是 NumPy 数组)。统计 Series 中唯一值的数量,包含 NaN。:将 NaN 视为一个唯一值并统计。方法的参数化调用形式,通过。:包含 NaN(如果存在)。强制包含 NaN 的计数。(顺序按首次出现排列)。
2025-04-17 15:20:54
267
原创 代码仓库使用git lfs上传模型文件
它主要是用来处理大文件的,比如模型文件通常都很大,超过100MB的话,用普通的Git上传可能会出问题,所以必须用LFS。,下载Windows安装包并运行。指定需要追踪的大文件类型(例如。
2025-04-02 10:04:11
806
原创 大模型架构记录13【hr agent】
tool"""生成唯一的时间戳。输入始终为空字符串。Returns:int: 唯一的时间戳,以毫秒为单位。"""timestamp = int(time.time() * 1000) # 获取当前时间的毫秒级时间戳import os@tool"""根据给定的文件夹名创建文件夹。Args:folder_name (str): 要创建的文件夹的名称。Returns:str: 创建的文件夹的路径。
2025-03-30 21:42:09
424
原创 大模型重点5【Agent构建】
包括自定义的字段以及types. 然而,openAI自己也实现了这套逻辑,也叫做functional call, 就是返回用户自定义的Json的structure。Functional Call of OpenAI 是 OpenAI 提供的一种功能,
2025-03-27 00:31:03
906
原创 语音识别执行代码
给 二号 精髓 更 深层 一个 维修工 单 内容 是 设备 次序 能耗 高 可能 与 精髓 不 稳定 有关 发送 给 王宁。----------------> 开始执行所有模型 语音识别, 录音文件:20250324_1106.wav。嗯啊给二号进水泵生成一个维修工单 内容是设备持续能耗高 可能与进水不稳定有关 发送给王林。--------------> 暂定选择模型:ali_speech_paraformer。给二号进水泵生成一个维修工单内容是设备持续能耗高可能与进水不稳定有关发送给王宁。
2025-03-25 15:11:15
342
原创 大模型重点4【RAG优化】
RAG是一种结合了检索和生成的技术,用于提高问答系统的性能。这种方法可以帮助模型更深入地理解问题,并从文档中检索到更相关的内容,从而提高生成答案的质量。根据当前的上下文和已检索到的信息,动态地生成新的查询来进一步检索更精确的信息。在RAG模型中,检索器负责从文档集合中找到与输入查询最相关的文档片段。:在RAG模型中,自我查询检索可能涉及到模型在生成答案的过程中,:可能指的是对检索器的改进,以提高检索结果的相关性和准确性。:可能涉及对查询语句的优化,使其更有效地检索相关信息。模型会生成自己的查询来检索信息。
2025-03-24 23:49:45
995
原创 大模型重点3【综述-langchain】
LangChain 是一个用于开发由大型语言模型(LLM)驱动的应用程序的开源框架。它提供了一套工具、组件和接口,简化了创建由 LLM 和聊天模型支持的应用程序的过程。LangChain 的核心目标是让开发者能够轻松地将 LLM 与外部数据源、API 和其他工具集成,从而构建出更智能、更实用的应用。为什么需要 LangChain?调用多个不同的大模型(gpt4, 视频生成...)向量数据库数据类型(读取,trunk的切分...)langchain功能连接数据源。
2025-03-24 08:53:45
1230
原创 大模型重点1 【综述-文字版】
提示词,是一个非常关键的概念,它指的是,用于引导语言模型生成相应的回答或执行特定任务。:有时又叫Pre-trained Model,预训练模型是指。它通过自监督学习(如掩码语言建模、下一句预测等任务)学习语言的通用知识,包括语法、语义、上下文关系等。:(智能体) 是一种基于大型语言模型(LLM)构建的智能实体,它能够自主感知环境、做出决策并执行任务。拆解复杂任务为可执行的子任务,并评估执行策略。存储和回忆信息,包括短期记忆(会话上下文)和长期记忆(用户特征、业务数据等)。:通过来扩展自身能力。
2025-03-22 11:47:02
1355
原创 VOSK的Python服务端部署完整方案
│ └── vosk-model-cn-0.22 # 预下载的中文模型。│ ├── main.py # FastAPI服务代码。│ └── vosk-helper.py # 音频处理工具。优化的GPU支持(需额外配置NVIDIA容器工具)最终镜像体积约1.2GB(包含完整模型)自动内存管理(限制内存泄漏风险)支持ARM/x86双架构。
2025-03-21 17:32:42
1144
原创 大模型agent的构建
用Chain-of-Thought(思维链)或ReAct框架拆分复杂任务。图像:多模态大模型(如GPT-4V)或专用模型(CLIP)。:对小任务使用轻量级模型(如GPT-3.5 Turbo)。(文本、语音、图像等),转化为大模型可处理的格式。:添加内容过滤层,限制危险工具调用(如删除文件)。(如客服、个人助手、数据分析、自动化流程等)。(生成文本、调用API、控制设备等)。语音:ASR模型(如Whisper)。:人工反馈或自动评估(如任务成功率)。(如一个负责规划任务,一个负责执行)。
2025-03-20 22:07:05
1211
原创 大模型架构记录-路线分析
大模型下载地址:魔搭社区模型介绍地址:算力租用平台:AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDLGPU显存预估: 显存计算器 - 大模型显存需求分析工具 | LlamaFactory | LlamaFactory
2025-03-20 21:55:39
322
原创 大模型架构记录【综述-langchain】
问题:如何没有langchain会怎么样?langchain是面于大模型开发的框架langchain发展很快,讲解课程时候的版本为 0.1.7,具体的语法和接口标准可能会随时改变,请留意官网的documentation调用多个不同的大模型(gpt4, 视频生成...)向量数据库数据类型(读取,trunk的切分...)langchain是面于大模型开发的框架(framework)
2025-03-15 02:29:44
581
原创 大模型架构记录5-向量数据库
先和N个空间的均值比较再和空间内部的所有点比较,计算最近值。query -> requery 对问题做处理,处理上下文。对query 做 refined query。
2025-03-13 23:36:29
257
原创 大模型架构记录4-文档切分 (chunks构建)
chunks: 块trunks : 树干“RAG”通常指 检索增强生成(Retrieval-Augmented Generation)主要框架:用户提query,找到和它相关的,先把问题转换为向量,和向量数据库的数据做比较,检索相似的向量,返回 对应向量的原始文本,构建prompt,给模型回答问题。
2025-03-11 22:55:25
1234
原创 大模型架构记录3-提示工程a
根据下面的上下文回答问题。保持答案简短且准确。如果不确定答案,请回答“不确定答案”。Teplizumab起源于一个位于新泽西的药品公司,名为Ortho Pharmaceutical。在那里,科学家们生成了一种早期版本的抗体,被称为OKT3。最初这种分子是从小鼠中提取的,\能够结合到T细胞的表面,并限制它们的细胞杀伤潜力。在1986年,它被批准用于帮助预防肾脏移植后的\器官排斥,成为首个被允许用于人类的治疗性抗体。问题:OKT3最初是从什么来源提取的?"""OKT3最初是从小鼠中提取的。
2025-03-09 03:15:58
1178
原创 大模型架构记录1
整合文档资源:将公司 产品文档、规范文档、定价信息及FAQ等纳入向量数据库。向量数据库与模型交互:将文档内容向量化后存入向量数据库,供模型实时检索与交互,提供服务。
2025-03-05 23:07:54
2444
原创 anaconda安装报错
Cannot open 本地 Failed to start [powershell.exe, -ExecutionPolicy, RemoteSigned, -NoExit, -Command, & 'D:\anaconda3\condabin\conda.bat' shell.powershell hook | Out-String | Invoke-Expression;
2025-02-22 23:06:38
788
线性模型训练问题111111
2023-09-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅