薛定e的猫咪-优快云博客

原创覆盖文献到写作全流程！GPT-Academic 多模型学术助手安装与使用指南

GPT-Academic（又称 “GPT 学术优化”）是由中科院团队主导开发的开源学术辅助工具，旨在解决科研人员在论文处理、代码分析、文献调研中的效率痛点，目前在 GitHub 已收获6 万 + Star，被称为 “科研人的耶路撒冷”。其核心价值在于以 “模块化交互界面 + 多模型兼容” 为基础，将 AI 能力与学术场景深度结合，覆盖从文献阅读到论文写作的全流程，且支持免费使用，大幅降低学术工作的技术门槛。

2025-12-19 14:20:41 938

原创 Paper Burner X：科研人必备的 AI 文献处理工具，翻译 + 分析一键搞定

Paper Burner X是一款专为学术文献处理设计的AI工具，支持PDF、DOCX等格式的批量翻译与智能分析。通过并发OCR技术实现秒级翻译，完整保留公式、图表等格式，解决传统工具格式丢失问题。采用纯前端架构保障数据安全，支持Vercel和Docker部署。内置术语库、grep检索等功能，可导入GitHub或URL文档，导出多种格式。开源项目采用AGPL-3.0许可，提供在线体验和专业文献处理解决方案。

2025-12-19 13:18:38 584

原创中国版 ReadmeX + 海外爆款 Zread.ai：两款 AI 工具重构开源项目探索方式，一键解析GitHub项目，生成超详细技术文档。

中国版ReadmeX和Zread.ai是两款革新开源项目学习的工具。ReadmeX通过智能语义分析自动生成项目架构图、双语文档和交互式问答，只需替换GitHub链接即可快速理解复杂项目。Zread.ai则支持更广泛的项目分析，自动生成包含架构图、流程图和代码层次解析的详细报告。两者都显著降低了开源项目的学习门槛，帮助开发者从数小时的手动分析缩短到几分钟的智能解读，尤其适合国内开发者克服语言障碍和技术复杂性，实现高效学习和二次开发。

2025-12-03 13:59:19 918

原创全流程实操：Dify+Ollama+Xinference 搭建法律咨询大模型平台（含环境部署/ 数据清洗 / 知识库构建 / 工作流设计）

本文详细介绍了基于Dify的法律咨询大模型平台从零搭建的全过程。针对单台服务器存储限制，采用两台服务器分别部署Dify/Ollama和Xinference服务，通过内网穿透解决网络互通问题。部署环节包括Docker环境配置、Qwen3模型拉取及GPU变量设置，同时完成Xinference的rerank模型部署与Dify对接。知识库构建阶段，通过MinerU工具将PDF法律文档转为Markdown格式，经Python脚本清洗数据（添加标识、优化格式）后创建向量知识库，并进行了分段验证和命中率测试。最终在Dif

2025-12-03 12:16:39 865

转载 Ubuntu 服务器必备：cpolar 内网穿透安装配置全流程（含 token 认证与隧道测试）

摘要：本文介绍了如何在Ubuntu系统下安装和使用cpolar内网穿透工具。首先通过curl命令安装cpolar，完成版本验证和token认证后，测试8080端口穿透成功。接着将cpolar配置为后台服务并设置开机自启动，通过Web UI管理界面（9200端口）可进行隧道配置等操作。cpolar支持多平台，适用于Linux服务器环境，提供简单高效的内网穿透解决方案。详细教程可参考官网文档。

2025-12-03 12:10:59 78

原创【论文精读】ICML 2022 基于扩散模型的规划：面向灵活行为合成的方法（Planning with Diffusion for Flexible Behavior Synthesis）

基于模型的强化学习方法通常仅将学习用于估计近似动力学模型，而将其余决策工作交由经典轨迹优化器完成。尽管概念上简洁，但这种组合存在诸多实证缺陷，表明所学模型可能并不适配标准轨迹优化方法。本文探索了一种新的思路：将轨迹优化流程中尽可能多的环节融入建模过程，使得从模型采样与基于模型规划几乎趋于统一。我们技术方案的核心是一个扩散概率模型，该模型通过迭代对轨迹去噪来实现规划。

2025-11-30 09:35:21 802

原创【源码解读】ICLR 2023 --- 作为离线强化学习强表达能力策略类的扩散策略

离线强化学习（Offline Reinforcement Learning, RL）旨在利用先前收集的静态数据集学习最优策略，是强化学习领域的重要范式。标准强化学习方法在该场景下往往表现不佳，原因在于对分布外动作（out-of-distribution actions）的函数逼近存在误差。尽管已有多种正则化方法被提出以缓解这一问题，但这些方法通常受限于表达能力有限的策略类（policy classes with limited expressiveness），可能导致最终解的性能严重次优。

2025-11-29 12:22:35 1049 1

原创万字长文详细解读扩散模型（diffusion model）从原理剖析、公式推导、Unet架构到代码实现

扩散模型通过逐步去噪实现高质量图像生成，其核心是噪声预测器学习训练数据的真实分布。在文本到图像任务中（如Stable Diffusion），模型结合文本编码器提供的语义条件指导生成过程。评估生成质量主要采用FID指标衡量图像分布相似度，以及CLIP模型验证图文匹配度。扩散模型通过正向加噪构造训练数据，反向去噪生成图像，其性能依赖于文本编码器的语义理解能力和噪声预测器的分布拟合效果。这种分步生成框架显著提升了生成图像的逼真度和语义一致性。

2025-11-24 11:30:54 2485

原创开启AI绘画 “工作流时代” 的神奇应用----Comfy UI | 使用CNB平台搭建ComfyUI

摘要：本文介绍如何使用腾讯云CNB平台快速部署ComfyUI可视化AI生成工具。操作流程包括：1）在CNB平台fork现成的ComfyUI模板项目；2）启动项目并下载Stable Diffusion模型；3）安装扩展节点并同步修改到个人仓库。该方法无需本地配置环境，通过云原生开发平台即可实现AI图像生成功能，适合快速开展AI创作和开发测试。（149字）

2025-11-23 20:49:25 1137 1

原创【调试技巧】vscode 四种断点调试，快速定位 bug

本文介绍了VSCode调试中的四种特殊条件断点：表达式断点(Expression)、命中次数断点(Hit Count)、日志消息断点(Log Message)和等待断点(Wait for Breakpoint)。通过Python示例展示了每种断点的具体应用场景和设置方法：表达式断点可在条件为真时暂停；命中次数断点可在指定执行次数时中断；日志消息断点可输出变量值而不中断程序；等待断点则需依赖其他断点触发后才生效。这些功能能显著提升调试效率和精准度，适用于循环、条件判断和异步流程等复杂场景。

2025-11-22 20:37:29 893

原创【生成扩散模型】通过随机微分方程（SDE）实现基于分数的生成建模

摘要：扩散模型通过加噪和去噪过程转化数据分布，其中随机微分方程（SDE）可作为数学框架描述这一连续随机过程。SMLD方法利用噪声条件分数网络学习不同噪声尺度下的去噪方向，通过朗之万动力学进行逆向采样；DDPM则基于马尔可夫链构建正向加噪过程，利用变分推断学习反向去噪过程。两者都通过训练网络近似分数函数（数据分布的梯度），从而实现从噪声分布到真实数据分布的逆推。

2025-11-10 15:50:04 1759

原创【外刊精读】All those whoo achieve great things have an extremely positive language system

Many people fail to understand that a language system is actually the most powerful thing in the world.很多人并没有意识到，“语言体系”其实是这个世界上最强大的力量。

2025-11-09 23:33:31 865

原创基于分数的生成模型SMLD（score-Matching） ------- Langevin Dynamics（朗之万动力学）公式推导

摘要基于分数的生成模型通过朗之万动力学实现目标分布采样，其核心组件包括：1）利用分数函数（概率密度梯度）指引采样方向；2）通过噪声扰动保障样本多样性。当目标分布未知时，采用神经网络近似分数函数。该模型物理本质与玻尔兹曼分布相关联，将势能梯度转化为对数概率梯度。朗之万动力学在梯度下降基础上引入噪声，使样本能覆盖整个分布而非收敛至单一极值点。实验表明，该方法能有效从均匀分布初始样本收敛至目标分布（如高斯混合分布）。

2025-11-03 18:07:07 2067 1

原创【vercel部署】什么是云函数? 传统云函数和边缘函数有什们区别?---使用vercel实现云函数部署

云函数是一种无服务器部署方案，开发者上传代码到云平台，由厂商维护运行环境。云函数分为传统云函数和边缘云函数：传统云函数基于Node.js环境，支持完整功能；边缘云函数运行在全球节点，延迟低但功能受限。通过Vercel平台可快速部署云函数，传统云函数支持文件系统操作，而边缘函数仅支持轻量API调用。两者适用场景不同：边缘函数适合低延迟接口，传统云函数适合简易后台逻辑。代码对比显示边缘函数无法使用Node.js文件模块，需改用Web标准API如fetch实现数据交互。

2025-11-02 18:47:51 1305

原创【大模型开发】低成本获得域名，使用 Cloudflare 搭建反向代理，本地（国内）通过 API 直接调用 Gemini 语言模型

该内容围绕 Gemini API 的国内使用展开。首先在 NameSilo 购买域名，通过 Cloudflare 配置 DNS。接着介绍 Gemini API 获取方式，在 Google AI Studio 创建可重复查看的 API key，并用 Chatbox 测试有效性。然后借助开源项目 gemini-balance，通过 Cloudflare Worker 搭建反向代理，添加自定义子域名解决国内访问问题。提供 Python 示例代码，实现图片识别和问答功能。

2025-11-01 19:16:09 1881

原创【外刊精读】When the World Gets Bigger, the Pain Feels Smaller

Some problems can’t be solved within the system。A better way is to rise above it — where the problem becomes irrelevant.有些问题无法在现有体系内解决，更好的办法是站在更高的维度。让这个问题变得微不足道，不需要解决。

2025-10-22 14:51:40 1208

原创【外刊精读】Life Flows Through You , Not to You

Life isn' t something you own , It' s something you experience.生活不是你拥有的东西，而是你经历的东西。

2025-10-20 19:51:30 1785

原创【大模型开发】DeepSeek+langchain-ChatChat 本地（论文）知识库问答系统(ollama部署)

LangChain-ChatChat是一个基于LangChain框架的开源项目，通过RAG（检索增强生成）技术解决大模型知识库有限的问题。它支持全流程离线私有部署，整合了主流开源大语言模型（如ChatGLM3、Qwen2等）、嵌入模型和向量数据库，可在CPU/GPU环境下运行。项目包含服务端、前端和文档三大模块，支持多格式文档处理和复杂任务编排。硬件配置方面，针对不同规模模型（7B-72B）提供了详细的显存需求和推荐显卡指南。环境搭建包括Python虚拟环境配置和Ollama模型部署步骤，支持本地私有化部署

2025-10-20 17:13:15 1082

原创【外刊精读】You Care Too Much

Everything will work out for the better.一切都会苦尽甘来，终得圆满

2025-10-17 21:10:35 1109

原创【科普】什么是云计算？和边缘计算有哪些区别？

云计算是一种通过互联网提供计算资源和服务的技术。它允许用户随时随地访问和使用云平台上的数据、软件和硬件资源。在数字化时代，互联网已经成为基础设施。云计算使得数据中心能够像一台计算机一样去工作。通过互联网将算力以按需使用按量付费的形式提供给用户，包括：计算、存储、网络、数据库、大数据计算、大模型等算力形态。云计算一个明显的优势是弹性，能让您按需使用各类服务，灵活扩缩容，从容应对业务流量的不确定性。什么是云计算？边缘计算是一种计算模式，目的在于把数据处理的位置从远程集中的数据中心或云迁移到靠近数据源的地方。

2025-10-17 20:11:56 1069

原创【外刊精读】Why We Need To Take It Slowly in Love

A torrent of affection hidden within, showing only a calm and gentle care on the surface.汹涌的爱意深藏在心底，表现出来的只有云淡风轻的关心。

2025-10-16 20:58:16 1201

原创【贝叶斯推断】哈密顿蒙特卡洛方法（Hamiltonian Monte Carlo）

哈密顿蒙特卡洛（HMC）是一种高效的马尔可夫链蒙特卡洛方法，通过模拟哈密顿动力学系统从复杂后验分布中采样。它将目标分布转化为势能函数，引入动量变量配合位置变量模拟动力学轨迹，利用Metropolis-Hasting更新建议点。HMC通过蛙跳法数值求解哈密顿方程，保持能量近似守恒，避免随机游走问题。该方法将统计分布与正则分布关联，势能对应负对数概率密度，动能为辅助的高斯分布。相比传统MCMC，HMC在高维参数估计中表现优异，广泛应用于贝叶斯深度学习等领域。

2025-09-26 18:45:00 929 2

原创【大模型开发框架】LangChain核心架构解析与应用实践（一）

LangChain是一个连接大语言模型与外部组件的框架，简化AI应用开发。它通过统一接口降低模型切换成本，提供模块化链式组装功能。核心架构包含LangChain（基础功能）、LangGraph（多任务协调）、LangSmith（调试监控）和LangServe（API部署）。支持RAG（检索增强生成）解决知识更新和幻觉问题，以及Agent架构实现智能决策。标准化Model I/O流程包括输入格式化、模型调用和输出解析，支持多轮对话开发。适用于复杂任务分解、知识检索和智能体应用场景。

2025-09-25 20:49:13 1396 2

原创【贝叶斯推断】（分布式）可逆跳跃马尔科夫链蒙特卡洛（Distributed RJMCMC）

本文摘要介绍了可逆跳跃马尔可夫链蒙特卡洛（RJMCMC）方法及其在贝叶斯模型选择中的应用。传统MCMC方法局限于固定维度的参数空间，而RJMCMC通过引入"跳跃核"和雅可比行列式校正测度差异，实现了不同维度参数空间之间的可逆跳转。文章详细阐述了RJMCMC的数学基础，包括联合后验分布构建、细致平衡条件以及提议分布的设计要求。该方法通过构建一个可遍历不同模型空间的马尔可夫链，同时获得模型后验概率和参数后验分布，解决了贝叶斯模型判定中维度可变的关键难题。

2025-09-01 17:37:58 1396

原创【分布式贝叶斯推断】推导适用于分布式计算的边际似然恒等式

本文提出了一种贝叶斯推断中边际似然的分布式计算方法。通过将数据分片和先验分解，推导出边际似然的分布式分解式，使计算可拆分为三部分：拆分阶段（处理子先验）、应用阶段（各节点独立计算子后验证据）和合并阶段（整合子后验信息）。该方法支持大规模数据下的并行计算，并推导出模型后验的修正专家乘积表示，为分布式贝叶斯模型选择提供了理论基础。

2025-08-29 21:43:25 980

原创【贝叶斯计算】基于数据增强的边际似然估计

数据增强是贝叶斯计算中的关键技术，通过引入潜在变量z将复杂模型转化为更易处理的完整数据模型p(y,z|θ)。典型应用包括二项回归模型（如逻辑回归）和高斯混合模型，通过潜在变量简化计算。基于扩展空间的抽样策略（如吉布斯抽样）在参数空间交替抽样θ和z，再边际化z得到θ的后验样本。此外，数据增强还可用于边际似然估计，通过蒙特卡洛抽样近似积分，解决模型比较中的计算难题。这一方法显著提升了贝叶斯推断的效率和可行性。

2025-08-28 21:10:06 1225 2

原创【分布式贝叶斯推断】基于Consensus Monte Carlo(共识蒙特卡洛)与“product-of-experts”的后验分解方法

本文探讨了分布式贝叶斯推断中的专家乘积融合方法及其在模型选择中的局限性。文章首先介绍了分布式推断的基本框架，将数据划分为多个分片由不同节点并行处理。重点阐述了专家乘积融合策略，通过将全局后验分布表示为各节点子后验分布的乘积，实现高效分布式计算。该方法允许将先验信息合理分配到各节点，保证分布式计算与全局推断的一致性。然而，文章指出该方法无法直接应用于模型选择场景，因为边际似然在分布式环境下不具备可分解性。最后，文章分析了归一化子先验和子后验证据的计算方法，揭示了分布式贝叶斯推断在模型选择问题中面临的挑战。

2025-08-28 16:54:42 1237 2

原创 GPU并行计算快速入门(一)------原理篇

GPU并行计算原理与应用摘要本文介绍了GPU并行计算的原理及CUDA编程模型。相比CPU基于低延迟设计，GPU采用吞吐量优化架构，拥有数千计算核心，擅长处理大规模并行任务。GPU将更多晶体管用于计算单元而非缓存，通过高并行性实现计算密集型应用加速。文章对比了CPU与GPU的架构差异，指出适合GPU运算的程序特征：计算密集、易于并行。CUDA编程模型采用网格(Grid)-块(Block)-线程(Thread)的层次结构，通过kernel函数在GPU上并行执行。编程步骤包括内存分配、数据传输、kernel执行

2025-08-27 16:47:59 1880 1

原创幂后验分布解决边际似然问题（含GPU并行计算代码）

本文探讨了边际似然值的计算方法及其在贝叶斯模型选择中的应用。边际似然值通过积分似然与先验的乘积得到，贝叶斯因子则通过比较不同模型的边际似然值实现模型选择。针对高维积分计算难题，文章提出幂后验分布方法，通过引入温度参数β构建从先验到后验的平滑路径，利用MCMC在不同温度下采样并整合结果。具体步骤包括：(1)设置温度点分布；(2)各温度点独立MCMC采样；(3)通过热力学积分公式整合对数似然期望值。该方法通过GPU并行化提升计算效率，为复杂模型选择提供可行方案。

2025-08-25 18:02:31 1061 1

m0_59012280的博客