- 博客(208)
- 资源 (7)
- 收藏
- 关注
原创 一行指令运行DPO
通过trl官网可知,我们只需要一行指令,便可调用trl库执行一个DPO训练的任务。但是咱还是得亲自试一下才安心,不是吗?顺便看看有没有什么坑。
2025-04-03 16:18:51
4
原创 探索AI编程规范化的利器:Awesome Cursor Rules
在AI辅助编程逐渐成为开发者标配的今天,如何让AI生成的代码既符合项目规范又保持高质量,成为开发者面临的新挑战。GitHub仓库****正是为解决这一问题而生的开源项目,它通过系统化的规则模板库,重新定义了AI编程的规范边界。本文将深入解析这一工具的核心价值与实践意义。
2025-04-03 09:00:00
10
1
原创 探索 Dockge:一款强大的 Docker Compose 堆栈管理器
Dockge 是一个基于 Web 的应用程序,旨在帮助用户轻松管理文件。它提供了一个直观的用户界面,允许用户创建、编辑、启动、停止、重启和删除 Docker 堆栈,同时还支持更新 Docker 镜像。此外,Dockge 还具有交互式编辑器、Web 终端、多代理支持等特性,使得 Docker 堆栈的管理变得更加高效和便捷。Dockge 是一款功能强大、易于使用的 Docker Compose 堆栈管理器,它提供了丰富的功能和良好的用户体验,能够帮助开发者和运维人员更高效地管理 Docker 堆栈。
2025-04-02 10:49:30
498
原创 MCP Server全能工具箱
是 GitHub 上最热门的开源项目之一,专注于协议的服务器实现,为开发者提供了超过 100 种开箱即用的工具模块,覆盖浏览器自动化、金融分析、数据库交互、知识管理、云服务等数十个领域。自 OpenAI 宣布其 Agent SDK 支持 MCP 后,该项目迅速成为智能体开发领域的标杆工具库,目前星标数已突破 20,000,并持续高频迭代。通过模块化设计和高扩展性,成为连接 AI 能力与实际业务场景的桥梁。无论是快速验证原型还是构建生产级应用,开发者均可通过其丰富的工具库显著提升效率。
2025-04-02 10:12:44
183
原创 trl sft命令行工具参数的详细解析及配置建议
TRL(Transformer Reinforcement Learning)是Hugging Face开发的全栈式语言模型微调框架,支持监督微调(SFT)、直接偏好优化(DPO)等任务。其命令行工具(CLI)允许用户无需编写代码即可完成模型训练,适用于大规模模型(如Llama 3)的量化微调。Tips: 1. 正如之前文章里所说的,windows无法直接运行trl。2. 无法连接huggingface的话,可以通过设置镜像来解决。以上配置可根据具体任务和硬件条件灵活调整,建议通过小规模实验(如。
2025-04-01 18:55:46
43
原创 Crawl4AI:专为AI设计的开源网页爬虫工具,释放大语言模型的潜能
Crawl4AI通过工程化思维重构了传统爬虫的工作流,其价值不仅体现在技术参数的提升,更在于打通了从原始网页到AI就绪数据的端到端链路。对于需要处理海量网络数据的AI团队,这个工具值得放入技术栈的首选项。开发者可通过官方GitHub仓库获取最新代码,参与社区建设。
2025-04-01 16:07:57
550
原创 trl刨根问题:facebook/opt-125m是什么?imdb数据集又是什么?用imdb数据集微调facebook/opt-125m后会是什么效果?
现在问题来了,这行代码打完以后,tlr到底都干了什么?facebook/opt-125m是什么?imdb数据集又是什么?
2025-04-01 07:01:39
52
原创 mcp界的helloworld,mcp-server-time,在windows上使用会报错:‘No time zone found with key 中国标准时间‘
按照下面的方式添加mcp server,直接指定好咱的时区(“Asia/Shanghai”)即可。github上提供了很多种安装方式,我这里选择的是我比较熟悉的python的安装方式。今天在cline上浏览使用最多的mcp server,发现这个两万星的Time。这个好啊~有了这个MCP server,我的大模型就知道时间了。只需3分钱,就可以让AI告诉你当前时间,你就说是不是很实惠吧。这时,直接往cline配置,也会出现类似的错。这个没问题,顺利通过。事实上,也确实可以哈。
2025-03-31 19:04:23
26
原创 Stable Diffusion WebUI:AI绘画的全民化工具
Stable Diffusion WebUI将复杂的AI模型封装为易用的工具,推动了创意表达的民主化。无论是艺术家、开发者还是普通爱好者,都能通过它探索无限可能。随着技术的迭代和社区的壮大,AI绘画的边界正被不断拓展,而这一切,或许只需从一次双击开始。参考资料Stable Diffusion WebUI GitHub仓库。
2025-03-31 10:12:58
201
原创 使用扣子(coze)打造免费数字人智能体,并自动发布微信小程序,保姆级,喂饭级教程。(请注意,免费,但效果有限)3、上线微信小程序
哇塞,支持的功能真多,咱回头都试试。微信小程序还在审核~~右上角有一个发布按钮。扣子商店可以了,哈哈。
2025-03-31 08:00:00
27
原创 使用扣子(coze)打造免费数字人智能体,并自动发布微信小程序,保姆级,喂饭级教程。(请注意,免费,但效果有限)2、王天,你不要再abaaba了
(我发现了,AI智能体,要想真实,就得整一些现实中有的地名~))咱们的王天,现在啊,只会abaaba,根本听不懂啊。再回到用户界面,再和王天聊天,这咋这么瘆人呢~~对话流需要增加一个节点👆,并按如图所示进行配置。(⊙﹏⊙)额~天儿这记性可不咋地啊,该说不说。这个提示词,就是之前风靡全网的prompt。最大30轮,咱的天儿,必须给到最好的!我这是觉都睡不好,赶紧继续更新吧~还知道沙河小区,这个不错,得加分~咱也用上deepseek-R1。但这玩意儿,真的挺简单的。牛皮,原谅你了,天儿~不怕,咱再去设置一下。
2025-03-30 07:57:18
246
原创 使用扣子(coze)打造免费数字人智能体,并自动发布微信小程序,保姆级,喂饭级教程。(请注意,免费,但效果有限)1、给大家介绍一位新朋友:王天
我们选这个大模型的快快,就会进入对它的设置。然后,按照图上的方式,将开始节点的user_input设置为这个大模型组件的输入。不过没关系,我会把每一步,点那个地方,都说得一清二楚。👆哇塞,现在的科技还是发达哈,几分钟,可以做出来这个东西。这里还有个实例工作流,咱也可以把鼠标放上去,学学他是怎么做的。哈哈,不知道有没有人,会喜欢咱的王天同学啊,哈哈~~(大模型模块上,之前那个表示报警的黄字,也消失了。回到用户界面,这里的工作流,已经可以选择王天了。咱的王天哥哥,现在只会abaaba,哈哈。
2025-03-30 07:20:10
93
原创 如何让AI套用现有ppt模板,并通过改文字批量生成新的ppt?【翻车版】
但它可以像模像样地做完这个工作,而且不报错,我已经很震惊了。我们新建一个文件夹,并且把模板ppt放进去。打开vscode,定位到这个文件夹。👆我这边生成的效果是这样的。等着吧,应该是可以完成的。—我是完成任务的分割线—👆是不是还挺好看的。
2025-03-28 13:07:13
386
原创 探索生成式 AI Agent 的宝藏库:NirDiamant/GenAI_Agents 项目
NirDiamant/GenAI_Agents 项目不仅是一个技术资源库,更是一个推动 AI 智能体创新的社区平台。其丰富的案例与模块化设计,为开发者提供了从理论到实践的全链路支持,是探索生成式 AI 前沿应用的绝佳起点。如需查看完整案例列表与代码实现,可访问项目 GitHub 页面。
2025-03-28 08:00:00
33
原创 利用Claude desktop配置MCP server(第一课)
MCP在前面已经做了不少介绍,这里不在赘述。下面直接开始,利用Claude desktop来部署一个MCP server。
2025-03-27 17:58:48
432
原创 微软生成式AI免费入门课程:从零构建AI应用的全栈指南
自2023年发布以来,该项目已在GitHub收获超75.9k星标,成为最受欢迎的AI入门资源之一。微软通过此举降低了AI技术门槛,推动更多人参与“AI民主化”进程。无论是学生、开发者还是企业,都能从中找到适合自己的学习路径。为初学者提供了系统学习与实战的机会。该课程不仅覆盖核心概念,还通过实战课程,手把手教你构建文本生成、聊天机器人、图像生成等应用,甚至涉及低代码开发与用户体验设计。在生成式AI技术席卷全球的今天,微软推出的开源课程。立即行动,开启你的生成式AI之旅!
2025-03-27 08:00:00
48
原创 Nodemation(n8n)+MCP系列:1、什么是n8n以及Windows系统下的安装指南
n8n是一款开源的工作流自动化平台,专注于通过无代码/低代码方式实现业务流程自动化。其核心设计理念是将复杂的任务集成和流程构建简化为可视化操作,主要服务于企业、开发者及技术团队,覆盖数据同步、API集成、AI代理构建等多种场景。
2025-03-26 14:49:35
336
原创 自建隐私优先的元搜索引擎:SearXNG 部署全指南
SearXNG是一款开源的元搜索引擎,通过聚合 Google、Bing、DuckDuckGo 等 70 多个搜索引擎的结果,为用户提供无广告、无追踪的搜索体验。隐私保护:不记录用户 IP、搜索记录或使用 Cookie。多格式输出:支持 HTML 和 JSON 格式,便于与其他工具集成。高度可定制:可自定义搜索引擎源、界面主题及代理配置。编辑中的engines部分,添加目标引擎的 API 配置,并重启服务生效。SearXNG 为注重隐私的用户提供了理想的搜索解决方案。
2025-03-26 08:00:00
176
原创 OpenBB:开源金融数据分析的强大之选
OpenBB 凭借其开源、免费、功能强大等优势,正在改变金融数据分析的方式。它为金融从业者和开发者提供了一个高效、灵活的平台,让他们能够更加便捷地获取和分析金融数据。未来,随着社区的不断发展和功能的持续完善,OpenBB 有望在金融科技领域发挥更加重要的作用。如果您对 OpenBB 感兴趣,不妨访问其官方网站(openbb.co)或 GitHub 仓库(github.com/OpenBB-finance/OpenBB),了解更多详细信息并开始使用吧!
2025-03-25 08:00:00
191
原创 我是最后一个知道word文档(docx)是可以被解压的吗?(python-docx学习记录)
今天在学习python-docx的时候,发现有个人直接说出了python-docx的工作原理,就感觉很酷炫。这也就能理解,python-docx的一些操作,实际就是在操作这些个xml文件了。我赶紧找了个docx文档试了一下,果然是可以的。竟然还有这种事啊,真是太强了。
2025-03-25 06:24:00
27
原创 trl这个python库是干嘛的?如何让我这个0基础的人快速掌握之?
trl(Transformer Reinforcement Learning)是一个由Hugging Face开发的全栈Python库,专门用于通过强化学习(RL)微调和对齐大型语言模型(LLM)和扩散模型。它整合了监督微调(SFT)、奖励建模(RM)、近端策略优化(PPO)和直接偏好优化(DPO)等核心方法,旨在帮助开发者和研究者高效优化模型行为,使其更符合人类偏好或特定任务需求。可见,TRL虽然从名字上看,是针对强化学习的,但人家也支持监督微调(SFT)强化学习优化(PPO/DPO)
2025-03-24 19:14:53
70
原创 都来学,给AI Agent初学者的10节课
是一个旨在帮助初学者学习构建 AI 代理的课程仓库。该仓库提供了 10 节课程,全面覆盖了构建 AI 代理所需的基础知识。
2025-03-24 16:25:41
501
原创 OCRmyPDF —— 让扫描PDF可搜索的开源神器
OCRmyPDF凭借其高效、稳定和多语言支持的特性,成为处理扫描PDF的首选工具。无论是个人用户还是企业级应用,它都能显著提升文档管理的智能化水平。通过开源社区的持续贡献,OCRmyPDF的功能和兼容性仍在不断进化,未来有望支持更多OCR引擎和文件格式。参考资料OCRmyPDF GitHub仓库官方文档。
2025-03-24 16:16:23
731
原创 (含import)两行代码,将ppt的每一页幻灯片保存为图片。(如果你没装office,只装了WPS也可以,只不过更麻烦一些)
你可以认为后者是WPS,前者是office。你那儿得视具体情况而定。
2025-03-23 07:57:49
204
原创 如果我没安装office,只安装了wps,python 如何通过win32com.client.Dispatch操作ppt?
Windows COM(Component Object Model)组件是一种由微软开发的软件架构,它允许不同的软件组件在Windows操作系统中相互交互和通信。COM是一种二进制标准,这意味着它定义了组件之间如何在低级层面进行接口,这使得组件的实现与其接口分离,从而支持跨语言和跨进程的代码重用。开发与使用: 开发者可以通过实现COM接口来创建新的组件,而应用程序开发者则可以通过COM接口调用这些组件提供的服务。
2025-03-22 23:44:50
313
原创 Umi-OCR 实践教程:离线、免费、高效的图像文字识别工具
Umi-OCR 是一款开源、免费且支持离线运行的 OCR(光学字符识别)工具,适用于 Windows 和 Linux 系统。它基于深度学习技术,能够高效提取图像中的文字,支持多语言识别、批量处理、截屏识别等功能,尤其适合对隐私敏感或网络受限的场景。核心亮点离线运行:无需联网,保护隐私。多引擎支持:提供 Paddle(高性能)和 Rapid(低配兼容)两种引擎。批量处理:支持图片、PDF、电子书等多格式批量识别。跨平台:兼容 Windows 和 Linux(需 Docker 或源码部署)。
2025-03-21 21:12:30
231
原创 【补档】MCP开篇词:我心目中的MCP(Model Context Protocol,模型上下文协议)
如果你对这个话题感兴趣,请订阅合集专栏,然后浏览MCP子专栏。这样你既可以看到其它非MCP专栏的内容,也能针对MCP子专栏的内容,进行系统性的浏览。
2025-03-21 07:12:24
208
原创 想使用dify实现docx文档的自动生成?试了一圈,感觉还是根据python-docx更靠谱
在软件开发过程中,需求文档、设计文档等材料的编写是每个开发者都绕不开的工作。最近笔者接到一个需要批量生成标准化需求文档的任务,尝试了目前热门的低代码工具Dify后,发现对于稍微复杂格式的文档生成需求(例如文本居中这么简单的需求),最终还是回归到基于python-docx库的解决方案。本文将分享两种技术路线的对比实践。
2025-03-20 23:25:39
211
原创 为了拯救minerU镜像制作过程给大家带来的痛苦,我决定放一个备份到阿里云上
然而,这个minerU的镜像制作过程,确实给人一种不太好的体验。之前,我也从dockerfile的角度入手,通过优化dockerfile,保证我们可以从modelscope下载模型。该软件,界面简洁,使用简单,但不是用的本地算力,而是用的云端算力。如果有一天,你的东西,你找不到了,那很大概率是你的城市设置的不对。现在,我觉得不如直接把我的镜像传到阿里云一份,与大家共享。这里空间名字后的“/”后面,不可以再有别的“/”。后面的是介绍镜像上传的过程,你们就不用看了~~第二步,选这个本地仓库,就可以下一步了。
2025-03-20 23:07:34
796
原创 探索Model Context Protocol:用Python SDK构建智能应用上下文
可连接任意MCP服务器的客户端暴露资源、工具和提示模板的服务器支持标准传输协议(如stdio/SSE)的通信机制# 声明依赖项# 低级别服务器实现return [MCP协议通过标准化的上下文管理接口,为构建智能应用提供了全新范式。服务器开发的核心组件(资源/工具/提示)客户端与服务端的通信机制生产环境部署的最佳实践结合LLM的自动工具调用能力构建多服务器协同的上下文网络开发自定义传输协议扩展通过MCP,开发者能够更专注于业务逻辑实现,让大模型更智能地理解并响应用户需求。
2025-03-19 20:42:30
106
原创 AFFiNE:下一代开源全能知识库工具,重新定义协作与创作
AFFiNE以其开源透明、功能融合与隐私保护,正在重塑数字化协作的边界。无论是个人创作者追求极致效率,还是企业寻求安全可控的知识管理方案,AFFiNE都值得尝试。立即访问官网或GitHub仓库,开启你的全能知识库之旅!
2025-03-19 20:22:24
691
原创 微软Data Formulator:用AI重塑数据可视化的未来
Data Formulator通过“AI+交互”的创新模式,大幅降低了数据可视化门槛。无论是数据分析师、开发者,还是教育工作者,都能借助其强大的自动化能力,将更多精力聚焦于数据洞察本身。项目持续更新(如近期支持多表关联),展现了微软在AI与数据科学领域的深耕。立即体验GitHub仓库:https://github.com/microsoft/data-formulator官方演示视频与博客:见项目README中的链接。
2025-03-19 20:09:46
273
原创 OSWorld:开启多模态智能体的真实计算机环境革命
OSWorld的诞生标志着AI评估从封闭场景向开放世界的重要跨越。它不仅为多模态智能体提供了公平、透明的竞技舞台,更通过标准化环境加速了技术迭代与产业落地。随着平台生态的不断完善,我们有望见证智能体在复杂计算机任务中展现出更接近人类的自主性与创造性,为人工智能的普及应用开辟新路径。
2025-03-18 23:17:25
526
原创 windows下使用vscode+cline插件体验MCP,体验使用AI控制浏览器,踩坑记录(至少让你节省3个小时弯路版)(喂饭级别)
为什么网上天天说MCP,你这儿却一点动静都没有?1️⃣ 人家很早之前就用上了制定标准的Claude desktop,这玩意儿在咱这儿用不了。对策:使用vscode+cline+deepseek(或其它同级别国产大模型deepseek-V3其实有时比R1效果还好)2️⃣ 人家也Claude,但人家能用Cursor,咱太穷了,用不了。对策:使用vscode+cline+deepseek(或其它同级别国产大模型deepseek-V3其实有时比R1效果还好)有人说,我穷到deepseek都用不起怎么办?
2025-03-18 23:12:05
935
原创 探索 Ollama Deep Researcher:本地网络研究助手的新选择
Ollama Deep Researcher 是一个完全本地化的网络研究助手,它可以与任何由Ollama托管的大语言模型(LLM)集成使用。其工作流程十分智能,当你给定一个研究主题后,它会自动生成网络搜索查询,通过Tavily(默认搜索引擎)等渠道收集网络搜索结果,对结果进行总结,反思总结内容以发现知识差距,然后生成新的搜索查询来填补这些差距,经过用户定义的循环次数后,最终为用户提供一个包含所有使用来源的 Markdown 格式的总结报告。
2025-03-17 15:09:43
398
原创 探索Open-Sora:开源视频生成的新里程碑
Open-Sora不仅降低了AI视频生成的门槛,更通过开源社区的力量推动技术迭代。无论是开发者还是创作者,均可通过其GitHub仓库快速上手,探索AI视频的无限可能。
2025-03-17 15:06:26
38
原创 Python中的uv run时,--with参数的作用
在Python生态中,工具链的效率和场景适应性始终是开发者关注的焦点。UV工具链的uv run命令不仅继承了Rust的高性能基因,其--with参数更是将提升到全新维度。本文将深度解析这一核心参数的原理与应用场景。
2025-03-16 20:41:02
171
spring web service 官网示例 基于spring-ws
2014-10-16
安卓socket实现聊天与文件上传
2013-08-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人