- 博客(339)
- 资源 (7)
- 收藏
- 关注
原创 【知识图谱构建系列1】数据集介绍
本文介绍了利用大语言模型(LLMs)实现从文本到知识图谱(Text-to-KG)自动化构建的研究项目LLM4KGC。该项目对比了零样本提示、少样本提示和微调训练三种方法在Llama2、Mistral、Starling等模型上的表现,并采用WebNLG数据集进行评估。有趣的是,WebNLG原本用于将三元组生成自然语言,而本项目则进行逆向任务——从文本中抽取三元组。研究为知识图谱构建提供了可复现的技术路径和评估基准,相关代码已开源。
2025-06-11 22:39:47
75
原创 用Python撬动量化交易:深入探索开源利器vnpy
在金融科技迅猛发展的浪潮中,量化交易的门槛正被开源力量不断降低。诞生于2015年的项目(https://github.com/vnpy/vnpy)正是其中的佼佼者。作为基于Python的开源量化交易平台开发框架,它已成为国内量化领域的重要基础设施。本文将深入解析vn.py的核心价值与技术亮点。
2025-06-11 14:53:11
395
原创 使用 pytdx,`TdxHq_API` 接口下载数据的 AI 编程指引提示词
如果你有特定需求(如获取某只个股的30分钟线、获取多个指数等),请进一步补充细节,我会为你定制更精确的代码模板。(包括但不限于日线、60分钟线等),并支持配置化管理连接参数和灵活的时间范围控制。接口,从通达信服务器获取指定金融品种(如股票、指数)的历史行情数据。你需要根据用户需求,编写或修改 Python 代码,使用。获取创业板指过去 100 天的日线数据。“请根据上述指引,帮我写一个函数,使用。加载配置文件(推荐格式为。
2025-06-10 23:34:21
228
原创 探索 Maybe:开源理财应用的新选择
Maybe 作为一款开源的理财应用,不仅为用户提供了免费管理财务的工具,也为开发者提供了一个参与有意义项目的机会。通过社区的共同努力,相信 Maybe 未来会成为理财领域的一颗新星。如果你对理财或开源项目感兴趣,不妨前往GitHub 仓库一探究竟,加入到这个充满活力的项目中来!
2025-06-10 17:51:52
3
原创 Maxun:开源无代码网页数据提取平台的新选择
在当今数字化时代,数据的价值不言而喻。从网页中提取有价值的数据,对于企业的市场分析、竞品研究,以及个人开发者的项目需求等都至关重要。然而,传统的通过编写代码来进行网页数据提取的方式,不仅需要投入大量时间精力,还要求操作者具备较高的编程技能,这无疑限制了许多人的数据获取能力。今天,我们要介绍的Maxun,作为一款开源的无代码网页数据提取平台,为这一难题提供了新的高效解决方案,它在GitHub上收获了众多关注,目前已有6.1K Star ,足以证明其受欢迎程度与实用价值。
2025-06-10 10:44:15
209
原创 用AI重构会议效率:Zackriya Solutions开源会议纪要神器“Meeting Minutes”
集成OpenAI Whisper实现高精度语音识别,再通过NLP模型自动提炼会议要点,告别手动记录。
2025-06-09 17:20:56
189
原创 MCP(Model Context Protocol)与提示词撰写
随着大模型(LLM)在复杂任务中的普及,如何让模型高效调用外部工具和数据成为关键挑战。传统函数调用(Function Calling)依赖开发者手动封装 API,而通过标准化协议,实现了模型与工具的无缝对接,成为新一代 Agent 开发的核心基础设施。简言之,,类似 USB-C 的通用性,让开发者无需重复造轮子即可连接数据库、本地文件、第三方服务等资源。
2025-06-08 23:49:19
705
原创 gitcode与github加速计划
GitCode 是一个本土化代码托管+技术社区平台,核心价值在于整合代码管理、自动化工具及知识分享,尤其适合国内开发者协作。但其因镜像争议面临伦理性质疑,用户需权衡功能便利性与开源合规性。
2025-06-08 23:42:31
778
原创 【Dify系列教程重置精品版】第十二章:Dify与selenium实操演示
但此时 Dify还是不能直接调用我们的API,当我们在Dify运行时会报timeout之类的错误。因此,为了让Dify能够访问我们的API,我们需要将本地的API服务暴露到公网上。上一章我们介绍了selenium适合做爬虫,那么好了好了,这一章我们来实际演示一下,如何使用selenium爬取数据然后将其与Dify关联起来。其实道理是一样的,我们只需要将这个爬虫当作我们本地的“图片 ”就可以了。将我们的API填写进HTTP请求中:这里的IP地址要填写自己的。这里我们打开的端口是5000。
2025-06-06 23:36:00
57
原创 RedditVideoMakerBot:一键自动化生成Reddit视频的神器
RedditVideoMakerBot代表了自动化内容生成的新范式——它打破了专业视频制作的技术壁垒,将创意表达的能力赋予每一个普通用户。项目成功将复杂工作流封装为简单命令,开发者只需关注内容策略而非技术细节。随着v4.0路线图中AI功能的整合,未来的内容创作将更加智能化。无论你是想建立个人品牌的内容创业者,还是研究传播学的技术爱好者,这个项目都值得加入你的技术栈。立即访问项目GitHub仓库,开启你的自动化内容创作之旅!
2025-06-06 09:00:00
22
原创 nginx.conf配置详解:从(413 Request Entity Too Large)说起
分层配置原则全局配置放在http块外通用配置放在http块内站点特定配置放在server块路径特定配置放在location块文件上传优化要点根据应用需求合理设置适当增加减少磁盘I/O为设置高性能存储(如内存盘)延长和安全加固措施始终启用隐藏版本信息在敏感目录禁用脚本执行配置适当的CSP策略定期更新Nginx到最新安全版本性能监控与调优# 监控Nginx连接状态nginx -T # 查看完整配置nginx -s reload # 平滑重载配置# 监控命令。
2025-06-05 23:21:58
960
原创 深入浅出 Scrapy:打造高效、强大的 Python 网络爬虫
作为 Python 爬虫领域的标杆框架,Scrapy 以其优雅的设计和强大的扩展能力,成为企业级数据采集的首选方案。无论是小型数据抓取任务还是分布式爬虫系统,Scrapy 都能提供专业级解决方案。进入它的世界,你会发现网络数据采集原来可以如此高效而优雅!提示:所有代码示例已在 Scrapy 2.11+ 版本验证通过让数据流动起来,让价值传递下去——Scrapy 正是你需要的利器!
2025-06-05 14:15:37
358
原创 Web开发新手朋友所困惑的“端口”到底是个什么东西?
作为刚入门Web开发的新手,你可能经常在配置服务器、调试API或部署项目时遇到“端口”(Port)这个概念。它看似简单,却是网络通信的基石。没有端口,服务器收到数据后根本不知道“该送给哪个程序”!需绑定固定端口(如3000/8080),三个维度,带你彻底理解端口的意义。→ 纠正:前端请求API时需指定。则自动分配动态端口。
2025-06-04 22:42:09
354
原创 前端使用antd,后端使用fastapi,实现可分页的列表(含完整代码)
本文将详细讲解如何通过 Ant Design(前端)和 FastAPI(后端)实现带分页功能的列表系统。
2025-06-04 22:37:54
563
原创 docker部署redis(需要密码)。docker run --name redis -e REDIS_PASSWORD=‘abc123‘ -d redis:6 为什么不行?
Redis是一款高性能开源内存数据库,支持多种数据结构(字符串、哈希、列表等),可用作缓存、消息队列等场景。通过Docker可快速部署Redis,推荐使用Bitnami镜像支持密码配置(环境变量REDIS_PASSWORD)。Windows用户可通过微软提供的Redis客户端工具连接服务器。Python中通过redis-py库实现数据操作,支持基本键值存储、哈希表、列表等数据结构。生产环境建议开启密码保护并配置持久化存储。Redis凭借其高速读写和丰富功能,成为现代应用开发的重要组件。
2025-06-03 18:55:23
734
原创 探索NautilusTrader:下一代开源算法交易平台的革命性突破
NautilusTrader代表了开源量化平台的重大飞跃,它通过工程创新解决了生产与研究的鸿沟,让交易开发者能够专注于策略逻辑而非基础设施。该项目遵循LGPL-3.0开源协议,欢迎全球开发者通过GitHub参与贡献。对于量化交易从业者和金融科技爱好者,NautilusTrader不仅是一个工具,更是探索算法交易前沿的开放平台。访问项目GitHub仓库(),加注星标关注更新,加入这场量化交易的变革之旅。
2025-06-03 10:45:35
641
原创 docker每次都从头构建太费时间?要么分两步构建(两个dockerfile),要么直接使用docker的分阶段构建特性(一个dockerfile)
最终镜像仅保留运行时所需文件。
2025-05-31 23:32:55
694
原创 解锁技术世界的“秘密知识库”:The Book of Secret Knowledge 深度解析
它像一位经验丰富的导师,将散落各处的技术珍珠串成项链。无论你是深夜救火的运维工程师,还是构建防御体系的安全专家,这个项目都能为你节省大量搜索时间,提供经过验证的解决方案。其真正的价值在于将碎片化的“部落知识”系统化,成为工程师桌面的终极参考手册。✏️ 发现过时内容?提交 PR 助力社区!知识本身不是力量,知识的有效组织与快速检索才是工程师的核心竞争力。这个项目正是这一理念的完美实践。
2025-05-31 09:00:00
258
原创 前端antd,后端fastapi,解决文件上传
前端框架使用antd的Upload组件(支持拖拽/多文件/分片)后端框架利用UploadFile类处理文件流传输协议:HTTP + FormData(兼容性强)antd Upload组件实现用户友好上传FastAPI流处理保障内存安全分片+校验机制支持大文件与安全传输扩展能力:无缝对接云存储、病毒扫描等企业级需求项目示例:完整代码已发布在GitHub仓库扩展建议:后续可集成CDN加速访问上传文件此方案已在生产环境支撑单日10万+文件上传,适用于企业级文件管理系统。
2025-05-30 22:52:59
1526
1
原创 一键部署AI聊天机器人!ChatGPT-on-WeChat让微信秒变智能助手
ChatGPT-on-WeChat代表了** conversational AI 平民化的重要里程碑**。它将曾经需要复杂编程实现的AI对话能力,简化为配置文件中的几行参数设置。项目持续保持更新,2025年4月仍新增了DeepSeek模型支持和腾讯云语音集成。技术不是终点,而是桥梁——当我们能在最常用的微信中与AI自然对话,当企业能用半天时间部署自己的智能客服,当知识工作者拥有随时待命的文档分析助手,人与技术的共生关系才真正进入新阶段。
2025-05-30 11:09:55
227
原创 【Dify系列教程重置精品版】第十一章:Dify与selenium
什么是slenium呢?加单来说:Selenium 是一个自动化操控浏览器的工具,能模拟真人操作网页(点击、输入、翻页等),常用于测试网站或批量抓取网页数据。上一章我们简单介绍了一下RAG,这一章我们讲一下slenium.这三个可以分别试一下,我的电脑阿里云的镜像才下载成功。OK,这章就到这里。第一步:配置slenium。我这里顺利完成配置。
2025-05-29 21:50:58
233
原创 python-pptx去除形状默认的阴影
本文介绍了如何通过Python代码去除PowerPoint中形状的默认阴影效果。核心方法是设置rectangle.shadow.inherit = False,这会创建一个空的效果列表中断样式继承。文章解析了阴影继承机制和底层XML操作原理,指出该方法会同时移除所有视觉效果,并提供了批量处理建议。最后提醒当前API对效果控制较粗,精细调整需直接操作XML结构。
2025-05-29 00:43:31
849
原创 Python生成ppt(python-pptx)N问N答(如何绘制一个没有背景的矩形框;如何绘制一个没有背景的矩形框)
本文介绍了如何使用python-pptx库进行PowerPoint自动化操作。主要内容包括:1) 安装方法;2) 创建空白PPT文件;3) 添加不同布局的幻灯片;4) 插入文本、图片、表格和图表;5) 设置动画和转场效果;6) 批量生成PPT;7) 绘制无背景或无边框矩形。通过代码示例演示了各种常见操作,适用于自动化报告生成等场景。
2025-05-28 17:56:59
490
原创 sglang中那些不得不知道的feature
这些技术都服务于优化大模型在实际应用中的性能和可用性。关注点互补:主要解决输入/上下文处理的效率瓶颈,尤其是长上下文场景。分块优化首Token延迟和计算均衡,基数注意力优化长序列下的核心注意力计算。主要解决输出生成(解码)本身的效率瓶颈,通过草稿模型加速大模型的token生成。主要解决输出内容的格式、可靠性与可用性问题,使模型输出更易于被程序化使用。在实际的推理系统中,这些技术常常被组合使用:一个支持分块预填充和基数注意力的引擎处理长提示。利用推测解码加速大模型自身的token生成速度。
2025-05-28 17:47:06
147
原创 基于递归思想的系统架构图自动化生成实践
本文介绍了一个递归算法实现的Markdown到PPTX架构图自动转换系统。系统通过树形字典数据结构解析Markdown层级,采用深度优先遍历进行动态空间分配。关键技术包括三级弹性布局算法(全宽/等分/双列流式)、知乎视觉规范集成的样式体系,以及基于FastMCP框架的服务封装。系统支持自动化文档生成、动态配置展示等场景,提供调试建议、性能优化方案和错误处理机制,未来可扩展跨平台支持、智能布局等功能。代码已在GitHub开源。
2025-05-27 22:48:56
441
原创 Pathway:重新定义实时数据处理的Python框架
Pathway不仅是一个框架,更是对实时数据处理范式的重新思考。开发者友好优先实时性不可妥协智能自动化运维对于寻求快速构建实时数据应用,又不想陷入复杂基础设施管理的团队,Pathway提供了一个优雅的解决方案。正如项目创始人Jacek Cyranka在访谈中所说:“我们不是在建造更快的马车,而是在设计第一辆汽车。” 现在正是上车体验的最佳时机。项目地址:https://github.com/pathwaycom/pathway在线体验:https://pathway.com/playground。
2025-05-27 17:25:14
167
原创 【Dify系列教程重置精品版】第十章:Dify与RAG
什么是RAG(Retrieval-Augmented Generation),简单来说就是能够让我们的AI实现基于私有知识的问答、推理。相当于给了AI一本书,让它从书中寻找答案。这样做有利有弊,好处就是能够让我们的AI在特定的场合中做出更加完美的回答。但同时也证明,AI对知识库内容的了解并不深入。这里我有点怀疑是不是AI网上搜到的,问了一个小细节。这里我们直接默认设置,保存并处理。上传我们准备好的文本,点击下一步。上一章我们讲了显示本地的图片。这一章我们讲一下RAG。话不多说,我们开始操作。
2025-05-26 22:50:22
267
原创 探索LobeChat:开源、可定制的下一代AI对话客户端
LobeChat通过其模块化架构、企业级特性和活跃的开源生态,为构建下一代AI对话应用提供了坚实基础。无论是个人开发者快速验证想法,还是企业需要可定制的智能对话解决方案,该项目都值得深入探索。立即行动Star项目仓库获取最新动态 ⭐️参与Discord社区讨论 💬提交PR贡献您的插件模块 🛠️让我们共同推动开源AI技术的发展!相关资源官方文档插件开发指南Demo体验地址。
2025-05-26 15:19:31
484
原创 配置文件,xml,json,yaml,我该选哪个?
选型公式需求复杂度 + 团队习惯 + 工具链支持 → 最终选择简单配置:JSON(无注释需求)或 TOML(需注释)。复杂配置:YAML(可读性优先)或 XML(需强验证)。历史项目:沿用现有格式(如 XML 用于 Java),避免重构成本。最终,没有“完美”的格式,只有“适合”的平衡。在灵活性和规范性之间找到折衷,才能最大化开发效率。
2025-05-24 23:39:45
990
原创 pytdx数据获取:在线获取和离线获取(8年前的东西,还能用吗?)
本文介绍了Python库pytdx的使用方法。虽然GitHub上的项目看起来已停止维护,但该库仍可正常使用。文章展示了两种数据获取方式:1) 离线模式需安装客户端,通过配置路径读取本地分钟线数据;2) 在线模式通过API连接服务器获取实时数据。配置文件采用toml格式,包含TDX路径和API连接参数。
2025-05-23 22:55:09
280
原创 sglang是如何运行?
SGLang通过软硬协同优化与全栈设计,实现了从缓存管理、解码加速到多模态支持的全面突破。高效运行时:RadixAttention与推测解码降低计算冗余;灵活前端:DSL支持复杂逻辑与并行控制;硬件适配:量化、并行策略与高性能内核释放GPU潜力。这些特性使其成为当前开源社区中性能领先的LLM推理引擎,适用于高并发、低延迟的工业级场景。
2025-05-23 17:27:24
632
原创 一个你可能永远不会遇到的报错:/docker-entrypoint.sh: 47: exec: .: Permission denied
产生的原因是,在docker run时,不小心在命令最后加了个.为什么会错得这么离谱呢?—— 一个字符的偏差可能引发连锁故障。Docker 的命令行参数覆盖机制对新手不友好,多一个字符可能导致完全不同的行为。若开发环境中存在同名文件或目录(如当前目录下恰好有可执行文件。),错误可能被掩盖;命令包含特定字符),避免低级错误进入生产环境。可能被误解析为路径参数,导致脚本逻辑混乱。build的时候有点,粘过来的时候站错了。末尾附加参数,这些参数会直接替换。指令在运行时可能被覆盖。的第 47 行,提示执行。
2025-05-22 22:44:38
546
原创 【每周一个MCP】:将pytdx封装成MCP
本文介绍了如何使用pytdx库从API或本地读取股票数据,并提供了相关配置文件和代码示例。作者分享了一个有效的API IP和端口来源,并展示了如何通过FastMCP工具将股票数据保存为CSV文件。文章鼓励读者共同努力,逐步完善项目。代码示例包括从TDX API获取股票数据并将其保存为CSV文件的功能。
2025-05-21 23:48:25
324
原创 探索Puter:一个基于Web的轻量级“云操作系统”
Puter以精简的架构实现了“云操作系统”的核心概念,为开发者提供了探索WebOS可能性的实验田。尽管尚未达到生产级成熟度,但其模块化设计和API优先的理念值得关注。对于有兴趣参与开源贡献或希望定制私有云桌面的开发者,Puter无疑是一个值得尝试的项目。延伸思考:未来是否会出现完全基于浏览器的主流操作系统?Puter的实践或许正在为这一愿景铺路。相关资源官方文档Demo体验GitHub Issues讨论。
2025-05-21 17:56:27
843
安卓socket实现聊天与文件上传
2013-08-12
spring web service 官网示例 基于spring-ws
2014-10-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人