- 博客(46)
- 资源 (1)
- 收藏
- 关注
原创 将现有 REST API 转换为 MCP Server工具 -higress
Higress 是一款云原生 API 网关,集成了流量网关、微服务网关、安全网关和 AI 网关的功能。它基于 Istio 和 Envoy 开发,支持使用 Go/Rust/JS 等语言编写 Wasm 插件。提供了数十个通用插件和开箱即用的控制台。Higress AI 网关支持多种 AI 服务提供商,如 OpenAI、DeepSeek、通义千问等,并具备令牌限流、消费者鉴权、WAF 防护、语义缓存等功能。
2025-04-03 21:40:55
924
原创 SSE与Streamable HTTP的区别:协议与技术实现的深度对比
Server-Sent Events(SSE)是一种基于HTTP协议的单向通信协议,它允许服务器以事件流(Event Stream)的形式实时向客户端推送数据,而无需客户端明确请求[0SSE是HTML5规范中定义的一种技术,它为服务器向客户端的实时通信提供了一个简单而高效的方式。SSE基于HTTP协议,目前除了IE/Edge,其他主流浏览器都支持这一技术[1SSE的主要特点是允许服务器主动推送数据,而无需客户端不断轮询服务器。
2025-04-02 13:08:07
887
原创 OpenAI发布的《Addendum to GPT-4o System Card: Native image generation》文件的详尽笔记
Native_Image_Generation_System_Card
2025-03-31 09:21:53
685
原创 AI时代,程序员会被取代吗?
当GPT-4的代码生成能力达到人类平均水平时,全球代码仓库的增长率同比提升320%(来源:GitHub 2023年报)。这不是终结的丧钟,而是新纪元的号角。正如Tim O’Reilly所言:“最好的程序员正在成为AI的导师,而非对手。” 那些懂得将AI转化为认知杠杆的开发者,将在这个时代获得前所未有的创造自由。
2025-03-29 10:17:04
302
原创 AI 代理框架:组件及前五开源解决方案
定义:AI 代理框架是支持智能代理的开发、部署和管理的软件库或平台。这些代理可以自主感知其环境、做出决策并执行任务以实现特定目标,通常由机器学习、深度学习或基于规则的方法提供动力。作用:提供可重用的工具和标准化组件,简化代理及其与环境的交互的创建过程,减少从头开始构建这些能力的需要;处理各种复杂的任务,如代理之间的通信、数据处理、从环境中学习以及根据目标和反馈采取行动,为代理的核心功能提供抽象化。
2025-03-28 17:42:59
745
原创 Midscene.js 简介
Midscene.js 是一个基于 AI 的自动化工具,通过自然语言交互、查询和断言,提供多种集成方式和强大的调试工具。它支持通用 LLM 和开源模型,注重数据隐私,并且完全开源,用户可以自由选择部署方式。
2025-03-22 22:44:52
1053
原创 Sampling – Model Context Protocol Specification
该网页详细介绍了Model Context Protocol (MCP) 中的“Sampling”功能。Sampling允许服务器通过客户端请求语言模型(LLM)生成文本、音频或图像内容,而无需服务器直接使用API密钥访问模型。客户端在模型访问、选择和权限方面保持控制权,同时为服务器提供AI能力。
2025-03-20 22:31:11
799
原创 【browserbase】 实现manus自动回放的方案?
定义:会话回放是 Browserbase 提供的一项强大功能,允许用户逐页回放浏览器会话,以检查执行的操作和网络请求。用途:通过会话回放,用户可以详细地查看和分析浏览器会话中的各种事件、网络请求、DOM 变化等,从而更好地调试和优化自动化脚本、排查问题或进行性能分析。
2025-03-16 09:36:35
659
原创 AI Agent时代 OpenAI 开始追赶,因为 Manus?
概述:这是OpenAI推出的新API原语,用于利用其内置工具构建智能体。它结合了Chat Completions API的简洁性和Assistants API的工具使用能力。随着模型能力的不断发展,Responses API被认为将为构建智能体应用的开发者提供更灵活的基础。通过单一的Responses API调用,开发者能够使用多种工具和模型轮次解决日益复杂的任务。内置工具支持。
2025-03-12 13:38:43
653
原创 MCP AI 时代的语言
MCP(Model Context Protocol,模型上下文协议)是由Anthropic公司于2024年11月推出的开放标准协议,旨在统一大型语言模型(LLM)与外部数据源、工具的交互方式。其核心目标是解决AI模型因数据孤岛限制而无法动态获取实时信息的难题,通过标准化接口让AI像“USB-C接口”一样即插即用地连接文件、数据库、API等服务。例如,用户可通过MCP让Claude直接读取本地网页或发送Slack消息,无需为每个功能单独开发代码。
2025-03-12 09:27:26
581
原创 OpenManus 代码分析
通过这些组件的协作,OpenManus 系统能够接收用户输入,规划任务执行步骤,调用合适的工具完成任务,并将结果返回给用户。系统的模块化设计使其具有良好的扩展性,可以通过添加新的代理、工具和流程来增强其功能。OpenManus 是一个基于 LLM(大型语言模型)的智能代理系统,它采用了模块化的设计,支持工具调用、规划和执行等功能。下面我将通过时序图和流程图来详细分析整个系统的工作流程。当前步骤 < 最大步骤且状态不是FINISHED?调用 LLM 获取响应和工具调用。设置代理状态为 FINISHED。
2025-03-10 21:57:28
1038
原创 metagpt agent 时代的公司
基础模型强大后怎么样呢?来试一下2024年中都时候跑过一次,花了我几十块钱token,最后一个demo 都没成功,放弃了官网的架构图需要使用python 版本 3.12 一下使用,pyenv 安装后记得将加入到path 中准备venv初始化配置文件, 用于配置大模型配置打开配置文件参考配置,我使用的火山提供的api没有注册过的可以用这个链接参与活动。
2025-03-09 10:27:43
281
原创 【AI文章解读】The Model is the Product
模型作为产品的趋势背景:过去几年,关于AI发展的下一个周期有很多猜测,例如智能体(Agents)、推理系统(Reasoners)或真正的多模态(Multimodality)。核心观点:作者认为,当前的研究和市场发展都指向了一个方向——模型本身将成为产品。支持论据通用模型扩展停滞:以GPT-4.5为例,模型容量线性增长,而计算成本呈几何级增长。即使在训练和基础设施效率提升的情况下,OpenAI也无法以合理的价格部署如此庞大的模型。观点化训练效果显著。
2025-03-04 21:13:43
904
原创 Unsloth
Unsloth是一个专注于优化大型语言模型(LLM)训练和微调效率的开源工具,旨在通过算法创新显著降低显存占用、提升训练速度,同时保持模型精度无损。其核心技术包括动态量化、梯度检查点优化、基于 Triton 的高效内核重写,以及与 LoRA/QLoRA 等参数高效微调技术的深度集成。Unsloth 支持主流模型(如 Llama、Mistral、Phi-3),使个人开发者和小团队能在有限硬件资源(如 8GB 显存显卡)上完成大模型微调任务。
2025-02-17 21:57:01
1112
原创 【AI文章解读】《No, DeepSeek Is Not A ‘Sputnik Moment’》
《No, DeepSeek Is Not A ‘Sputnik Moment’》以下是关于这篇文章的详尽笔记:《No, DeepSeek Is Not A ‘Sputnik Moment’》Rashi Shrivastava,Forbes的记者,专注于人工智能和初创企业的报道。2025年1月30日这篇文章深入探讨了DeepSeek引发的市场和技术争议,指出其低成本AI模型虽然在一定程度上引发了行业的关注和讨论,但并非真正的技术突破。同时,文章也揭示了AI行业在资源利用和成本控制方面的潜在问题,并呼吁行业重
2025-02-01 12:57:45
705
原创 【AI文章解读】《The Rise Of Agentic AI: Google Demonstrates Notebook LM》
AI行业的快速发展2025年初,AI行业呈现出快速发展的态势,模型不断迭代,公司纷纷投入大量资金用于硬件和特定用例的开发。这些技术成果也开始逐渐转化为面向消费者的科技产品。文章通过介绍谷歌在AI领域的最新进展,特别是Notebook LM的演示,展示了AI代理技术的强大功能和未来潜力。同时,它也提醒我们在享受技术带来的便利时,要警惕其可能带来的风险和挑战。
2025-02-01 12:56:33
924
原创 又要弯道超车了,DeepSeek复现狂潮:开源的力量与大模型的未来
未来,随着更多团队的加入和改进,DeepSeek的技术有望在更多领域得到应用和推广。DeepSeek的成功不仅在于其技术上的突破,更在于其开源策略,使得全球的研究者和开发者都能够参与到这一技术的复现和改进中来。港科大团队仅用8K样本在7B模型上复刻了DeepSeek-R1-Zero和DeepSeek-R1,模型在复杂数学推理上取得了强劲结果。这表明DeepSeek的技术不仅在工业界引起了关注,也在学术界得到了广泛的认可。该项目提供了完整的训练数据和脚本,使得其他团队能够复现DeepSeek的模型。
2025-01-27 12:34:38
1443
原创 DeepSeek R1:AI领域的新突破与挑战
DeepSeek R1是DeepSeek公司推出的第一代推理模型,该模型在数学、代码和推理任务中实现了与OpenAI的o1模型相当的性能。为了进一步提升模型性能,DeepSeek还推出了实验性版本DeepSeek-R1-Zero,该版本完全通过强化学习训练,无需监督微调,展现了强大的推理能力。DeepSeek R1模型通过强化学习策略展现了强大的推理能力,为AI领域带来了新的突破。然而,该模型仍存在一些挑战和局限,需要后续的训练和优化来解决。
2025-01-26 22:40:46
889
原创 200刀一个月的贾维斯 ChatGPT Operator ,AI开始行动了!!!
ChatGPT Operator 是 OpenAI 在自然语言处理和任务自动化领域的最新探索。它通过自然语言交互实现任务的自动化,极大地提高了效率和用户体验。随着技术的不断进步,ChatGPT Operator 有望在更多领域发挥重要作用,推动 AI 的广泛应用。
2025-01-24 14:32:07
779
原创 Linguflex
Linguflex是一个开源项目,旨在通过语音交互实现类似科幻电影中Jarvis(《钢铁侠》中的智能助手)那样的人工智能体验。它允许用户通过语音与自定义角色进行对话,并具备多种实用功能,如智能家居控制、播放音乐、搜索互联网、获取电子邮件、显示天气信息和新闻等。Linguflex的安装过程可能较为复杂,因为项目依赖于多种Python库、操作系统版本、CUDA和CuDNN版本。项目的核心目标是模拟真实的人类互动,同时提供高效的语音交互体验。
2025-01-20 11:10:16
357
原创 Text-SQL-Chat2DB
安装后,打开Chat2DB,点击“连接”按钮,选“新建链接”,根据要连接的数据库类型(如MySQL、Oracle等),填写数据库地址、端口、用户名、密码等信息,测试连接成功后,点击“连接”完成数据库连接。他在数据库技术优化、多数据库支持的实现等方面贡献突出,解决了诸多技术难题,为Chat2DB能够高效连接多种类型数据库,如MySQL、Oracle、PostgreSQL等提供了技术保障,提升了产品的实用性和通用性。或在数据分析项目中,利用Chat2DB连接数据仓库,分析用户行为数据,挖掘潜在规律。
2025-01-18 08:57:02
1262
原创 Text2SQL-Vanna研究
Vanna是一个开源的Python RAG(检索增强生成)框架,主要作用是帮助用户基于大型语言模型(LLMs),为其数据库生成精确的SQL查询。它通过在用户数据上训练RAG模型,然后依据用户提问生成可在数据库上执行的SQL查询,整个过程分为训练和提问两个简单步骤。同时,Vanna支持多种LLMs、向量数据库和SQL数据库,既能保证查询的高准确性,又能确保数据库内容的安全私密,还支持用户自定义前端界面,并通过用户反馈进行自我学习以提升查询准确性。
2025-01-17 23:58:34
1509
1
原创 Project DIGITS for home researchers
产品定位:面向研究人员、数据科学家和学生,用于在家中实验 AI 模型,如类似 ChatGPT 的聊天机器人和图像生成器。发布信息:于2025年1月9日的 CES 展会上发布,计划于5月上市。价格:基础版售价3000美元,完全配置满的设备价格可能会更高。
2025-01-11 08:12:27
545
原创 【器之orbstack】docker desktop&Colima增强优化平替
在 Apple Silicon 上,OrbStack 使用 Rosetta 来运行具有 Intel (x86_64/amd64) 二进制文件的 Linux 机器。这比使用 QEMU 或 UTM 进行仿真要快得多,可以无缝地提供接近本机的性能。安装后,OrbStack 将自动迁移您的 Docker Desktop 数据,包括容器、卷、图像等。您可以使用 Docker 上下文并行运行 OrbStack 和 Docker Desktop。
2024-12-28 17:05:39
756
原创 【Cursor】介绍
Cursor是一个集成了先进大型语言模型(LLM)如GPT-4、Claude 3.5的代码编辑器,可以理解为在VSCode中集成了AI辅助编程助手。它通过自然语言理解和代码生成技术,帮助开发者更高效地编写和理解代码。CursorCursor是一款集成了AI技术的代码编辑器,继承了VS Code的强大功能,并融入了AI功能,简化了开发流程。最新推出的Composer Agent功能,使得Cursor具有完整的项目理解/编辑能力,进一步提升了开发效率。
2024-12-24 22:36:18
3672
原创 【Hugging Face】介绍
Hugging Face是一个人工智能平台,专注于提供开源的自然语言处理(NLP)工具和资源,包括预训练模型、数据集和开发工具,旨在降低AI技术的准入门槛,促进知识共享和技术进步。
2024-12-24 22:22:06
1121
原创 机器学习模型性能排行榜
这些排行榜提供了不同的角度来比较和评估大模型的性能。LMSYS Chatbot Arena提供了一个国际性的竞技平台,而AGICTO和DataLearner则提供了更详细的评测数据和对比分析。中文大模型能力评测榜单则专注于中文大模型的性能评测。每个排行榜都有其独特的价值和参考意义,用户可以根据自己的需求选择合适的排行榜进行参考。
2024-12-07 19:10:43
435
原创 “强化微调”介绍
强化微调是一种先进的模型定制技术,它结合了强化学习的原理,通过使用数十到数千个高质量任务来定制模型,并根据提供的参考答案来评估模型的响应,从而提高模型在特定任务和领域上的准确性。
2024-12-07 10:35:17
893
原创 Svelte
Svelte 是一种新兴的前端框架,它通过在编译阶段将组件代码转换成高效的 JavaScript 代码,避免了运行时的虚拟 DOM 计算,从而提供更高的性能表现。Svelte 的设计哲学是减少框架运行时的代码量,使得最终的应用程序更加轻量和快速。
2024-12-06 23:08:04
887
原创 docker: Error response from daemon: Get “https://registry-1.docker.io/v2/
要设置 Docker 使用国内镜像源,你可以通过修改 Docker 的配置文件来实现。
2024-10-19 16:39:28
2732
4
原创 逆波兰表达式的思考与JAVA实现
最近在研究一个配置解析相关功能, 解析是针对一些规则进行, 考虑到规则的多样性,准备采用逆波兰表达式来进行拆解,然后再单独进行原子化处理。上面说的规则其实就是一个公式,公式可以分为两部分:运算量运算符运算量比较号理解, 就是A+B+C公式里的ABC,运算符相对复杂一些,对于数学四则运算来说就是+、-、*、/ ,其实如果拓展一下, 运算符可以是现有的逻辑运算符号比如:&、|、!、^ 等,也可以自定义一个特殊含义的运算符,比如说 = 代表两边都需要成立,>代表左边成立,右边也需要成立,
2021-08-03 09:41:37
232
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人