- 博客(138)
- 资源 (21)
- 收藏
- 关注
原创 Codex配置问题解析:wire_api格式不匹配导致的“Reconnecting...”循环
Codex连接问题常由wire_api格式不匹配引起。官方推荐的"responses"格式正逐步取代被弃用的"chat"格式,后者会导致持续重连或401错误。选择遵循标准的平台(如AIOAGI)可避免兼容性问题。开发者应明确配置wire_api="responses",并迁移现有项目。标准化格式将降低维护成本,提升工具可靠性,确保与未来AI生态兼容。技术决策应着眼长期价值,选择官方标准才能获得稳定高效的开发体验。
2026-01-09 23:28:12
775
原创 更快、更强、更实惠:谷歌正式发布Gemini 3 Flash,开启AI新纪元
谷歌正式宣布推出Gemini 3 Flash,这是继Gemini 3 Pro和Deep Think模式后,Gemini 3模型家族的又一力作。基于Gemini 3 Pro的推理能力,它能更精准地解析问题的细微差别,结合实时本地信息和网络链接,为你提供深思熟虑、视觉直观的全面回答。在SWE-bench Verified(评估代码智能体能力的基准)上,它取得了78%的分数,不仅超越了2.5系列,甚至超过了Gemini 3 Pro。Gemini 3 Flash的发布,证明了速度和规模未必需要以牺牲智能为代价。
2026-01-08 16:15:54
635
原创 2026年人工智能领域CCF推荐B类期刊全攻略:带你了解人工智能领域CCF推荐B类期刊NC、NN、PR、TACL
Neural Computation、Neural Networks、Pattern Recognition (PR)、Transactions of the Association for Computational Linguistics (TACL),这些期刊以严格的审稿流程和扎实的学术影响力著称,是人工智能相关领域学者展示重要研究成果的高水平平台。期刊特别欢迎能够显著推动计算语言学领域发展的原创性、已完成的研究工作,要求论文展示深入的分析和严谨的实验,对学术界和工业界具有重要参考价值。
2026-01-08 16:11:13
1039
原创 2026年,你的“AI同事”已上线!
2025年AI编码代理已从辅助工具进化为"研发搭档",能独立完成功能模块开发,但实际使用中常出现代码错误、上下文丢失等问题。关键在于正确使用:AI编码代理是由监督模型统筹的多工具智能体系统,而非简单补全工具。它在修复Bug、实现清晰需求等场景效率显著,但需警惕上下文限制、安全风险等陷阱。最佳实践包括编写AGENTS.md规范、提供详细指令、建立团队AI工作流。经验越少的开发者受益越明显,AI正成为需要"带教"的初级工程师伙伴。
2026-01-06 20:01:22
696
原创 Claude Code 编程宝典!从入门到实战带你玩转Claude编程!第1期
本文重点介绍了AI编程工具ClaudeCode的两大核心功能模块。入门实操部分包含IDE插件整合、高频指令速查表、CLAUDE.md配置管理、图片解析和自动化模式等实用技巧。会话管控模块则详细讲解了上下文清理、快捷键操作、中断恢复、会话压缩以及自定义命令设置等提升效率的方法。通过系统掌握这些功能,开发者可显著提升编程效率,实现自动化工作流管理。文章后续还将深入探讨提示优化、实战应用等进阶内容。
2025-12-30 18:18:44
671
原创 CEO亲自宣传!全新ChatGPT Images!
新的ChatGPT Images来了全新版本的的ChatGPT Images,是OpenAI迄今为止最强大的图像生成工具,由新旗舰模型GPT Image 1.5驱动
2025-12-25 11:31:23
566
原创 OpenAI 正式发布 GPT-5.2-Codex:最强智能体编码模型,曾协助挖掘 React 严重漏洞
OpenAI 发布 GPT-5.2-Codex!智能体编码新纪元
2025-12-25 10:57:50
651
原创 在Linux上使用Claude Code 并使用本地VS Code SSH远程访问的完整指南
本文提供了一份详细的Linux系统下安装和使用ClaudeCode的指南,包含两个核心部分:1)在Linux服务器端完成ClaudeCode的安装配置,包括Node.js、Git等依赖工具的安装,API密钥获取及环境变量设置;2)通过VSCode的SSH远程连接功能实现本地开发环境与服务器端ClaudeCode的集成,详细说明了插件安装和配置文件修改方法。教程采用分步骤说明方式,配有具体命令和注意事项,帮助开发者快速搭建AI编程辅助环境,提升开发效率。
2025-12-22 15:05:18
1925
1
原创 声形意合,令出智随!Qwen3-Omni-Flash!阿里团队发布多模态大模型!
阿里发布Qwen3-Omni-Flash全模态大模型,支持视频、语音、文本多模态实时交互。该模型在数学推理、音频理解、语音生成等方面表现突出,在多项基准测试中超越GPT-4o和Gemini。支持119种文本语言和19种语音识别语言,具备拟人化语音合成能力。适用于虚拟助手、视频分析等场景,通过阿里云平台提供实时视频分析、语音对话等功能,向AGI通用智能迈进一步。
2025-12-18 13:11:28
383
原创 GLM-TTS 发布:3 秒音色复刻 + 工业级语音合成,模型权重已开源
工业级语音合成系统 GLM-TTS 正式发布,并已开放模型权重。它用约 10 万小时数据训练,实现了“3 秒”音色复刻与更强的文本理解能力,并在多个开源测试集上把字错误率与情感表达做到了开源SOTA
2025-12-16 14:52:00
1110
原创 GPT-5.2正式发布!70.9%的专业工作,它做得比专家还好
本次发布中第二重要的基准测试是 SWE-Bench Pro,这是一项难度较高的软件工程评估测试,GPT-5.2 在该测试中获得了 55.6% 的分数。它点击进入单个房源,提取结构化字段,选择社区和价格区间(我本可以自己设置这些筛选条件,但我实际上并没有搬家的打算),然后生成了一份简短的、排名靠前的候选名单。如果一个模型能够记住一篇90页文章深处隐藏的某个转瞬即逝的晚餐食谱,那么它就能追踪代码库中的变量、合同中的法律条款,或者200页报告中的财务细节。数独本身并不算复杂的数学,因为它受到一定的限制。
2025-12-16 11:29:40
954
原创 GLM-4.6V开源:从看懂到完成
智谱AI开源GLM-4.6V多模态大模型,实现从"理解图片"到"完成任务"的突破。该系列包含高性能云端版(106B-A12B)和轻量本地版(9B),具备128k超长上下文处理能力和SOTA视觉精度。其核心创新在于原生多模态工具调用和视觉-行动闭环,支持直接处理图像并生成可执行行动,适用于图文创作、电商导购、前端开发等场景。模型已全面开源,提供本地部署、云端API等多种接入方式,价格优势明显。这一突破将推动国产AI生态发展,降低多模态技术应用门槛。
2025-12-11 16:11:40
1006
原创 6B参数“小巨人”如何撼动生图格局?阿里开源Z-Image实测,效果直逼SOTA
阿里开源6B参数图像生成模型Z-Image,在消费级显卡上实现2-3秒快速出图,生成质量媲美主流大模型。该模型通过数据、架构等系统性优化,在细节刻画、光影表现等方面表现突出,支持本地部署和商用。Z-Image的出现标志着"专家模型"时代的到来,未来AI生态可能由众多专注领域的小模型协同构成,通用大模型则扮演智能调度中枢角色。这种轻量化、专业化的发展路径,或将推动AI向更实用、高效的方向演进。
2025-12-08 13:25:32
1225
原创 2025年人工智能领域CCF推荐A类国际会议全攻略:带你了解人工智能领域国际顶级会议全貌
2025年人工智能领域CCF推荐A类国际会议概览:本文详细介绍了7个AI领域顶级国际会议的最新信息。AAAI(录用率17.6%)、CVPR(22.1%)、ICCV(24%)、ICML(26.9%)、NeurIPS(24.52%)、ACL(20.3%)和IJCAI(19.3%)等会议投稿量持续攀升,竞争日趋激烈。各会议均采用双盲评审,注重创新性和严谨性,投稿需特别注意格式规范和匿名要求。这些会议在学术界和工业界具有高度认可度,发表论文对职业发展有显著加成。文章还提供了各会议的具体时间地点、投稿截止日期及官网链
2025-12-08 12:54:55
1947
原创 Claude Code 子代理上线:一人公司,全员AI专家!
Claude Code 推出 Sub Agents 子代理功能,让你告别单一AI助手,组建专属“AI专家团队”。每个子代理专注特定领域(如前端、后端、测试),拥有独立上下文与定制提示词,避免信息过载,提升开发效率。支持自动委派或显式调用,可跨项目复用并共享协作。从代码生成到架构设计,一人即可驱动全员AI的高效开发流程——真正实现“一人公司,全员AI专家”!
2025-12-05 21:28:16
1190
原创 DeepSeek-V3.2 正式发布:开源模型也能“边想边用工具”!
这一次,不仅推理能力逼近 GPT-5 和 Gemini-3.0-Pro,更首次实现了 “思考 + 工具调用”的深度融合,让开源模型真正具备了实用级 Agent 能力。在多个权威推理评测(如 AIME、HMMT、LiveCodeBench)中,V3.2 的表现与 GPT-5 相当,仅略逊于 Gemini-3.0-Pro。在主流 Agent 评测(如 Tool-Decathlon、MCP-Mark)中,V3.2 大幅领先其他开源模型,甚至缩小了与闭源顶尖模型的差距。
2025-12-02 22:36:30
752
原创 和Gemini 3强强联手?谷歌Nano Banana Pro爆火!
谷歌Nano Banana Pro震撼来袭 ,和最强模型Gemini 3合作一同创造整个世界!
2025-12-01 22:26:53
572
原创 Anthropic 再放大招:Claude Opus 4.5 如何定义下一代 AI 智能体?
Claude Opus 4.5 是 Anthropic 推出的最新大型语言模型,作为 Opus 4 的继任者,它是 Anthropic 当前最强大的模型,专为编码、复杂推理和长时间任务而优化。根据 Anthropic 的数据,在中等开发难度下,Opus 4.5 的 SWE-bench 得分与 Sonnet 4.5 持平,但输出令牌数量却减少了 76%。Opus 4.5 明白我的问题存在循环论证——我用 Y 定义 X,反之亦然,因此,鉴于我们目前掌握的数据,我们无法对回归线的斜率进行有意义的估计。
2025-11-30 11:57:00
1082
原创 GPT Codex CLI报错:The encrypted content gAAA...lA== could not be verified.
摘要:OpenAI Codex CLI用户在使用中遇到"400 Bad Request"错误,显示加密内容无法验证。该问题通常由ChatGPT认证切换至API密钥认证引起,源于会话数据加密方式不兼容。解决方案包括创建全新会话、正确配置API密钥并放弃恢复旧会话。对于Windows用户,建议尝试WSL或VS Code终端运行Codex。关键点在于接受旧会话无法恢复,通过新建会话并手动重建上下文来解决问题。(149字)
2025-11-30 00:53:23
633
原创 DeepSeek开源IMO金牌模型:AI数学垄断时代终结
DeepSeek开源数学大模型DeepSeekMath-V2在IMO级别问题上实现突破性进展。该模型具备自验证机制,通过"阅卷老师+督导"双重验证系统确保推理严谨性,在IMO2025、CMO2024等竞赛中达到金牌水平,并在Putnam2024获得118/120的超高分数。相比传统AI仅关注答案正确性,DeepSeekMath-V2创新性地采用"诚实奖励机制",要求模型先自评再输出答案。其685B参数规模以较低训练成本(2048块GPU/2个月)实现全面超越GPT-5
2025-11-29 23:49:19
1585
原创 Gemini 3 方案遇瓶颈,百度伐谋出世破局,自我演化 AI 打破工程优化天花板
百度发布全球首个商用自我演化AI"伐谋",突破传统优化瓶颈 百度智能云推出革命性产品"伐谋"(FM Agent),这是全球首个可商用的自我演化超级智能体。该技术融合LLM推理与大规模进化搜索,能通过目标定义自主演化出超越人类认知的最优解,打破了传统AI依赖人类经验的局限。在Kaggle离职预测测试中,伐谋将准确率从0.49提升至0.61;在布雷斯悖论场景中,其创新方案使评分从40分飙升至800分。伐谋采用多智能体并行初始化和"岛屿模型演化"架构,实
2025-11-28 15:25:30
933
原创 解决Claude Code的Error 400 : Extra inputs are not permitted
本文介绍了解决ClaudeCode出现Error400错误的方法。该错误通常由版本过高引起,建议降级至2.0.32版本。具体步骤包括:1)检查当前版本;2)卸载现有版本;3)安装指定旧版本。通过执行npm命令完成版本更换后,即可恢复正常使用。
2025-11-24 01:01:43
884
原创 DeepSeek低调开源LPLB:用线性规划破解MoE训练负载均衡难题
**摘要:**DeepSeek低调开源LPLB项目,这是一个基于线性规划的MoE模型负载均衡器,旨在优化专家并行架构中的动态负载分配问题。LPLB通过动态重排序、构建副本和线性规划求解三个步骤,解决MoE训练中GPU资源利用不均的痛点。该项目目前处于研究阶段,支持多种拓扑结构,但存在求解延迟和非线性计算成本等局限。LPLB的创新在于利用数学工具优化实时分配,为MoE训练加速提供了重要参考。
2025-11-22 11:41:52
316
原创 在Windows上使用Codex并集成到VS Code的完整指南
本文提供Windows系统下Codex CLI安装及VSCode集成完整指南。首先需安装Node.js、Git等必备工具,通过npm安装Codex CLI并配置API密钥和环境变量。接着详细介绍如何将Codex集成到VSCode编辑器:只需安装官方插件即可实现AI编程辅助。全文包含详细的操作步骤和验证方法,帮助开发者快速搭建AI编程环境,提升开发效率。
2025-11-21 22:21:29
8886
原创 Gemini 3还没捂热,GPT-5.1 Pro已悄然反超!OpenAI这波静默突袭太狠
OpenAI发布ChatGPT-5.1Pro,在专业推理和用户体验上实现双重突破。该模型在医疗、编程等专业领域表现出色,GPQADiamond测试达89.4%高分。创新性地引入自适应推理机制,能根据问题复杂度智能调整响应方式,并提供8种个性化对话风格选择。多模态支持扩展至音频和视频输入,实现全方位信息处理。在交互体验上,通过智能记忆和共情回应,使AI助手展现出更高情商,让对话更自然贴心。这些升级使ChatGPT-5.1Pro成为真正"智商与情商并存"的AI助手。
2025-11-20 23:04:30
1064
原创 阿里Qwen3-Omni重磅发布:多模态AI进入“全优不偏科”时代
令人惊叹的是,Qwen3-Omni在音频和视频任务上取得统治级表现的同时,在文本和图像任务上的性能并未丝毫受损,甚至在某些任务上超越了参数量更大的单模态模型。这表明它不仅能看懂图片,还能进行基于视觉信息的复杂推理。最令人印象深刻的是,在需要同时理解音频和视觉信息的DailyOmni测试中,Qwen3-Omni获得75.8分,超过Gemini-2.5-Flash-Thinking的72.7分。处理视频时,AI不仅知道每个画面的时间位置,还知道画面中每个像素的空间位置,以及音频中每个片段对应的时间点。
2025-11-20 18:11:45
982
原创 超越视觉极限:Mini-o3复现OpenAI o3强大推理能力,开启多轮视觉搜索新纪元
o3的核心特点是能够产生数十步的思维链条,支持多种推理模式(如深度优先搜索、试错探索和自我反思),并且推理轮次越多,准确率越高。特别是在挑战性的VisualProbe-Hard数据集上,Mini-o3达到了48.0%的准确率,显著超过其他开源模型(DeepEyes为35.1%,Pixel Reasoner为28.8%)。这项工作的意义不仅在于复现了OpenAI o3类模型的能力,更重要的是为多模态模型的深度推理研究提供了实用指南。研究发现,如果直接使用强化学习训练,模型倾向于产生简短响应和少量推理轮次。
2025-11-20 18:09:13
661
原创 百度发布文心一言5.0预览版大模型:多模态能力全面超越GPT-5?
百度声称,该模型的多模态融合使其能够比依赖特定模态编码器的模型更有效地生成和解读视觉内容,并具备更强的上下文感知能力。虽然百度没有公开完整的基准测试细节或原始分数,但其性能定位表明,百度有意将 ERNIE 5.0 定位为旗舰模型,而不是小众的多模态系统,该旗舰模型可以与通用推理领域最大的封闭模型相媲美。百度声称,该模型在基于文档和图表的基准测试中击败了 GPT-5-High 和 Gemini 2.5 Pro,百度将这些领域描述为企业应用(如自动化文档处理和财务分析)的核心领域。
2025-11-20 17:58:56
1377
原创 2025年人工智能领域CCF推荐A类期刊全攻略:带你了解人工智能领域CCF推荐A类期刊全貌
2025人工智能领域CCF-A类期刊投稿指南 中国计算机学会(CCF)推荐的A类期刊是人工智能领域投稿的重要参考。本文介绍了4大顶级期刊的最新信息: TPAMI(18.6 IF):计算机视觉/模式识别顶级刊,录用率10%,审稿8-10个月 AIJ(4.6 IF):专注AI理论创新,要求严格证明和实验验证 IJCV(9.3 IF):计算机视觉权威期刊,录用率15-20% JMLR(5.2 IF):机器学习开放获取期刊,接受率约18% 这些期刊发表难度大但学术影响力高,对职称评定、基金申请等有重要价值。投稿需确
2025-11-19 22:43:45
2149
原创 千问 APP 深度体验:阿里巴巴打造的 “会聊天、能办事“ 的 AI 超级助手
阿里巴巴推出新一代AI助手"千问APP",基于Qwen3开源模型打造。该应用集智能对话与任务执行为一体,具有三大核心优势:采用混合推理架构实现高效响应,专业领域问答准确率超92%;支持119种语言,提供多模态知识获取方式;简约界面整合办公、学习、生活等实用功能。作为阿里进军C端AI市场的战略产品,千问APP融合了阿里在AI领域的技术积累,致力于成为用户的全能智能助手。
2025-11-19 09:56:06
2629
原创 GPT-5.1发布!你的AI更暖更智能!
2025 年 11 月 12 日OpenAI 官方正式推出了 GPT-5.1。OpenAI 明确表示,这次升级的核心目标是:让 AI 不仅要“智能”,还要“聊起来很愉快”(enjoyable to talk to)。我们为你逐字逐句地拆解了这篇官方博客,带你深入了解 GPT-5.1 到底强在哪里。
2025-11-15 21:55:21
1341
1
原创 谷歌Nano Banana 2爆火!1秒生4K图、推演微积分
谷歌DeepMind推出的NanoBanana2带来图像生成技术革命,支持2K原生分辨率(可扩展至4K),生成速度比传统AI快340%,仅需3.8秒完成4K图像处理。其突破性表现在:精确理解复杂提示词(如数学公式推导)、照片级细节还原(面部、光影等),以及仅256MB的内存占用。相比前代,新模型在图像质量、文字渲染和复杂场景处理上均有显著提升,使AI创意工具进入实时创作新阶段。
2025-11-10 01:11:13
670
原创 2.5 倍速秒杀 GPT-5!马斯克新 AI 成本暴降 98%,免费就能用?AI 圈彻底炸了
马斯克旗下xAI发布Grok4Fast模型,以超高性价比震撼AI行业:速度达GPT-5的2.5倍,成本降低98%,支持200万token长文本处理。该模型通过"双模式合一"设计和优化token利用率实现性能突破,在多项测试中媲美甚至超越GPT-5和Gemini2.5Pro。此次发布标志着AI竞争进入"性价比+工具化+生态化"新阶段,或将加速高端AI的民主化进程。马斯克借此布局AI生态,推动xAI跻身行业巨头行列。
2025-10-30 20:05:48
1152
原创 从密集到稀疏:InfLLM-V2 如何实现零参数开销的长文本高效处理
摘要:清华大学与OpenBMB团队推出的InfLLM-V2框架创新性地解决了大语言模型处理长文本的效率瓶颈问题。该框架采用零额外参数的原生稀疏注意力机制,通过动态切换稠密/稀疏模式,在短文本保持原生效率,在长文本实现4-9倍加速。关键技术包括块选择机制和统一注意力计算,仅需5B训练数据即可完成适配,在128K文本处理中内存降低50%。实验显示其在保持与稠密注意力相当性能的同时,显著提升了训练和推理效率,为AI应用提供了高效经济的长文本处理方案。
2025-10-30 20:00:27
924
原创 RL 之父预言成真,交互时代来了!
复旦大学联合字节跳动团队推出AgentGym-RL智能体训练框架,基于华为昇腾910B算力,仅用70亿参数的小模型就在网页导航、科学实验等场景超越GPT-4o等大模型。该框架采用模块化设计,独创ScalingInter-RL训练方法,在效率提升1.8倍的同时,实现了小模型媲美商业大模型的性能表现。目前已在网页自动化、科学实验、机器人控制等五大场景落地应用,未来还将开放多智能体协同功能并全面开源,标志着AI发展正式进入"经验驱动"新阶段。
2025-10-30 19:43:24
730
原创 在Windows上使用Claude Code 并集成到VS Code的完整指南
这篇指南详细介绍了在Windows系统安装和使用ClaudeCode的完整流程。主要内容包括:1)安装Node.js和Git等必要工具;2)通过npm安装ClaudeCode并验证;3)获取API密钥并配置环境变量;4)将ClaudeCode集成到VSCode扩展中。文章提供了每个步骤的详细说明和验证方法,即使是新手也能轻松完成安装。最后还展示了如何使用ClaudeCode编写俄罗斯方块程序,帮助开发者快速上手这款AI编程助手。
2025-10-28 16:49:59
4905
1
原创 当MCP协议遇见Qwen-Agent:开源驱动的智能体版学术GPT,正在建造学术研究的「未来工厂」
Academic Agents Studio是一个面向学术研究的AI智能体平台,基于Qwen-Agent框架和MCP协议构建,提供论文写作、文献分析、代码解释等学术服务。核心特色包括:深度优化的学术场景功能、多模型支持(GPT/Claude/Gemini等)、智能文档处理(PDF/LaTeX/Markdown)、友好的科技感交互界面。平台支持本地/云端部署,提供智能体协作、工具调用可视化、异步任务处理等功能,并集成arxiv论文助手、文献综述生成等学术工具。项目采用模块化设计,支持自定义插件和MCP服务扩展
2025-10-27 04:41:27
1495
原创 文档处理的 “像素魔法”!Deepseek-OCR 开源:视觉压缩到底牛在哪?
DeepSeek团队开源了革命性的OCR模型DeepSeek-OCR,由Haoran Wei等研究者开发。该模型采用"视觉-文本压缩"创新思路,通过双塔融合架构(DeepEncoder视觉编码器和DeepSeek3B-MoE解码器)实现16倍下采样压缩,仅需100个视觉Token即可超越传统OCR的识别效果。其突破性技术包括:支持10倍压缩下97%的识别精度、复杂内容解析(化学公式/几何图形/表格)、动态分辨率模式等。安装简单,支持多种下载方式,标志着OCR技术从"字符识别&q
2025-10-24 15:51:19
1581
SSD-300 VGG-based weights 权重包含两种ssd300的权重
2018-11-18
aspectjrt& aspectjweaver&aspectj&aopalliance.jar
2017-08-16
ssd 512x512的权重
2018-11-18
《机器学习实战》中决策树python2.7代码经过加工修改后在python3.0可以完美运行的代码
2017-12-03
oracle示例数据库OT.zip
2019-09-17
hadoop 依赖的jar包 包括asm-3.2什么的 一共21 个
2018-07-17
《机器学习实战》中Bayes 朴素贝叶斯 python2.7代码经过加工修改后在python3.0可以完美运行的代码
2017-12-03
《机器学习实战》中KNNpython2.7代码经过加工修改后在python3.0可以完美运行的代码
2017-12-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅