在大模型应用日益广泛的当下,其内容访问能力直接影响回答的准确性与实用性,尤其是对墙外优质技术资源(如GitHub、Hugging Face等平台内容)的获取能力,更是技术从业者关注的重点。
一、实测背景
最近在使用大模型时发现千问不知道是因为无法访问墙外的内容,还是因为幻觉问题,居然一直认为SAM3还没有发布。于是我针对国内两款主流大模型——千问与豆包,开展了一场关于墙外内容访问能力的实测,过程中出现了诸多有趣的差异表现,在此整理成文与大家分享。
二、实测过程:千问的“力不从心”
首先进行测试的是千问,测试过程中其表现出明显的“信息滞后”与“访问受限”问题。
第一个测试场景是SAM3的发布状态认知。我在与千问的交互中发现,它始终坚持“SAM3尚未发布”的观点。结合SAM3的实际发布时间来看,出现这一错误判断的原因大概率有两种:要么是千问的训练数据截止时间早于SAM3的发布时间,导致其未收录相关信息;要么是千问无法访问墙外发布SAM3信息的渠道(如项目官网、技术论坛等),无法获取实时更新的内容。

为进一步验证原因,我开展了第二个测试场景:将GitHub上SAM3项目的具体路径发送给千问,希望它能基于该路径获取项目相关信息。令人意外的是,千问直接反馈“无法访问”该路径。这一结果基本排除了“单纯训练数据滞后”的单一原因,大概率指向千问存在墙外内容访问限制,即便提供了明确的墙外资源路径,也无法突破限制获取内容。从交互截图中可以清晰看到,千问对路径的访问请求直接被阻断,未给出任何与项目相关的有效信息。


三、实测过程:豆包的“超出预期”
在千问表现不尽如人意的情况下,我将测试对象切换为豆包,其表现却带来了不小的惊喜。
针对千问“无法访问GitHub路径”的问题,我在豆包中进行了相同的测试:将GitHub上SAM3项目的路径发送给豆包。令人惊喜的是,豆包不仅没有反馈访问受限,反而能够直接打开该GitHub页面,并提取页面中的核心信息。这一表现说明豆包具备一定的墙外内容访问能力,能够突破限制获取GitHub上的开源项目信息,这对需要查阅墙外开源代码的技术从业者而言,无疑是极具实用价值的功能。

为进一步验证豆包的墙外内容访问能力,我开展了第三个测试场景:让豆包介绍Hugging Face平台的内容。要知道,Hugging Face作为全球核心的AI模型共享平台,其核心资源均托管在墙外,若大模型无法访问墙外内容,很难对其进行准确、全面的介绍。而豆包在接到该需求后,能够清晰、准确地介绍Hugging Face的核心功能、平台定位以及热门资源,从交互截图中可以看出,其介绍内容贴合平台实际情况,不存在信息滞后或错误的问题。这一结果进一步印证了豆包具备墙外内容访问能力,且访问范围覆盖了GitHub、Hugging Face等核心技术平台。

不知道大家在使用国内大模型的过程中,是否也遇到过类似的“内容访问限制”或“惊喜表现”?欢迎在评论区分享你的实测案例与看法!

2834

被折叠的 条评论
为什么被折叠?



