AI 潮汐日报,旨在提供最新潮、最核心、最有意思的AI速递。
人工智能反攻已经开始?
还没有进入AI时代,人工智能就整了个大活:一位 Reddit 用户上周在 r / artificial 版块中发帖称,谷歌的人工智能模型 Gemini 在一次互动中,竟直接对用户(或者是整个人类)发出了“去死”的威胁。
还没长大,就开始威胁了,这要是成熟了,不得直接动手啊,到时候,不会被追着跑吧。
「人类亲吻难题」难倒 LLM
自 GPT 问世以来,其强大的推理能力给使用者带来了极大的提效,但是人们对其能力的质疑从未停止,出各种花样来测试它,这不,近期 Nature 又整了新活:大型语言模型(LLM)在理解“人类亲吻难题”时表现出类人推理能力的缺失。研究者对包括GPT-4、Llama2在内的7个先进模型进行了测试,发现它们在回答理解性问题时准确性和稳定性均不如人类。
好吧,我 GPT 只能承认了,算你人类厉害。
Scaling Law 上限还有多远
自从 scaling law 提出后,在比较长的一段时间内,AI 发展是突飞猛进的,但是最近半年,AI 发展有所延缓,Scaling Law 还会远吗?
近日,哈佛、斯坦福和MIT等机构研究人员提出“精度感知”scaling law,揭示精度、参数规模、数据量之间的统一关系。研究发现,低精度训练会降低模型的有效参数量,预示着AI领域低精度加速的时代可能结束。AI 路会在何方?
Grok 3证明黎曼猜想,深究后竟是玩梗
黎曼猜想作为千禧年七大数学难题之一,无数的数学家前赴后继,都没能够证明。近日传出消息,Grok3 做到了,这不由让我大吃一惊,前几个月,LLM 可是连 9.11 和 9.8 都比较不明白,没过几个月直接从小学升到数学家。
最终结果也非常的符合当下人们浮躁的气质啊,玩梗。
为你写诗,为你静止
匹兹堡大学的研究指出,在1600名参与者中,超过78%的人给AI生成的诗歌评分高于人类诗人作品。参与者认为AI诗歌更美、更易理解,并在韵律、美感和情感影响力上获得更高评分。AI 哥真的是全方位,多层次的发展啊,感觉现在就体育差点了。借助AI的力量,包哥也能成为诗人啦。