读论文随笔记 - 图灵范式&&大模型&&DeepSeek

        也就是近一年的事情,GPT-4 在法律考试中取得优异成绩,DALL-E 3 将文字转化为各种类型的艺术图像,DeepSeek横空出世。现在人工智能的单方面能力肯定已经远超普通人。

         作为人工智能的鼻祖概念,图灵机大名如雷贯耳,但是昨天至今天凌晨才第一次读了图灵机的出处本体,1950年《Computing Machinery and Intelligence》这篇奠定如今人工智能基础的论文 。因为这篇论文好像还是有版权的,谨慎起见,我不敢随便翻译转载。

        这篇想到哪写到哪,其实不算一篇文章。一条条笔记和感想集合,估计有点乱,看到的对付着看吧-0-。   

        图灵机实验到处都有,这里就不记录了。 

        预言:当机器的行为表现 和 人类难以区分的时候,关于其是否 "思考" 的争论将逐渐消弭,现在的这个争论只能放在一边不管。

        现代人工智能的发展轨迹,其实已经正在突破(已经突破?我真的不知道)图灵最初的理论框架。

        图灵设想的 " 存储容量约10^9 的学习机器,在 现代大模型高达GPT-4 的 1.8 万亿参数,Moe架构DeepSeek V31.5万亿参数已成为现实。这基本达到了10^13的级别

        现代模型的能力维度也远超文本交互:SD,MJ 生成的艺术作品模糊了创作主体的边界,Claude 3 能进行复杂的数学证明,当 AI 不仅能模仿人类行为,而且能比普通人做的更快更好,更能创造人类难以企及的成果时,行为主义框架依然适用(部分适用)

      人类认知的发展依赖身体与环境的动态耦合,而非纯粹的符号运算或神经网络模拟。但是这种人类的规则概念真的对硅基运算体有意义么。

        有时候想一下确实有意思,是不是现在那个时代已经来了,只是我自己觉得还没来而已。

        符号主义与连接主义的范式之争在大模型时代呈现新形态。图灵机依赖的离散状态转移在神经网络的连续表征面前已经对不上了:大模型的自注意力机制能捕捉文本中的隐喻关联;早期的图灵机范本Deep Blue 式的规则系统对此类模糊语义没啥用了。而当时深蓝已经更打败国际象棋冠军了。

        我自己小时候看新闻Deep Blue打败了国际象棋冠军只是当成和自己无关的当代故事;但是Alpha go 击败柯洁让我切切实实的感受到了震惊。也有可能因为我没下过国际象棋,但了解一点围棋规则,明白普通人和柯洁之间差距的原因?。

        现在大模型不断的 "涌现能力"—— 比如一开始只能文本,后来计划多模态,一开始大模型处理不好数学逻辑推理,GPT-3.5 突然获得的数学解题能力,DeepSeek搞出了推理能力还开了源 。—— 这些又与图灵关于 "突变式进化" 的设想不谋而合。(以后感觉还会不断进化,好吧是必然进化)

        图灵肯定不会瞎设想和不管推导逻辑。而且现在的新能力都是从transformer这种架构衍生而出。那是不是可以认为人工智能也在遵守物质的相变规律。就是说,在积累到一定程度后,量变引发质变,产生新的未知领域。

        大模型生成的诗歌与代码常引发 "机器是否理解其输出" 的追问,这部分是图灵回避的意识难题。现在当代 AI 中变得没法回避了:GPT-4 生成文本 "我感到孤独" 。我一开始看到这新闻觉得可笑,以为是营销,一直到用了deepseek。

        第一次看到ds把逻辑性远超过我,并以以千倍速度的文本打印出来的时候,我汗毛孔里产生到了字面意义上的“细思极恐”的感觉(病句,只是为了表达感受罢了,不知道怎么改了,对付着记下来吧)。

        这推理到底是主观体验还是token生成,还是两者兼有?既是说,处理token量足够大,偶尔条件临界,产生了相变。它是否实在伪装?(造出了什么吓人的玩应儿啊)。不过还好,用的多了就麻木了,现在与ds和平共处。

        现在头部论文有转向神经符号融合的探索,Gemini 模型尝试将神经网络与符号逻辑结合,试图在保持灵活性的同时建立可解释性,尝试解决意识难题。但作为小白的我弱弱的问一句,这些能保证安全么,还是说孤注一掷?(算了,人穷死了都不怕,考虑这个干嘛)

        多模态交互技术正在重构智能的定义。图灵测试的文本交互边界被突破:微软的 VALL-E 能模拟人类声音,Sora 可将文字转化为动态视频,但自身智能的缺失依然显著:比如大模型虽能精确描述机械原理,却无法实际操作机器人完成简单任务。这种 "认知 - 行动" 的割裂,与图灵强调的 "教育需与环境互动" 有差距。(或者说,现在的大模型处理的数据只是互联网数据token,而人类的具体行为数据是空白域,造成了认知可以,行动不能的现象)宇树那边的机器人公司会不会有希望先解决类似的数据集?未来会不会有相对应类型的开源数据集?这对我等白丁技术人非常重要。

        关于 "连续机器" 的讨论则对应了现在神经形态计算的兴起。也就是现在模拟生物神经元计算,类脑学习。脑机接口技术如正在探索将人类认知与 AI 直接融合,这种技术路径可能催生超越图灵设想的新型智能形态。

       这篇论文里面的内容还没有完全发酵完成,这是篇70年前的论文。       

       后记随想

       和论文无关,只是我自己读这篇论文产生的想法,这篇论文在七十年前是,是逻辑和分析,理解和想象的巅峰之作。人的专注和记忆,逻辑和分析,理解和想象,对应着地基,构建,塑型(成型),这三者无比重要,老的时候别忘记了这些,回头来看看笔记。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值