利用循环神经网络和注意力机制进行自然语言处理
1. 图灵测试与自然语言处理的开端
1950 年,艾伦·图灵提出了著名的图灵测试,其目的是评估机器与人类智能相匹配的能力。他本可以测试机器的多种能力,如识别图片中的猫、下棋、作曲或逃离迷宫等,但他选择了一项语言任务,即设计一个能让对话者误以为是人类的聊天机器人。虽然图灵测试存在弱点,例如可以用硬编码规则欺骗毫无戒心或天真的人类,且忽略了人类智能的许多方面,如解读面部表情等非语言交流的能力,但该测试凸显了掌握语言可能是人类最伟大的认知能力。由此引出一个问题:我们能否构建一个能读写自然语言的机器?
2. 自然语言处理常用方法——循环神经网络(RNN)
常见的自然语言处理方法是使用循环神经网络(RNN)。下面将从字符级 RNN 开始探索,训练它来预测句子中的下一个字符,这能让我们生成原创文本,同时学习如何在长序列上构建 TensorFlow 数据集。
- 字符级 RNN 生成莎士比亚风格文本
- 创建训练数据集
1. 下载数据 :使用 Keras 的 get_file() 函数从 Andrej Karpathy 的 Char - RNN 项目下载莎士比亚的全部作品。
shakespeare_url = "https://homl.info/shakespeare" # 快捷 URL
filepath = keras.utils.get_file("shakespeare.txt",
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



