人工智能开发实战之自然语言NLP处理

天涯幺妹

已于 2024-09-05 17:45:48 修改

阅读量873

点赞数 8

分类专栏：大数据与人工智能大数据挖掘与分析深度学习与算法文章标签：人工智能自然语言处理机器学习 pycharm python nlp 深度学习

于 2024-09-04 11:09:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sinat_30844883/article/details/141750763

版权

内容导读

人工智能自然语言处理简介

英文语音识别

智能聊天机器人

一、人工智能自然语言处理简介

‌自然语言处理（NLP）是人工智能领域中的一个重要分支，它研究如何实现人与计算机之间用自然语言进行有效通信的各种理论和方法。‌

NLP是计算机科学、人工智能和语言学交叉的领域，旨在使计算机能够理解和生成人类语言，从而实现人机交互的自然化和智能化。

从20世纪50年代开始发展的，其最先在机器翻译领域得到发展。

20世纪60年代，出现了句法分析、语义分析、逻辑推理相结合的SHRDLU自然语言系统。

20世纪80年代初期，多数自然语言处理系统都是以一套复杂的、人工制定的规则为基础形成的。

从20世纪80年代末期开始，语言处理引进了机器学习的算法，自然语言处理产生革新。

近年来，深度学习技巧纷纷出炉，在自然语言处理方面获得了尖端的成果。

自然语言处理的部分范畴列表：

二、英文语音识别

1、项目介绍

（1）英文语音识别项目以Google的speech_commands英文单词语音识别项目为基础，并做了一些修改，以更好地使用。

该项目构建可以识别10个不同单词的基本语音识别网络，10个单词分别为“yes”“no”“up”“down”“left”“right”“on”“off”“stop”“go”。

实际的语音和音频识别系统要复杂得多，但就像基于MNIST数据集学习图像识别一样，这个基本语音识别网络能够帮助读者了解所涉及的一些基本技术。

（2）本项目基于Convolutional Neural Networks for Small-footprint Keyword Spotting这篇论文中介绍的架构，这种架构相对简单、可快速训练，并且易于理解。

（3）本项目定义了一个语音字词应该符合的时间范围，并将这段时间内的音频信号转换成图像。

将传入的音频样本分成小段（时长仅为几毫秒）并计算一组频段内频率的强度，一段音频内的每组频率强度为数字向量，这些向量按时间顺序排列，形成一个二维数组，该数组可被视为单通道图像，称为声谱图。

（4）具体做法是

将输入的语音处理成能够读取的数据，即将其转换成一组梅尔频率倒谱系数（Mel-Frequency Cepstral Coefficients，MFCC）。

MFCC也是一种二维单通道表示法，因此也可将其视为图像，图像会输送到多层卷积神经网络中进行处理，并且在卷积神经网络处理后接入全连接层，再经过softmax()函数完成分类，实现区分不同词汇的功能。

2、训练模型

࿰

最低0.47元/天解锁文章

博客等级

码龄10年

115
原创

2009
点赞

2173
收藏

1301
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 人工智能开发实战之OpenCV图像处理

下一篇：: 人工智能开发实战之计算机视觉处理

最新评论

Java前后端开发环境安装与配置完整版
天涯幺妹: 安装完成后，首次启动保持在开始菜单位置，使用激活工具提示成功后，先退出idea，然后重新启动即可
Java前后端开发环境安装与配置完整版
天涯幺妹: idea安装完成后，首次启动idea，保持在开始启动状态，再使用激活工具，提示成功后，退出idea，再次启动就可以了
鸿蒙应用开发之UI框架方舟ArkUI使用参考
鸿蒙学习爱好: 老师您好，想和您探讨一下Harmony os next技术学习资源创作合作机会，烦请查看私信，感谢
Java前后端开发环境安装与配置完整版
Cici.660: idea一直激活不成功
Python爬虫框架Scrapy应用实战解析
北风之神c: 总结的很全面的爬虫，写得赞，博主用心了。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。 funboost 分布式函数调度框架，定位于调度用户的任何函数，只要用户在函数里面写爬虫代码，就可以分布式调度爬虫，并且对爬虫函数施加30种控制功能,例如 qps恒定任何时候随意关机重启代码消息万无一失确认消费非常简单的开启多进程叠加线程/协程,这些强大的功能绝大部分爬虫框架还做不到。此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，也比任意写的爬虫框架领先10年。普通爬虫框架一般就设计为url请求调度框架，url怎么请求都是被框内置架束缚死了，所以有些奇葩独特的想法在那种框架里面难以实现，用户需要非常之精通框架本身然后改造框架才能达到随心所欲的驾驭的目的。普通的爬虫框架与用户手写requests 请求解析存储，在流程逻辑上是严重互斥的，要改造成使用那种框架改造需要大改特改。而此框架是函数调度框架，函数里面用户可以随意写一切任意自由想法，天生不会有任何束缚。使用funboost爬虫，与用户使用别的爬虫框架或者无框架用户手写多线程爬虫相比， funboost都代码更少更强更简单更自由。 pip install funboost 或者是直接使用 pip install boost_spider (powerd by funboost ，boost_spider比funboost增加了更加专门的针对爬虫请求和解析和存储） https://github.com/ydf0509/b

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。