基于机器学习的姓名提取与肺癌早期检测技术研究
一、基于语音的算法中组装LSTM技术
在处理印度人口统计数据库中的姓名信息时,由于印度存在众多地区语言和方言,准确提取姓名面临挑战。为此,提出了一种基于语音的LSTM + K - Mean组合的组装算法。
- 算法步骤
- 数据创建与划分 :创建包含印度姓名的人口统计数据,以名字(FirstName)和姓氏(LastName)对的形式呈现,数据随机包含各种姓名。将数据集划分为训练集(50%)、验证集(25%)和测试集(25%)。
- 数据聚类与模型训练 :使用K - Mean对训练数据进行分组,将输入数据聚类后用于训练LSTM模型。LSTM的输入是一个三维数组(加密密钥),每个训练数据簇的内存中都会存储一份该LSTM模型的副本。
- 模型测试与输出解密 :使用分类模型测试实际输入值,并对输出进行解密。在转换过程中,将这些编码密钥转换为字符串的三维数组。
- 示例操作 :以单词“Ashish”为例,首先创建字符串“AXAX”,然后对文本进行编码并显示。通过分类方法找到二进制序列的最近簇,即接收编码对后定位最匹配的组。
- 加载最近簇到LSTM模型 :将最近的簇加载到Cm LSTM模型中进行前向传播。使用该模型中保存的LSTM模型的输入,匹配完成后,调用下一步并检索十个最近的编码文本。从显示给最终用户的
超级会员免费看
订阅专栏 解锁全文
31

被折叠的 条评论
为什么被折叠?



