25、深度学习与自然语言处理:欺诈检测与文本分析应用

深度学习与自然语言处理:欺诈检测与文本分析应用

深度学习在欺诈检测中的应用

利用机器学习技术识别欺诈性文件是一个活跃且具有挑战性的研究领域。研究人员正在探索神经网络的模式识别能力在这方面的应用程度。与手动属性提取器不同,原始像素可用于多种深度学习架构。

方法

这里使用的是一种名为孪生神经网络(Siamese neural networks)的架构,它有两个共享相同架构和参数的分支。当需要验证某一文件的真实性时,首先根据其布局和类型对文件进行分类,然后将其与预期的模板和模式进行比较。如果偏差超过一定阈值,则将其标记为伪造文件;否则,视为真实文件。对于关键用例,对于算法无法明确分类的边界情况,可以添加手动处理流程。

神经网络算法

为了将文件与其预期模板进行比较,在孪生架构中使用两个相同的卷积神经网络(CNNs)。CNNs 能够学习最优的平移不变局部特征检测器,并构建对输入图像几何失真具有鲁棒性的表示,适合将真实文件和测试文件通过单个网络,然后比较它们的输出相似度。具体步骤如下:
1. 获取存储的真实文件图像,称为真实文档,测试文档应与真实文档相似。
2. 将真实文档通过神经网络层创建特征向量,即特征向量 1,它是真实文档模式的数学表示。
3. 将需要测试的文档称为测试文档,通过与创建真实文档特征向量相同的神经网络,得到特征向量 2。
4. 使用特征向量 1 和特征向量 2 之间的欧几里得距离计算真实文档和测试文档之间的相似度得分,即相似度度量(MOS),其值在 0 到 1 之间,值越高表示文档间距离越近,相似度越高。
5. 如果神经网络计算的相似度得分低于预定义阈值,则将文档标记为欺诈性

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值