
机器学习算法
文章平均质量分 82
wuyijian_ml
这个作者很懒,什么都没留下…
展开
-
朴素贝叶斯分类法(非常朴素的解释)
最近在做一个短文本分类系统,尝试用朴素贝叶斯算法做了baseline的模型(最终没有采用这种算法),朴素贝叶斯法是个非常简单高效的分类算法, 这个算法断断续续看了好几遍,今天做一个总结,内容参考了李航的《统计学习方法》以及Goodfellow的《深度学习》。简要解释下概率 简要解释下似然以及极大似然的含义算法介绍后验概率最大化的含义(算法为什么有效)实际运用以及如何增量学习...原创 2018-03-30 14:18:09 · 8528 阅读 · 3 评论 -
漫谈卷积神经网络(入门漫谈)
入门漫谈这篇文章主要讨论下卷积神经网络,做下入门我们知道,卷积神经网络是深度学习中非常重要的一种网络架构,在计算机视觉中取得了非常重大的成功,卷积神经网络为什么在图像处理中这么有效,是什么东西赋予了它观察图片的能力呢,我们会说,是样本,是标注样本,是样本告诉它,什么是飞机,什么是鸟,什么是热狗,什么是烤肠。。。(废话)理解图像图像是什么,在计算机看来,图像就是像素点构成的矩阵, 如...原创 2018-06-15 11:46:56 · 420 阅读 · 0 评论 -
文本信息过滤中的变体词识别(一)
文本过滤中的变体词识别(一)变体词识别概述最近在搞文本过滤的一些工作,看了一些变体词识别的内容,分三篇文章做一些总结: 先来一个严谨的定义: 网络书写具有随意性、非正规性等特点。变体词就是网络语言作为一种不规范语言的显著特色, 人们往往出于避免审查、表达情感、讽刺、娱乐等需求将相对严肃、规范、敏感的词用相对不规范、不敏感的词来代替, 用来代替原来词的新词就叫做 变体词(Morph) 。...原创 2018-08-19 13:32:35 · 6187 阅读 · 9 评论 -
怎么用C++写全文搜索引擎
用C++写的全文搜索引擎项目背景现在我们可以在我们可以很容易的在网上搜索到海量的信息,有些网站往往拥有很多优秀的内容,但是缺乏一个灵活而且高效的搜索引擎,导致这个网站的价值没有很好的体现,基于时间轴的或者tag的推荐从另一种角度上来说其实是忽视了用户搜索的主观能动性。通用的搜索引擎并不能解决这个问题:首先,不能有针对性的垂直搜索,对内容的抓取和索引简单粗暴,无法得到结构化数据,看不到隐...原创 2018-08-21 16:45:40 · 4629 阅读 · 0 评论 -
深度学习在图像智能审核中的应用(nsfw篇)
深度学习在图像智能审核中的应用(nsfw篇)NSWF(not suitable for word)图片,顾名思义,就是一些不太适合在工作中浏览的图片,本文介绍的工作是通过深度卷积神经网络来对此类图片进行自动化的审核,由于NSFW图片的定义范围比较广泛,本文主要针对色情图片(后文统一用NSFW图片来表示)的审核,不包括文字,写实暴力,政治相关不当内容的审核。随着计算机视觉、改进的训练数据和深度学...原创 2019-02-24 12:53:49 · 12772 阅读 · 0 评论 -
深度学习在图像审核中的应用(人脸检测篇)
上篇文章主要讲了如何用深度学习的方法鉴别nsfw图片,这篇文章以及后面的一篇文章将会讲解如何利用深度学习的方法来识别一些特定人脸,这篇文章主要是讲下人脸检测和对齐。如何做人脸检测网络架构介绍网络架构训练优化动机部署...原创 2019-04-07 10:46:34 · 1787 阅读 · 0 评论