文末有这本书的知识思维导图
不鸽大家,终于把这本书读完,来分享一下读后感。《数学之美》这本书是2012年出版,作者吴军,他的书籍还有《浪潮之巅》、《格局》等也非常有名,吴军博士在语音识别、自然语言处理,特别是统计语言模型的研究上都颇有建树。
拿到书先看目录,内容包括自然语言处理、动态规划算法、人工神经网络、最大熵模型等都是我们大学接触过或平时挂在嘴边的名词,但这些名词背后的原理是什么,以及究竟是如何应用的,这本书就是吴军博士将高深的数学原理,以及数学在各个领域方面是如何应用的讲解的通俗易懂的过程。

统计语言模型
前4章其实很有意思,在讲自然语言处理,大家都在说自然语言处理,那到底计算机是怎么处理人类的语言的呢?早期学术界认为必须让机器理解语言,才能处理语言,于是形成了基于规则的自然语言处理技术,但实际上采用统计的方法更简单且准确率更高。第四章谈到了中文分词,因为只有先对句子分词,才能做进一步的自然语言处理,而中文分词也是以统计语言模型为基础的。

几乎所有的自然语言处理问题都可以等价成通信中的解码问题,也就是将收到的信号还原成发送的信息,换句话说,就是在已知接收到的信息o1,o2,o3…的条件下,推测发送的信息s1,s2,s3…,这个问题就变成了一个条件概率的问题,并且是动态的随机过程,每一个时刻的状态都可能和其他状态有关,为了简化问题,就提出

《数学之美》是吴军博士的作品,深入浅出地介绍了数学在自然语言处理、新闻分类等领域的应用。书中通过统计语言模型解释计算机如何处理语言,用大师的学习经历启发读者,同时探讨了新闻分类中的余弦定理等概念,强调简单有效的解决方案是数学魅力所在。
最低0.47元/天 解锁文章
4722

被折叠的 条评论
为什么被折叠?



