自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Dennis & Tech

小菜鸟希望学习到好多知识!!!

  • 博客(7)
  • 资源 (2)
  • 收藏
  • 关注

原创 关于SVM和Kernel的物理意义

SVM是一种优化过的分类算法。和PLA的区别在于会选择“容错率”最大的hyperplane。众所周知,模型的expressive power越强,generalization的可靠性越差。SVM通过对“容错率”的考量中和了高纬度模型的风险。SVM在数学上可以看做一种加入了regulizer 的回归法。解SVM问题,可以只用标准QP solver。

2014-12-06 21:10:20 514

原创 关于evalb的使用

evalb是一个开源的软件。说是软件,其实只是一段源代码而已。目测只能在linux下使用。这个软件的作用是 计算parser生成的标注文本相对于金标准的正确率。使用的方法是:1.使用make编译源文件2.输入命令./evalb -p sample.prm 1.gld 1.tst需要调节的参数在sample.prm 中修改

2014-03-03 21:17:32 673

原创 吃货的自然语言消岐

吃货的自然语言消岐2013年11月29日20:22贝叶斯分类 贝叶斯分类是在消除歧义时使用一个长度有限的窗口,根据上下文的性质求出最大的可能性的语义是哪一个。 但是这种方法在某些较为复杂的语句分析中可能存在问题。 比如说:有一个烧烤店的广告:“烤各种烤串,涮串”这句话是什么意思呢??这句话本身是一个错误的句子。句首的动词烤按时了后面的宾语是烧烤用的原

2013-12-09 18:35:20 496

原创 基于语料库的工作

基于语料库的工作2013年11月20日21:28 词干化:诸如sit,sits,sat这样的词是否应该被视作相同的词??一般认为,这个想法在语义学上是有意义的。一般把这个过程成为词干化 PS:是否应该注意到seated和sit之间的不强的关联性呢??station和stationary之间的关联性???非派生词之间也可能有语义上的关联。如英语

2013-12-09 18:33:30 469

原创 基于统计的语义消岐基础

基于统计的语义消岐基础 语义消岐一般包含两类问题:一是对有多次性的词的词性标注。例如:station二是在一个词性下不同语义的处理。 前一种情况通常利用邻近的结构信息。而后一种情况更多地考虑相隔距离很远的实词对语义的影响。 Supervised learning and unsupervisedlearning 伪词的制造。 算法上界和算法下界算

2013-12-09 18:28:59 443

原创 数学与信息论 基础

信息熵信息论的知识有香农开创。熵的值越大,事件的不确定性越大,能正确估计该事件的难度越高,需要的编码量越大,即信息含有的较多。 熵是信息量的量度。 在取以2为底的对数时,熵的单位是比特。H(P)=ΣP(x)log21/P(x)一个事件某种情况的概率越小,意味着情况的分类越细微,信息量越大。概率空间中的解的概率越大,意味着这种情况更能反映该事件的性质。熵是

2013-11-20 21:28:47 693

原创 人工智能(AI)概述

人工智能(AI)概述  人工智能有哲学,数学,控制科学等等方面的贡献。AI是为了让计算机实现人的某种功能,完成某种工作。 哲学在认知论上帮助人工智能。要深思的不是结局而是手段。 形式化规则=命题逻辑和一阶谓词逻辑。使用形式化逻辑不可能达成完整的人工智能。 可计算性不完备性定理的一种表示:整数的某些函数是无法用算法表示,不可计算的。 不可操

2013-11-15 17:12:38 1651

哈工大 编译原理作业

哈工大编译原理大作业代码。本人完成,供给学弟妹参考,切勿滥用。如遇查重,本人概不负责(其实并不查重啦~)

2015-06-15

bigplanet...开源的地图软件

一个离线的Android地图程序...开源的...比较不错

2013-03-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除