
语言学研究
文章平均质量分 82
Felomeng
Dreamer
展开
-
99%的中国人都会犯的英语错误
这个错误,我也犯了很久……惭愧啊原创 2010-07-18 10:09:00 · 2144 阅读 · 0 评论 -
Java程序通过weka调用libsvm和liblinear的方法
《Java程序通过weka调用libsvm的方法》一文阐述了调用LibSVM的简单方法,这里主要补充四点:1. LibSVM在weka3.5版以后都集成了包装,无须再使用WLSVM,所以上文中的WLSVM相关的内容可以去除,而类型WLSVM可以换成LibSVM,需要添加包import weka.classifiers.functions.LibSVM;无须再使用import原创 2010-01-15 18:43:00 · 7490 阅读 · 5 评论 -
weka入门教程
目录1. 简介WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz.sixxs.org/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。 WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘转载 2009-10-17 09:56:00 · 13575 阅读 · 0 评论 -
Java程序通过weka调用libsvm的方法
在《在eclipse下使用java调用weka》的基础上,使用《在eclipse下使用java调用weka》中介绍的方法添加libsvm的两个jar包(libsvm.jar和wlsvm.jar)及weka的jar包,这三个包可以从这里下载:http://download.youkuaiyun.com/source/1749854。然后在import诸语句下添加:import wlsvm.WLSV原创 2009-10-17 14:49:00 · 10823 阅读 · 9 评论 -
在eclipse下使用java调用weka
weka是很好用的机器学习库,这里就不详细介绍了。言归正传,要使用程序方式使用weka,步骤如下:一、在eclipse里新建一个java project: 1. 建立工程:单击菜单中file->new->java project,在弹出对话框的project name中起任意一个名字,此处假设是wekaTest。单击Finish按钮(在对话框底部)。 2. 建立原创 2009-10-17 14:19:00 · 37943 阅读 · 10 评论 -
CRF++的简单使用
CRF++是著名的条件随机场开源工具,也是目前综合性能最佳的CRF工具。本文简要介绍其使用方法。一、工具包的下载:a) http://crfpp.sourceforge.net其中有两种,一种是Linux下(带源码)的,一种是win32的,当然是在什么平台下用就下载什么版本了。b) http://download.youkuaiyun.com/source/14原创 2009-06-22 12:09:00 · 39107 阅读 · 24 评论 -
条件随机场(CRF)识别命名实体
资实验相关资料下载CRF++使用见《CRF++的简单使用》一、实验环境a) 软件:windows XP pro sp3,visual studio 2008 & Dotnet2.0, CRF++, perlb) 硬件: CPU: cm420,内存:2G ddr533, 160G 8M sata 富士通二、实验过程下面未经特别说明,都是按照作业原创 2009-07-21 15:26:00 · 32203 阅读 · 28 评论 -
改进向量空间模型
声明:只是对向量空间模型的介绍(或者叫推广),并没有理论创新工作。本人在之前的《向量空间模型(VSM)在文档相似度计算上的简单介绍》和《向量空间模型文档相似度计算实现(C#)》两篇文章中分别介绍了简单SVM模型及其实现。本人使用简单词频(即词在当前文档中出现的次数)信息,实现了一个朴素版本的向量空间模型,效果尚可,但还是有很多可改进之处。直接使用词的个数在比较词数很多和词数很少的原创 2009-04-09 12:30:00 · 12012 阅读 · 3 评论 -
向量空间模型(VSM)在文档相似度计算上的简单介绍
C#实现在:http://blog.youkuaiyun.com/Felomeng/archive/2009/03/25/4023990.aspx向量空间模型(VSM:Vector space model)是最常用的相似度计算模型,在自然语言处理中有着广泛的应用,这里简单介绍一下其在进行文档间相似度计算时的原理。假设共有十个词:w1,w2,......,w10,而共有三篇文章,d1,d2和d3。统原创 2009-03-25 16:57:00 · 43633 阅读 · 9 评论 -
向量空间模型文档相似度计算实现(C#)
读者可以根据自己的需要进行加壳或改写,本文权当抛砖引玉。笔者加的壳在:http://download.youkuaiyun.com/source/1143450 VSM模型介绍:http://blog.youkuaiyun.com/Felomeng/archive/2009/03/25/4024078.aspx using System;using System.Collections.G原创 2009-03-25 16:34:00 · 13608 阅读 · 10 评论 -
C#代码调用Weka
我们知道,Weka是一个用Java语言开发的机器学习工具包(http://blog.youkuaiyun.com/Felomeng/archive/2009/10/17/4687061.aspx)。那么如果想在C#中调用怎么办?可以使用IKVM(http://blog.youkuaiyun.com/Felomeng/article/details/4063343)。 IKVM转换weka.jar的命令是:ikvmc -原创 2012-03-21 05:56:23 · 4849 阅读 · 0 评论