ICTCLAS

import ICTCLAS.I3S.AC.ICTCLAS50;
public class TestMain {
    public static void main(String[] args){
        try{
            ICTCLAS50 testICTCLAS50 = new ICTCLAS50();
            String argu = ".";
            if(testICTCLAS50.ICTCLAS_Init(argu.getBytes("GB2312")) == false){
                System.out.println("Init Fail");
            }else{
                System.out.println("Init Succeed!");
            }
            
            String sInput = "香港MSEK 2014夏装新款 男式短袖T恤  618爆品抢先逛 TX4002藏青 L-偏小一码";
            //未导入用户词典
            byte nativeBytes[] = testICTCLAS50.ICTCLAS_ParagraphProcess(sInput.getBytes("GB2312"), 0, 1);
            System.out.println(nativeBytes.length);            
            String nativeStr = new String(nativeBytes,0,nativeBytes.length,"GB2312");
            System.out.println("未导入用户词典分词结果:"+nativeStr);
            //导入用户词典
            int nCount = 0;
            String usrdir = "d:/userdict1.txt";
            byte[] usrdirb = usrdir.getBytes();
 //第一个参数为用户字典路径,第二个参数为用户字典的编码类型(0:type unknown;1:ASCII码;2:GB2312,GBK,GB10380;3:UTF-8;4:BIG5)
            nCount = testICTCLAS50.ICTCLAS_ImportUserDictFile(usrdirb, 2);        
            System.out.println("导入用户词个数:"+nCount);
            nCount = 0;            
            //导入用户词典之后再分词
//  public native byte[] ICTCLAS_ParagraphProcess(byte[] sSrc, int eCodeType, int bPOSTagged);第一个参数就是待处理文本,
//            注意要将String转换为bytes数组,第二个参数是字符集类型【我的源码中有介绍】,第三个参数0:无标注,1:有标注
            byte[] nativeBytes1 = testICTCLAS50.ICTCLAS_ParagraphProcess(sInput.getBytes("GB2312"), 0, 1);
            System.out.println(nativeBytes1.length);
            String nativeStr1 = new String(nativeBytes1,0,nativeBytes1.length,"GB2312");
            System.out.println("导入用户词典分词结果:"+nativeStr1);
            
            /*
             * ICT_POS_MAP_SECOND  计算所二级标注集   0
             * ICT_POS_MAP_FIRST  计算所一级标注集    1
             * PKU_POS_MAP_SECOND   北大二级标注集    2
             * PKU_POS_MAP_FIRST       北大一级标注集   3
             * */
            //使用计算所二级标注集
            testICTCLAS50.ICTCLAS_SetPOSmap(0);
            byte[] nativeBytes2 = testICTCLAS50.ICTCLAS_ParagraphProcess(sInput.getBytes("GB2312"), 0, 1);
            System.out.println(nativeBytes2.length);
            String nativeStr2 = new String(nativeBytes2,0,nativeBytes2.length,"GB2312");
            System.out.println("计算所二级标注集:"+nativeStr2);
            //使用北大二级标注集
            testICTCLAS50.ICTCLAS_SetPOSmap(2);
            byte[] nativeBytes3 = testICTCLAS50.ICTCLAS_ParagraphProcess(sInput.getBytes("GB2312"), 0, 1);
            System.out.println(nativeBytes3.length);
            String nativeStr3 = new String(nativeBytes3,0,nativeBytes3.length,"GB2312");
            System.out.println("北大二级标注集:"+nativeStr3);    
            //释放分词组件资源            
            testICTCLAS50.ICTCLAS_Exit();
            
        }catch(Exception ex){
            
        }
    }
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值