环境:win10
工具:anaconda3(python3.5)、JDK(java环境)
1、anaconda安装
官网下载
2、jdk安装
使用java接口能使用hanlp更多的功能
这里安装的是jdk 8
下载地址: https://www.oracle.com/technetwork/java/javase/downloads/index.html
下载对应系统的版本进行安装,安装过程中会附带安装jre,保证jre和jdk不装在同个文件夹就好。
安装完成重要的一步就是配置环境变量:
(1)设置JAVAHOME环境变量:
变量名:JAVAHOME
变量值:jdk安装的路径
(2)设置jdk的bin目录的Path环境变量:
新增变量值:输入jdk的bin路径。
(3)设置CLASSPATH 环境变量:
变量名:CLASSPATH
变量值:.;%JAVAHOME%\lib;%JAVAHOME%\lib\tools.jar
注:不设置环境变量,当运行hanlp的时候会报错,调用不到jdk
3、安装jpype1和pyhanlp
打开命令行,直接输入运行下面的命令:
conda install -c conda-forge jpype1
pip install pyhanlp
4:测试
代码(关键短语提取):
from pyhanlp import *
text = "算法工程师算法(Algorithm)是一系列解决问题的清晰指令,也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。算法工程师就是利用算法处理事物的人。1职位简介算法工程师是一个非常高端的职位;专业要求:计算机、电子、通信、数学等相关专业;学历要求:本科及其以上的学历,大多数是硕士学历及其以上;语言要求:英语要求是熟练,基本上能阅读国外专业书刊;必须掌握计算机相关知识,熟练使用仿真工具MATLAB等,必须会一门编程语言。2研究方向视频算法工程师、图像处理算法工程师、音频算法工程师 通信基带算法工程师3目前国内外状况目前国内从事算法研究的工程师不少,但是高级算法工程师却很少,是一个非常紧缺的专业工程师。算法工程师根据研究领域来分主要有音频/视频算法处理、图像技术方面的二维信息算法处理和通信物理层、雷达信号处理、生物医学信号处理等领域的一维信息算法处理。在计算机音视频和图形图像技术等二维信息算法处理方面目前比较先进的视频处理算法:机器视觉成为此类算法研究的核心;另外还有2D转3D算法(2D-to-3D conversion),去隔行算法(de-interlacing),运动估计运动补偿算法(Motion estimation/Motion Compensation),去噪算法(Noise Reduction),缩放算法(scaling),锐化处理算法(Sharpness),超分辨率算法(Super Resolution),手势识别(gesture recognition),人脸识别(face recognition)。在通信物理层等一维信息领域目前常用的算法:无线领域的RRM、RTT,传送领域的调制解调、信道均衡、信号检测、网络优化、信号分解等。另外数据挖掘、互联网搜索算法也成为当今的热门方向。算法工程师逐渐往人工智能方向发展。"
phraseList = HanLP.extractPhrase(text, 3);
for line in phraseList:
print(line)
结果:
算法工程师
算法处理
一维信息
测试代码无误,表明已经安装成功
=======================================================
最后附上hanlp的官方文档链接:
http://hanlp.linrunsoft.com/doc/_build/html/index.html