Word分词是一个JAVA实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。
如果需要安装Word分词器可以参考下面的步骤:
jdk官网:http://www.oracle.com/technetwork/JAVA/JAVAse/downloads/index.html
ecliPSe官网:http://www.ecliPSe.org
2、下载Word分词器的相关jar包:打开Word分词器的官方github主页:httPS://github.com/ysc/Word
下拉找到readme部分,点击“编译好的jar下载”:
页面将会跳转到到百度云盘的下载页面,按照需求下载指定的版本即可。
注意:Word1.3需要jdk1.8。
下载完成之后解压到指定目录。
打开ecliPSe,右键创建JAVA Project项目:
然后右键项目选择bUIld path打开导入页面,导入刚才下载的jar包到项目中:
导入成功之后就可以在自己的项目中使用Word分词器了。