使用cjieba(结巴分词库)实现php扩展中文分词

发布时间:2019-08-07 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了使用cjieba(结巴分词库)实现php扩展中文分词脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

编译安装

gIT clone https://github.COM/jonnywang/jz.git
cd jz/cjieba
make
cd ..
phpize
./configure --enable-jieba
make
make install

配置php.ini

extension=jz.so 
jz.enable_jieba=1
jz.dict_path=/Users/xingqiba/data/softs/jz/cjieba/dict    #指向jz库dict目录

使用

<?php

$result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造');
PRint_r($result);

$result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造', true, 6);
print_r($result);

效果

Array
(
    [0] => 小明
    [1] => 硕士
    [2] => 毕业
    [3] => 于
    [4] => 中国
    [5] => 科学
    [6] => 学院
    [7] => 科学院
    [8] => 中国科学院
    [9] => 计算
    [10] => 计算所
    [11] => ,
    [12] => 后
    [13] => 在
    [14] => 日本
    [15] => 京都
    [16] => 大学
    [17] => 日本京都大学
    [18] => 深造
)

Array
(
    [0] => 计算所
    [1] => 小明
    [2] => 京都大学
    [3] => 深造
    [4] => 硕士
    [5] => 中国科学院
)

欢迎您加入我们的专属QQ讨论群组① 233415606 ② 233415756

脚本宝典总结

以上是脚本宝典为你收集整理的使用cjieba(结巴分词库)实现php扩展中文分词全部内容,希望文章能够帮你解决使用cjieba(结巴分词库)实现php扩展中文分词所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。