php – 使用WordNet数据库确定Word类型的算法

发布时间:2022-04-30 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了php – 使用WordNet数据库确定Word类型的算法脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在开展一个项目,该项目需要扫描英文自然文本的段落并检测它们是什么类型的单词.该应用程序适用于 AJAX,PHPMysqL.

我的应用程序不需要100%准确,只是试图找到匹配文本输入的最佳内容.为此,我使用了wordnet数据库sql版本,它允许我使用dict视图搜索单词及其类型.

SELECT lemma,pos From dict WHERE lemma = 'fool' ORDER BY lemma;

以上是数据库看到的示例,但我的PHP实际上是根据AJAX调用的文本创建动态绑定参数,实际上,它将包含许多关键字.

这将返回一个记录数组,其中搜索每个单词及其类型.

然而我的问题是,大多数单词可以是多种类型,例如,使用傻瓜示例,它将三个作为名词,四个作为动词.我不需要微小的差异,但我想知道这个词是否是名词或动词.

这个问题在大多数单词中都存在,这意味着我无法准确地检测到不同类型的单词,因为它可能是任何用途.

我想知道是否有人可以指出我在算法的正确方向或我可以做什么,以便至少给出最好的猜测单词类型是什么.

重要的是形容词和名词.

您要完成的任务称为词性标注(如评论中已建议的那样),Wordnet绝对不是执行此操作的工具.
评论中还有一个链接一个非常简单PHP方法. POS有很多库.注释中链接的那个实现了brill解析器,它非常简单并且实现了良好的结果.为了获得更好的性能,我建议使用有PHP接口的Stanford NLP工具,例如: https://github.com/agentile/PHP-Stanford-NLP

有几个相关的SO问题:

> How to impliment a Part-of-Speech (POS) tagger
> Pos Tagger in PHP

脚本宝典总结

以上是脚本宝典为你收集整理的php – 使用WordNet数据库确定Word类型的算法全部内容,希望文章能够帮你解决php – 使用WordNet数据库确定Word类型的算法所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。