特定单词的NLTK搭配

试试这个代码：

import nltk
from nltk.collocations import *
bigram_measures = nltk.collocations.BigramAssocMeasures()
trigram_measures = nltk.collocations.TrigramAssocMeasures()

# Ngrams with 'creature' as a member
creature_filter = lambda *w: 'creature' not in w


## Bigrams
finder = BigramCollocationFinder.from_words(
   nltk.corpus.genesis.words('english-web.txt'))
# only bigrams that appear 3+ times
finder.apply_freq_filter(3)
# only bigrams that contain 'creature'
finder.apply_ngram_filter(creature_filter)
# return the 10 n-grams with the highest PMI
print finder.nbest(bigram_measures.likelihood_ratio, 10)


## Trigrams
finder = TrigramCollocationFinder.from_words(
   nltk.corpus.genesis.words('english-web.txt'))
# only trigrams that appear 3+ times
finder.apply_freq_filter(3)
# only trigrams that contain 'creature'
finder.apply_ngram_filter(creature_filter)
# return the 10 n-grams with the highest PMI
print finder.nbest(trigram_measures.likelihood_ratio, 10)

它使用似然测度，还过滤掉不包含“生物”一词的Ngram。

其他 2022/1/1 18:52:44 有428人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在Linux中的特定行中向文件中添加文本

在Linux中的特定行中向文件中添加文本

其他 2022-01-01 668
有没有一种方法可以使特定密钥在集群模式下位于特定Redis实例上？

有没有一种方法可以使特定密钥在集群模式下位于特定Redis实例上？

其他 2022-01-01 647
如何在Linux中通过特定接口发送多播数据包

如何在Linux中通过特定接口发送多播数据包

其他 2022-01-01 694
在Jenkins中设置特定的Python

在Jenkins中设置特定的Python

python 2022-01-01 719
如何在特定文件夹上设置777权限？

如何在特定文件夹上设置777权限？

其他 2022-01-01 650
Spring-禁用绑定异常（针对特定属性）

Spring-禁用绑定异常（针对特定属性）

Java 2022-01-01 574
将外部CSS的范围限制为仅特定元素？

将外部CSS的范围限制为仅特定元素？

CSS 2022-01-01 479
如何在github存储库的特定标签上“获取”

如何在github存储库的特定标签上“获取”

其他 2022-01-01 673
如何在AngularJS中包含视图/部分特定的样式

如何在AngularJS中包含视图/部分特定的样式

其他 2022-01-01 627
从数组到特定长度的所有可能字符串组合的算法

从数组到特定长度的所有可能字符串组合的算法

其他 2022-01-01 623
Jenkins REST API-使用树引用JSON数组中的特定项目

Jenkins REST API-使用树引用JSON数组中的特定项目

其他 2022-01-01 522
将JSON字符串解析为JavaScript中的特定对象原型

将JSON字符串解析为JavaScript中的特定对象原型

javascript 2022-01-01 632
仅将JSP / Servlet访问限制为特定用户

仅将JSP / Servlet访问限制为特定用户

Jave 2022-01-01 602
从特定步骤重建Docker映像

从特定步骤重建Docker映像

其他 2022-01-01 455
如何在Go中请求具有特定字符集的页面？

如何在Go中请求具有特定字符集的页面？

Go 2022-01-01 605
我可以编写CSS选择器来选择没有特定类或属性的元素吗？

我可以编写CSS选择器来选择没有特定类或属性的元素吗？

CSS 2022-01-01 712
为什么不能将特定于供应商的伪元素/类组合到一个规则集中？

为什么不能将特定于供应商的伪元素/类组合到一个规则集中？

其他 2022-01-01 447
使用jQuery选择所有具有特定CSS的元素

使用jQuery选择所有具有特定CSS的元素

CSS 2022-01-01 368
如何在Ubuntu上安装特定版本的Node？

如何在Ubuntu上安装特定版本的Node？

Node 2022-01-01 542
如何判断jQuery是否继承了特定的CSS属性？

如何判断jQuery是否继承了特定的CSS属性？

CSS 2022-01-01 490

特定单词的NLTK搭配

撰写回答

推荐问题

在Linux中的特定行中向文件中添加文本

有没有一种方法可以使特定密钥在集群模式下位于特定Redis实例上？

如何在Linux中通过特定接口发送多播数据包

在Jenkins中设置特定的Python

如何在特定文件夹上设置777权限？

Spring-禁用绑定异常（针对特定属性）

将外部CSS的范围限制为仅特定元素？

如何在github存储库的特定标签上“获取”

如何在AngularJS中包含视图/部分特定的样式

从数组到特定长度的所有可能字符串组合的算法

Jenkins REST API-使用树引用JSON数组中的特定项目

将JSON字符串解析为JavaScript中的特定对象原型

仅将JSP / Servlet访问限制为特定用户

从特定步骤重建Docker映像

如何在Go中请求具有特定字符集的页面？

我可以编写CSS选择器来选择没有特定类或属性的元素吗？

为什么不能将特定于供应商的伪元素/类组合到一个规则集中？

使用jQuery选择所有具有特定CSS的元素

如何在Ubuntu上安装特定版本的Node？

如何判断jQuery是否继承了特定的CSS属性？

分类汇总

您的鼓励是对我最大的支持