这些术语基于单词“引理”和“同义词”的一般含义。
一个 引理 是共发现在字典中的条目的版本:在规范形式的字,用一个单一的含义。例如,如果您要在字典中查找“ banks”,则规范形式为“ bank”,名词“金融机构”和“河边”的名词将有单独的词缀,动词“ to bank(on)”,等等。
术语 同义词集 代表“同义词集”。一组同义词是一组具有相似含义的单词,例如, ship,skiff,canoe,kayak都 可能是 boat的 同义词。在nltk中,asynset
实际上是一组具有相关含义的 。以你的榜样(的结果wn.synsets("cake")
和wn.lemmas("cake")
),我们也可以这样写:
>>> synsets[0]
Synset('cake.n.01')
>>> synsets[0].lemmas()
[Lemma('cake.n.01.cake'), Lemma('cake.n.01.bar')]
这些是构成“蛋糕”的第一个同义词集的引理。
Wordnet提供了许多方法,可让您探索诸如上位词/别名,使用域等的关系。有关更多信息,您应该直接在Wordnet文档中查找。nltk只是为此提供了一个接口。这是Wordnet词汇表。