nltk 之 snowball 提取词干

kkkkk 2018年12月17日 23:07 Python高级
机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。下面说一下snowball 提取词干的两种方法。
两种方法:
方法一:
>>> from nltk import SnowballStemmer
>>> SnowballStemmer.languages # See which languages are supported
('danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian',
 'italian', 'norwegian', 'porter', 'portuguese", 'romanian', 
 'russian', 'spanish', 'swedish')
>>> stemmer = SnowballStemmer("german") # Choose a language
>>> stemmer.stem(u"Autobahnen") # Stem a word
u'autobahn'
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用:
方法二:
>>> ps = nltk.stem.snowball.PortugueseStemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'


文章评论(0)
  • avatar kkkkkk 2018年12月21日 11:31
    能向你学习吗?
    kkkkk
    2018年12月21日 11:16
    入情入理,甚见精纯。笔致轻松,理畅辞达豪放雄奇,不落俗套。面面俱到,论断正确。
    回复
  • avatar kkkkkk 2018年12月21日 11:31
    给跪了
    kkkkklxinde
    2018年12月21日 11:17
    本文提出中心,论述过程紧紧围绕中心论题,摆事实讲道理,批驳辛辣,论述颇显力道。文章立意高蹈,剖析深刻,较好地体现了辩证思维,材料丰富。
    回复
  • avatar kkkkklxinde 2018年12月21日 11:17
    本文提出中心,论述过程紧紧围绕中心论题,摆事实讲道理,批驳辛辣,论述颇显力道。文章立意高蹈,剖析深刻,较好地体现了辩证思维,材料丰富。
    回复
  • avatar kkkkk 2018年12月21日 11:16
    入情入理,甚见精纯。笔致轻松,理畅辞达豪放雄奇,不落俗套。面面俱到,论断正确。
    回复