前言:

  在自然语言处理的学习中,我们可以使用别人已经训练好的模型,也可以使用自己训练的模型。本片文章是将模型model加载进来通过gensim自带的一些方法来验证模型的成功与否。

代码:

#!/usr/bin/env python
# -*- coding: utf-8  -*-
#测试训练好的模型

import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')# 忽略警告
import importlib,sys
importlib.reload(sys)
import gensim

'''@liyang测试model是否可用'''
def word2vec_model_match():
    fdir = r'F:/model/'
    model = gensim.models.Word2Vec.load(fdir + 'wiki.zh.text.model')
    # 与该词相似的词的前10个
    word = model.most_similar(u"加油")
    for t in word:
        print(t[0], t[1])

    # 有那个是不匹配的
    print(model.doesnt_match(u'不 听 老师 辅导员 指导'.split()))

    # 与positive相似与negative不相似
    word = model.most_similar(positive=[u'高兴', u'伤心'], negative=[u'手机'])  #
    for t in word:
        print(t[0], t[1])
    # 输出两词相似度
    print(model.similarity(u'加油', u'奋发'))
    # 输出某个词的特征向量
    print(model[u'工作人员'])  # 输出了多少个向量就是多少维


if __name__ == '__main__':

    word2vec_model_match()






注:所有发布代码在python3.5版本上亲测有效,如有问题请留言回复。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐