您现在的位置: 飞龙掌血 > 飞龙掌血药材基源 > 正文 > 正文

词频一个复制就可用的文本词频统计脚本

  • 来源:本站原创
  • 时间:2022/4/27 13:18:46
白癜风患者感恩 https://www.kejixun.com/article/180628/433879.shtml

简介

在日常工作中,时常会对涉及的主体(企业、人名、商标名称等)进行出现频率的统计,多个文本时会更多,词云呢可以做这个事情,但是特定的自定义的词呢就需要很费力。

有的人用软件,但呢收费套路、广告让人烦的不能再烦。有的比较聪明用网页全文搜索,一个一个查找,真的好费时间。

其实呢10行代码就可以解决这个事情,真的,复制粘贴就可以用的!

代码

#coding:utf-8#myhelper库无法在python3中安装,清华镜像也无法找到#图形的显示还是使用matplotlib或pyecharts把,安装pipinstallmatplotlibimportmatplotlib.pyplotaspltimportmatplotlibnames=["优衣库","指南针","中唯","G"]file_path=r"C:/Users/asus/Desktop/friends_cn.txt"name_dict={}withopen(file_path,encoding="utf-8")asfp:content_read=fp.read()forsingle_nameinnames:print(single_name,content_read.count(single_name))name_dict[single_name]=content_read.count(single_name)#字体设置plt.rcParams["font.family"]="sans-serif"plt.rcParams["font.sans-serif"]="SimHei"plt.plot(name_dict.keys(),name_dict.values())plt.show()

想要柱形图之类的,自己改下matplotlib的图形设置部分即可。

点击上方蓝字


本文编辑:佚名
转载请注明出地址  http://www.feilongzhangxuea.com/ycjy/10522.html

Copyright © 2012-2020 飞龙掌血版权所有



现在时间: