简介
在日常工作中,时常会对涉及的主体(企业、人名、商标名称等)进行出现频率的统计,多个文本时会更多,词云呢可以做这个事情,但是特定的自定义的词呢就需要很费力。
有的人用软件,但呢收费套路、广告让人烦的不能再烦。有的比较聪明用网页全文搜索,一个一个查找,真的好费时间。
其实呢10行代码就可以解决这个事情,真的,复制粘贴就可以用的!
代码
#coding:utf-8#myhelper库无法在python3中安装,清华镜像也无法找到#图形的显示还是使用matplotlib或pyecharts把,安装pipinstallmatplotlibimportmatplotlib.pyplotaspltimportmatplotlibnames=["优衣库","指南针","中唯","G"]file_path=r"C:/Users/asus/Desktop/friends_cn.txt"name_dict={}withopen(file_path,encoding="utf-8")asfp:content_read=fp.read()forsingle_nameinnames:print(single_name,content_read.count(single_name))name_dict[single_name]=content_read.count(single_name)#字体设置plt.rcParams["font.family"]="sans-serif"plt.rcParams["font.sans-serif"]="SimHei"plt.plot(name_dict.keys(),name_dict.values())plt.show()
想要柱形图之类的,自己改下matplotlib的图形设置部分即可。
点击上方蓝字
本文编辑:佚名
转载请注明出地址 http://www.feilongzhangxuea.com/ycjy/10522.html