作为数据可视化最经典表现手段之一,词云图无疑是对海量文本内容进行直观呈现最简便的手段。而且上手简单、效果惊艳。本文简要叙述从文本分词到词云图制作的一系列流程,希望对大家有帮助~
第
1
步
【文本分词】
词云图的基本原理是将不同频次的文字内容通过不同的字号排布呈现,从而形成错落有致的直观图片。
因此词云图怎么做,在获得源文本的基础上,我们首先要对文本内容进行分词以及词频统计。
除了自己写或者求助师长获取代码程序来进行文本分词之外,市面上也有许多开源公用的分词软件。今天给大家介绍一款我平时有在使用、感觉功能还不错的软件:集搜客分词打标软件。
应用无需下载,只需要注册集搜客账号即可使用。
使用步骤:
1. 登录进入系统,点击“导入数据”开始创建任务。点击进入任务,在“原数据”页面可以看到导入状态,如果数据量很大,自动分词需要一些时间
注意:支持导入不超过10M的excel、word、txt、pdf文档。不用再将爬下来的excel转换为txt实在是太友好了~
2. 筛选词语,把与研究目的相关的词勾上,点击“确定”词云图怎么做,这一屏的词就消失了。勾上的是要的,没有勾上的词就是不要的。直到所有词都从这个页面上消失了,就表示选完了所有词。点击词语可以查看样本数据。
3. 如果想要补充词语,可以人工添加进去,提交添加的时候,软件也会用添加的词去匹配每条文本。
4. 最后下载数据,一次性下载3张表:选词结果、打标结果(标签矩阵)、分词效果;其中我们制作词云图主要用到的是选词结果的图,之前我自己做的一个分词结果部分如图所示:
第
2
步
【词云制作】
知乎上有很多介绍词云制作软件的帖子,之前我经常用的有Tagxedo,因为这是一个难得支持中文的网站。但是可能是浏览器或者其他原因,这个网站最近经常打不开,界面对我非常不友好,最后找到了一个新的实用网站:WordArt。
这个网站虽然也是全英文的,但是界面设计清晰一目了然,具体使用方法如下:
1.导入文本Import 。
将我们上一步中分词处理好的Excel文本直接复制粘贴进来就可以,记得勾选CSV format。Add按钮可以让你自主添加单独的词语。
2.选择图形SHAPE
随便选择一个自己喜欢的图案就好,如果没有喜欢的,也可以自己上传图片或者直接创建字符图片。
3.选择字体FONTS
结束上两步之后点击Visualize可能会发现——咦,为什么都是英文和数字?这是因为这个软件默认字库中没有中文,但是只要我们在FONTS上传一个中文字体,就可以正常显示了。
4.其他调整
到这里基本就已经制作完成啦~但是如果你对颜色和排列方式不满意,还可以通过LAYOUT和STYLE去进一步调整。
5.最后一步:下载!这个网站支持下载jpg和png双格式,希望图片更清晰的话,推荐大家选择png格式哦。如果注册登录这个网站的话,还可以将本次编辑保存下来,随时更改。
希望大家都可以做出漂亮的词云图~
文字+排版 | 王一宁
———END———
限 时 特 惠:本站每日持续更新海量各大内部创业教程,一年会员只需128元,全站资源免费下载点击查看详情
站 长 微 信:jiumai99