市面上有很多的分词方案和分词工具和软件,对于需求使用者,更在乎的是分词功能的准确性,因为使用分词的群体是需要做数据研究的,我调研了十几款产品并且拿了很多的数据进行多次测试,也和开发者沟通技术层面的细节,最终找到一款可以让不懂技术也可以安心使用的中文分词工具
强大的.中文分词词频统计工具
地址:www.weiciyun.com
支持白嫖!
1.一次支持20M及以下的文本分词量
我打开了一个1.9M的中文文本,大概有116.8万字左右。市面上最常见的分词软件支持“10万字”的中文文本,其实也就是几kb大小的文本而已,微词云的分词量就是他们的100倍了,基本上够大部分用户使用
2.支持自定义词典功能
文本的分出来的关键词是否准确,其实很吃词典的,懂的用户都知道这个道理,微词云在文本导入位置处,有自定义词典功能。
3.可以获得最大量的分词关键词结果
对于一些自然语言处理的用户来说,分出的单词数量是有要求了,每个词对他们的研究都有帮助。
4.多维度筛词
可以通过单词数过滤,单词词频、未知词以及词性等多维度筛词,尽可能的帮助用户筛出需要的词了
5.下载分词结果所有数据
微词云支持用户把分词结果到处到Excel中,让用户灵活的使用数据
6.词云图
微词云支持制作词频可视化效果词云图,可以根据词频显示大小
说了这么多的特点,接下来说下,如何操作使用呢?
微词云的左侧区域为【功能区】,我们主要使用【内容】功能
1.导入文本
进入左侧【内容】功能中,点击「导入单词」选择「分词筛词后导入」,把需要导入的文本复制粘贴到文本框中就行
2.使用自定义词典
可以把自定义词导入到右上角的自定义词典中,单词间用逗号隔开
3.底部配置设置
如果你不希望分词中出现单个词,可以勾选「去掉单个词」
如果希望文本分词中不出现未知词可以勾选「去掉未知词」,但是希望分词量尽可能的多,可以选择取消「去掉未知词」
如果希望分词结果尽可能的多,建议取消勾选「高频词」;勾选高频词,系统就只会「返还每行提取的单词数量」与「返回前多少个单词配置」相一致
配置好底部的设置后,点击右下角的【开始分词】就行了
3.筛词
可以根据词性来筛选需要保留的单词,自定义的单词在词性列表中会显示「自定义」
4.下载分词结果
点击右上角的红色按钮【下载分词结果】就可以下载一份很全的分词excel表格
5.制作词云图
最后筛词完成后,点击右下角底部的【确定使用所选单词】后,点击加载词云系统就可以生成一张词云图
您可以点击左侧功能配置,把第一行的计算模式改为「严格比例」这样词云图生成的大小就更接近词频数了
以上就是本篇文章【中文分词在线工具·专业好用】的全部内容了,欢迎阅览 ! 文章地址:http://lanlanwork.gawce.com/quote/8662.html 行业 资讯 企业新闻 行情 企业黄页 同类资讯 网站地图 返回首页 阁恬下移动站 http://lanlanwork.gawce.com/mobile/ , 查看更多