推广 热搜:   服务  系统    公司  行业  中国  教师  企业  参数 

中文分词在线工具·专业好用

   日期:2024-11-19     浏览:78    移动:http://lanlanwork.gawce.com/mobile/quote/8662.html

市面上有很多的分词方案和分词工具和软件,对于需求使用者,更在乎的是分词功能的准确性,因为使用分词的群体是需要做数据研究的,我调研了十几款产品并且拿了很多的数据进行多次测试,也和开发者沟通技术层面的细节,最终找到一款可以让不懂技术也可以安心使用的中文分词工具

中文分词在线工具·专业好用

强大的.中文分词词频统计工具

地址:www.weiciyun.com

支持白嫖!

1.一次支持20M及以下的文本分词量

我打开了一个1.9M的中文文本,大概有116.8万字左右。市面上最常见的分词软件支持“10万字”的中文文本,其实也就是几kb大小的文本而已,微词云的分词量就是他们的100倍了,基本上够大部分用户使用

2.支持自定义词典功能

文本的分出来的关键词是否准确,其实很吃词典的,懂的用户都知道这个道理,微词云在文本导入位置处,有自定义词典功能。

3.可以获得最大量的分词关键词结果

对于一些自然语言处理的用户来说,分出的单词数量是有要求了,每个词对他们的研究都有帮助。

4.多维度筛词

可以通过单词数过滤,单词词频、未知词以及词性等多维度筛词,尽可能的帮助用户筛出需要的词了

5.下载分词结果所有数据

微词云支持用户把分词结果到处到Excel中,让用户灵活的使用数据

6.词云图

微词云支持制作词频可视化效果词云图,可以根据词频显示大小

说了这么多的特点,接下来说下,如何操作使用呢?

微词云的左侧区域为【功能区】,我们主要使用【内容】功能

1.导入文本

进入左侧【内容】功能中,点击「导入单词」选择「分词筛词后导入」,把需要导入的文本复制粘贴到文本框中就行

2.使用自定义词典

可以把自定义词导入到右上角的自定义词典中,单词间用逗号隔开

3.底部配置设置

如果你不希望分词中出现单个词,可以勾选「去掉单个词」

如果希望文本分词中不出现未知词可以勾选「去掉未知词」,但是希望分词量尽可能的多,可以选择取消「去掉未知词」

如果希望分词结果尽可能的多,建议取消勾选「高频词」;勾选高频词,系统就只会「返还每行提取的单词数量」与「返回前多少个单词配置」相一致

配置好底部的设置后,点击右下角的【开始分词】就行了

3.筛词

可以根据词性来筛选需要保留的单词,自定义的单词在词性列表中会显示「自定义」

4.下载分词结果

点击右上角的红色按钮【下载分词结果】就可以下载一份很全的分词excel表格

5.制作词云图

最后筛词完成后,点击右下角底部的【确定使用所选单词】后,点击加载词云系统就可以生成一张词云图

您可以点击左侧功能配置,把第一行的计算模式改为「严格比例」这样词云图生成的大小就更接近词频数了

本文地址:http://lanlanwork.gawce.com/quote/8662.html    阁恬下 http://lanlanwork.gawce.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号