这篇文章主要介绍“wordmesh特性有哪些”,在日常操作中,相信很多人在wordmesh特性有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”wordmesh特性有哪些”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
词云图相当于数据分析第一步-描述性统计。它能让我们更方便的从文本中抽取关键词,更好的把握文本的整体信息。
wordmesh使用spacy
包里预装的语言模型来构建文本特征、基于图的算法来提取关键字、多维缩放以将这些关键字放在画布上等。
wordmesh特性:
-
关键词抽取:除了基于词频的抽取方式,wordmesh还支持基于textrank、sgrank和bestcoverage的抽取方法。
-
词语聚类:可以基于语义相似性、共线性和其他属性,在画布上绘制词语
-
关键词过滤: 抽取的关键词可以基于该词语pos-tag或者命名实体过滤
-
字体颜色和字体大小:字体的大小和颜色可以基于词频、pos-tag(情感极性)等进行设置。
例子
这是力导向(force-directed)算法的可视化。 这些单词是使用《international law》教科书中的textrank提取的,并根据它们的共现频率在画布上组合在一起。 颜色表示单词的pos标签。
这个是史蒂夫乔布斯在斯坦福的毕业典礼演讲。关键字使用textrank提取,并根据其textrank得分进行聚类。字体颜色和字体大小也是textrank得分的函数。
这是来自相同的文本,不过这里是基于关键字的共现频率进行了聚类。 相同聚类词语使用相同的标准来指定颜色。从单词的位置可以看出这一点。 你可以看到像'hungry'和'foolish'这样的词汇被组合在一起,因为它们在文本中彼此接近,作为着名引语“Stay hungry. Stay foolish”的一部分。
到此,关于“wordmesh特性有哪些”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!
原创文章,作者:kirin,如若转载,请注明出处:https://blog.ytso.com/tech/opensource/220035.html