数据可视化——清晰地传达您的结果


数据可视化——清晰地传达您的结果

在本文中,我将讨论数据可视化并重点介绍 Python 中可用的工具,因为它是该主题上拥有最多种类库的语言。

数据可视化——清晰地传达您的结果

Photo by KOBU代理商 on 不飞溅

近年来数据可视化变得如此流行是有原因的:它们可以很容易地查看数据中的模式和趋势,如果数据以表格或列表的形式呈现,这些模式和趋势将难以发现。数据可视化可以帮助您 现场相关性 ,了解如何 不同的因素相关 ,看看如何 一个变量的变化会影响其他变量 .

关于数据可视化的最好的事情之一是它们可以 定制以适合您正在使用的数据 .有多种不同类型的数据可视化,每一种都旨在突出数据的不同方面。一些最常见的数据可视化类型是条形图、折线图、饼图和散点图。

每种类型的数据可视化都有其自身的优势和劣势。例如, 条形图 有利于比较不同的值,而 线 图表 有利于跟踪随时间的变化。 饼状图 有利于比较整体的各个部分,而 散点图 非常适合表示定量变量之间的相关性。

创建数据可视化时,请务必牢记以下几点:

数据应该易于理解和解释。

可视化应该是可视化的 吸引人的引人入胜 .数据应准确可靠。有许多在线工具和库可以帮助您创建数据可视化,也有许多关于该主题的书籍和文章。一本可以改变你交流数据方式的书是 给我看数字 从斯蒂芬很少。

现在让我们回顾一下可能对数据可视化的创建和分发产生重大影响的一些 Python 库和框架……

经典 Python 库

有许多不同的 Python 绘图库可供选择,但其中三个最受欢迎的是 Matplotlib、Seaborn 和 Plotly。这三个都有自己的长处和短处,因此很难决定使用哪一个。

Matplotlib 是三个图书馆中最古老和最受欢迎的。它具有大量的功能,可用于各种复杂的情节。但是,它的界面可能有点混乱,而且要按照您想要的方式获取所有内容可能会很棘手。

海博恩 **** 是一个建立在 Matplotlib 之上的库。它具有更简单、更直观的界面,旨在轻松创建精美、高质量的绘图。但是,它没有 Matplotlib 那么多的功能。

情节 **** 是建立在 D3.js 之上的较新的库。它比 Matplotlib 更容易使用,并且生成的图更清晰、更简洁。但是,Plotly 不像 Matplotlib 那样功能丰富。

牵牛星 是一个建立在之上的统计可视化库 织女星 这是一种 JSON 格式的可视化语言。它是创建各种可视化的简单工具,但不如 Matplotlib 和 Seaborn 完整。

让我们用这些库的多个示例来看看它们之间的区别。

为此,我将我的可视化基于代表 快乐星球指数 这是世界每个国家福祉和环境影响的指数。我拿到 数据 从使用的示例数据集 勒克斯 库,它是一个 python 模块,用于创建一个非常完整和快速的可视化系列。

作为基准数据可视化,我选择用每个国家的人均国内生产总值来表示生态足迹,并按国家的地区进行着色。

这是使用创建的散点图 Matplotlib

数据可视化——清晰地传达您的结果

这是来自 海博恩

数据可视化——清晰地传达您的结果

它在那里 栅栏

数据可视化——清晰地传达您的结果

最后,与 牵牛星

数据可视化——清晰地传达您的结果

您可以发现每个之间的差异,但没有更好的库,因为它取决于您需要什么。如果你需要 很多功能灵活性 , 与 Matplotlib 或者 海博恩 .如果你需要什么 便于使用干净的 , 与 情节 或者 牵牛星。

现在我们发现了一些用于创建数据可视化的顶级库,让我们看看允许构建的工具 仪表板 或者 Web应用程序 包括各种数据即和许多功能。

Web 应用程序/仪表板框架

使用简单的 Web 应用程序展示模型的结果对于希望清楚地传达模型如何工作和执行的数据科学家来说是一个关键优势。

感谢一些非常好的库和框​​架,这不再需要知道如何处理 CSS 和 HTML(或几乎)。

我要介绍的第一个框架是 短跑 这是一个由 Plotly 创建的开源库,用于设计任何类型的 Web 应用程序。

Dash 利用 Flask 和 React 的强大功能,让它们为可能不是专业 Web 程序员的 Python 数据科学家工作( 介绍 Dash )。

这是一个使用构建的 Web 应用程序的示例 短跑

数据可视化——清晰地传达您的结果

From Dash 的 Github

Dash 是一个可靠的框架,但另一个框架在 2018 年左右问世,彻底改变了构建和部署仪表板的方式, 流光 .

Streamlit 很棒,因为集成数据和绘图以及在网页中添加任何组件非常简单(只要 Streamlit 提供它)。

以下是使用 Streamlit 构建的 Web 应用程序示例:

数据可视化——清晰地传达您的结果

From Streamlit 的 Github

最后一个框架适用于不希望被迫使用独特的方式来创建仪表板中包含的数据并寻找更灵活的数据的数据科学家。的确, 控制板 , 由…制作 霍洛维兹 ,允许在创建 Web 应用程序时有很大的自由度,这使得它非常有吸引力。

以下是使用 Panel 构建的 Web 应用程序示例:

数据可视化——清晰地传达您的结果

From 投资组合优化器示例

奖金 – 数据窗格

数据窗格 是一个 Python 库和在线平台,用于构建交互式仪表板或报告并在一分钟内共享它们。每份报告都是在创建它的个人的帐户上发布的,这在不使用任何云服务的情况下非常棒。

这是一个使用简单仪表板的示例 牵牛星 设计地块和 数据窗格 把它们放在一起:

显示不完美,这里是完整的 报告 .

如果您想试用 Datapane,您可以先注册 这里 和以下 这个 谷歌 Colab 笔记本。

结论

数据可视化是数据科学家的重要工具。它使他们能够看到数据中难以在原始数据中看到的模式和趋势。任何可视化都可以帮助数据科学家 识别新假设并对其进行检验 .也可以帮助他们 交流他们的发现 给别人。

Matplotlib, Seaborn, Plotly牵牛星 是很棒的库,可以构建独特的图并从数据集中查看见解。如果目标是拥有一个包含许多数据可视化的完整报告,那么框架如 破折号,流光,面板 或者 数据窗格 非常适合这个。

感谢您阅读本文,我希望您发现了一些新工具并了解数据可视化为何如此有用!如果您对数据科学和机器学习感兴趣,请查看我的文章 这里 .

[

Mlearning.ai 提交建议

如何成为 Mlearning.ai 上的作家

媒体网

](/mlearning-ai/mlearning-ai-submission-suggestions-b51e2b130bfb)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/18558/23180609

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/287950.html

(0)
上一篇 2022年9月6日
下一篇 2022年9月6日

相关推荐

发表回复

登录后才能评论