为什么我们需要数据可视化?
如果你想成为数据分析师,掌握数据可视化技能至关重要,因为在大多数情况下,老板更关心所呈现的结果。
此外,当可视化结果呈现在你的眼前时,你可以直观地体验“数据之美”。就内容表达而言,图片远胜于文字,它不仅可以反映数据的真实性,还可以带给人们很多想象力。
数据可视化的观点是什么?
我们有十多种常用的可视化视图,包括文本表、地图、饼图、水平条、堆叠条、树视图、散点图、直方图、甘特图、散点图、气泡图等。
来自Google
当然,你不仅必须掌握这些视图的用法,还必须了解它们的目的。在这里,我将它们分为以下9种情况:
在上述情况下,你可能想查看某些数据的分布、或随时间的趋势。因此,在设计之前,要考虑要向用户呈现的内容、突出显示数据的哪些特征,以及用于呈现的视图。
例如,如果要显示变量的分布,可以以直方图的形式显示,而如果要查看两个变量之间的相关性和分布,可以使用散点图。
视图可能具有多种表达目的。例如,散点图既可以显示两个变量之间的关系,又可以反映它们的分布。同样,如果我想查看变量的分布,可以使用散点图或直方图。
因此,要使用哪种视图取决于数据可视化的目的。
什么是数据可视化工具?
那么如何使数据进入上述视图呢?我们需要使用数据可视化工具。
这些工具多,我将从多个角度为你介绍。
FineReport是针对个人用户的完全免费的软件,从可视化报告到仪表盘,都可以轻松完成。它在许多行业中都有专业的解决方案,操作也非常容易。FineReport可以实时连接到业务数据并及时显示它们。
Tableau具有强大的可视化和灵活分析功能,其主要用户是专业数据分析师。同时,Tableau是商业软件,收费昂贵,需要一定的数据基础。
前端可视化组件
可视化组件基于Web渲染技术。因此,需要了解一些典型的Web渲染技术:Canvas、SVG和WebGL。简单来说,Canvas和SVG是HTML5中的主要2D图形技术,而WebGL是3D框架。
画布适用于位图,也就是说,它可以为你提供白板,你需要自己绘制点,画布可以绘制复杂的动画。但是,它随HTML5一起提供,因此较旧的浏览器不支持Canvas。ECharts是基于Canvas的可视组件。
SVG使用XML格式定义图形,等效于使用点和线绘制图形。与位图相比,该文件相对较小,任何缩放比例都不会失真。SVG通常用于图标和图表,它的最大特点是它支持大多数浏览器,并且动态交互非常容易实现,例如在SVG中插入动画元素。
WebGL是一种3D绘图协议,可以在Web浏览器中呈现3D图片技术,并且可以与用户进行交互。你在网页上看到的许多很酷的3D效果基本上都是使用WebGL渲染的。下面介绍的Three.js基于WebGL框架。
了解了这些Web渲染协议之后,让我看一下这些常见的可视化组件:Echarts、D3和Three.js。
ECharts是基于H5 canvas的Javascript图表库,它已被许多人更新和使用。作为一个组件,它可以与Python Web框架(例如Django,Flask)结合使用。
D3的全名是“数据驱动的文档”。简单来说,它是一个JavaScript函数库,文件扩展名通常是“.js”,所以D3也使用D3.js来调用它。
它提供了各种易于使用的功能,大大简化了使用JavaScript处理数据的难度,只需要输入一些简单的数据即可转换为各种精美的图形。
顾名思义,Three.js表示Three + JS。“Three”表示3D,“ Three.js”是使用JavaScript来实现3D效果。Three.js是一个WebGL框架,它封装了许多WebGL接口,因此上手起来很容易。
程式语言
使用数据分析工具,必须学习Python的,当然也有一些人使用[R 。使用Python和R进行数据分析时,必须使用可视化部分。
让我简要介绍如何使用Python和R进行数据可视化。
Python中包含许多可视化库,例如Matplotlib、Seaborn、Bokeh、Plotly、Pyecharts、Mapbox和Geoplotlib,最常用的是Matplotlib和Seaborn。
Matplotlib是Python的基本可视化库,绘图样式类似于MATLAB,因此称为Matplotlib。通常,从Matplotlib开始学习Python数据可视化,然后再学习其他Python可视化库。
下图是我用Matplotlib制作的雷达图。
Seaborn是基于Matplotlib的高级可视化库,它具有Matplotlib的更高级的软件包,可简化映射。你可以使用代码来绘制多维数据可视化效果,例如以下示例:
在R中,还有许多可视化库可供选择,其中包括R随附的图形包以及工具包ggplot2,ggmap,timevis和plotly。
其中,ggplot2是R语言中重要的绘图软件包,该工具包将数据与绘图操作分开。所述ggplot库也被引入的Python,以便ggplot也可以容易地在使用的Python。稍作修改,就可以直接在Python中运行。
结论
今天介绍了数据可视化的观点,还有当前的主流数据可视化工具。FineReport对个人用户完全免费,并且可以制作非常酷的大屏幕,如果你使用编程语言进行数据分析和数据可视化,那么Python和R语言也是不错的选择。
BI 可视化
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/173657.html