截至3.12,新型冠状病毒在中国已感染8万多人。幸运的是,中国靠严格的政策控制了疫情,湖北以外的新增病例接近零。
但由于旅游造成的人口流动,日韩疫情却在恶化。截至3.12,韩国已确诊7513例,死亡54例。欧美的情况更严重。
相信大家一定很关心疫情的变化,但是面对海量的互联网数据,我们往往找不到自己最关心的数据。而且我们在得到数据的时候,无法很好的处理比较,无法挖掘出数据的价值。
如何解决这个问题?数据可视化是一种很好的方式。相信大家一定很熟悉各种信息平台推出的新冠肺炎数据仪表盘。仪表盘可以包含多维数据,并以地图、图表等形式显示数据,让你更清楚地了解数据的变化。
你有没有想过你可以很轻松的做出这样的仪表盘?有兴趣的话,这篇文章会一步一步的教你数据提取、数据清理和数据可视化。
在这里,我们使用Octoparse来潦草地写数据,使用FineReport来制作仪表盘。
由FineReport制作
数据提取
我们使用的工具是Octoparse,这是一个非常简单的数据抓取工具,有很多模板可以直接使用。不需要编写复杂的代码就可以轻松获取数据,操作非常简单。可以通过拖动和点击来完成。你可以在这里http://www.dataextraction.io/?p=396看到详细的指南。
我们只需要3个步骤:
第1步:通过输入URL来构建一个刮板任务
第2步:点击提取web数据
第3步:执行刮板任务
首先,我们选择“高级模式”,将目标链接粘贴到Octoparse中,保存URL,然后可以在内置浏览器中打开网站。
其次,单击其中一个表,Octoparse将识别相应的内容。此时识别了单个表格列,但我们需要识别表格的所有内容,所以我们需要转到“操作提示”端并单击“扩展选择区域”。这样,该列中所有需要的内容都会被选中。
然后单击“选择所有子元素”-“全选”来标识整个表单。
最后但同样重要的是,点击“开始提取”。
单击切换按钮查看提取过程。当我们完成提取数据时,我们可以导出到excel格式,并使用它来创建地图可视化。
数据清理
由于我们收集的数据字段没有被修改,有些数据会影响可视化,我们需要进行一些简单的数据清理。这一步对于可视化至关重要,不能轻易忽略。
我们将“字段1、文件2、字段3”更改为相应的已确认、死亡、隔离,并删除了一些无用的数据。
数据清理是整个流程中非常关键的一步。由于这次的数据量很小,不需要太多时间,但是如果遇到非常大的数据量,就需要很长时间。
仪表盘中的数据可视化
这里我们用FineReport做一个韩国新冠肺炎仪表盘。可能只需要十分钟,很神奇吧?
我会一步步教你怎么做这个仪表盘,你可以下载https://www.finereport.com/product/download到这里和我一起练习!
数据连接
首先,我们需要连接刚刚收集的数据。FineReport支持多种数据库
点击“加号”按钮,选择“文件”,选择我们刚刚采集的Excel文件,记得进行预览,检查数据的准确性,然后点击“确定”,数据已经导入!
设计和制作图表你的仪表盘需要
接下来是设计这个仪表盘,我们需要制作一个地图图表、一个气泡图、一个折线图和一些新闻通知。借助FineReport,你可以通过拖放轻松制作19个类别。我们这里用地图图表作为例子。
首先,单击菜单上的“插入”按钮,选择“插入图表”,插入一个地图图表。FineReport中内置了许多国家地图,你可以选择你需要的。
接下来,我们需要将excel数据与地图上的每个位置相关联,并设置要显示的字段。
最后,我们可以修改颜色,使其与整个仪表盘更加兼容。
按照这个过程,我们可以制作其他图表,最终得到这个仪表盘!
数据可以通过前端导入或API更新。此处显示的是3.12更新的韩国数据。转盘图可以显示每个城市的确认和死亡数据。折线图可以将历史数据实时更新为当前数据。泡泡图可以显示哪个城市受影响最大。从超链接中,我们可以看到一些关于新冠肺炎的最新消息。
结论
虽然冠状病毒已经传播到世界各地的许多国家,但只要采取严格的防控措施,人们一定能战胜这场灾难。
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/173648.html