- 作者:韩信子@ShowMeAI
- 数据分析实战系列:http://www.showmeai.tech/tutorials/40
- 本文地址:http://www.showmeai.tech/article-detail/284
- 声明:版权所有,转载请联系平台与作者并注明出处
- 收藏ShowMeAI查看更多精彩内容
实际工作中,我们往往依托于业务数据分析制定业务策略。这个过程需要频繁地进行数据分析和挖掘,发现模式规律。对于算法工程师而言,一个有效的 AI 算法系统落地,不仅仅是模型这么简单——数据才是最底层的驱动。
典型的『机器学习工作流程』包含 6 个关键步骤,其中『探索性数据分析(Exploratory Data Analysis, EDA) 』是至关重要的一步。
- 定义问题
- 数据采集和 ETL
- 探索性数据分析
- 数据准备
- 建模(模型训练和选择)
- 部署和监控
Wiki: In statistics, exploratory data analysis is an approach of analyzing data sets to summarize their main characteristics, often using statistical graphics and other data visualization methods. A statistical model can be used or not, but primarily EDA is for seeing what the data can tell us beyond the formal modeling and thereby contrasts traditional hypothesis testing.
探索性数据分析,通常使用统计图形等数据可视化方法,探索数据的结构和规律,总结数据主要特征的方法。这一过程通常包含细碎的处理步骤和分析操作。
探索性数据分析 EDA 的常用工具
优秀的工具可以简化上述过程!甚至可以一键生成分析报告。本篇 ShowMeAI 给大家总结了截至 2022年 最受欢迎的探索式数据分析工具库,快一起试起来吧!
通常,我们有以下 3 种方式进行 EDA:
- 方式1:在 Python/R 中使用库/框架手动分析
- 方式2:在 Python/R 中使用自动化 EDA 库
- 方式3:使用 Microsoft Power BI 或 Tableau 等工具
3种方式对应的最佳工具库我们梳理到下文中了,对自动化数据分析感兴趣的同学可以直接跳至『自动化EDA工具库』板块。
方式1:手动分析工具库
原创文章,作者:3628473679,如若转载,请注明出处:https://blog.ytso.com/273853.html
原创文章,作者:3628473679,如若转载,请注明出处:https://blog.ytso.com/273853.html