python常用数据挖掘工具

导读	python有强大的第三方库，广泛用于数据分析，数据挖掘、机器学习等领域，下面小编整理了python数据挖掘的一些常用库，希望对各位小伙伴学习python数据挖掘有所帮助。

python常用数据挖掘工具

1. Numpy

能够提供数组支持，进行矢量运算，并且高效地处理函数，线性代数处理等。提供真正的数组，比起python内置列表来说， Numpy速度更快。同时，Scipy、Matplotlib、Pandas等库都是源于 Numpy。因为 Numpy内置函数处理数据速度与C语言同一级别，建议使用时尽量用内置函数。

2. Scipy

基于Numpy,能够提供了真正的矩阵支持，以及大量基于矩阵的数值计算模块，包括：插值运算，线性代数、图像信号，快速傅里叶变换、优化处理、常微分方程求解等。

3. Pandas

源于NumPy，提供强大的数据读写功能，支持类似SQL的增删改查，数据处理函数非常丰富，并且支持时间序列分析功能，灵活地对数据进行分析与探索，是python数据挖掘，必不可少的工具。

Pandas基本数据结构是Series和DataFrame。Series是序列，类似一维数组，DataFrame相当于一张二维表格，类似二维数组，DataFrame的每一列都是一个Series。

4. Matplotlib

数据可视化最常用，也是醉好用的工具之一，python中著名的绘图库，主要用于2维作图，只需简单几行代码可以生成各式的图表，例如直方图，条形图，散点图等，也可以进行简单的3维绘图。

5. Scikit-Learn

Scikit-Learn源于NumPy、Scipy和Matplotlib，是一款功能强大的机器学习python库，能够提供完整的学习工具箱(数据处理，回归，分类，聚类，预测，模型分析等)，使用起来简单。不足是没有提供神经网络，以及深度学习等模型。

6. Keras

基于Theano的一款深度学习python库，不仅能够用来搭建普通神经网络，还能建各种深度学习模型，例如：自编码器、循环神经网络、递归神经网络、卷积神经网络等，重要的是，运行速度几块，对搭建各种神经网络模型的步骤进行简化，能够允许普通用户，轻松地搭建几百个输入节点的深层神经网络，定制程度也非常高。

7. Genism

Genism主要用来处理语言方面的任务，如文本相似度计算、LDA、Word2Vec等。

8. TensorFlow

google开源的数值计算框架，采用数据流图的方式，可灵活搭建深度学习模型。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/132275.html