Python数据分析工具

Numpy

​ 提供数组以及对数组的运算,后面的Scipy、Matplotlib、Pandas依赖这个库。运算效率是C语言级别的。

Scipy

​ 提供矩阵及运算,以及最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解。

Matplotlib

​ 数据可视化、绘图。

Pandas

​ Python最强大的数据分析和探索工具。

StatsModel

​ 数据的统计建模分析。

Scikit-learn

​ 机器学习工具包。包括数据预处理、分类、回归、聚类、预测和模型分析。依赖于Numpy、SciPy、Matplotlib。

Keras

​ 搭建神经网络等深度学习模型,是一个强大的深度学习库。依赖于Numpy、Scipy和Theano(也是一个深度学习库,不过门槛高,Keras为此而生)。

Gensim

​ 处理语言方面的任务,如文本相似度计算等。