有了前面 seaborn
的基础, 这里对它进行一些深入介绍, 并分析在什么时候应该使用什么图.
seaborn 本身建立在 Matplotlib 之上, 它自己也有低级方法和高级方法. 低级方法直接使用 Matplotlib 操作数值数据, 范畴数据和回归. 高级方法调用低级方法绘图, 可以更快速的画图. 如果想要更多的画图自主性, 那么还是要用低级方法. 当然, 最高的自主性就是直接使用 Matplotlib, 但是比较费事.
在这个 Seaborn 简介中,将学习如何使用 Python 最方便的库之一来进行数据可视化。
对于那些曾经使用过 Matplotlib 的人来说,你可能想知道,为什么需要10行代码才能制作出像样的直方图?
如果你正在寻找一个更简单的方式来绘制有吸引力的图表,那么你会爱上 Seaborn。
有了 Matplotlib
画图,数据展示方便了很多。但是如果想更方便呢?可以使用 Pandas
的画图功能, 直接 df.plot()
即可. plot
方法其实就是 plt.plot()
的包装而已.
DataFrame 是表示型的数据结构,每一行就是一个记录,每一列是一个变量。简单说,DataFrame 是共享同一个 index 的 Series 集合。
Series, 由一列数据及对应的标签(索引)组成,本质上就是 Numpy 数组. 每个 Series 对象实际上由两个数组组成, 具有 index 和 values 两个属性.
Matplotlib可能会是你从Matlab转向Python进行学习心得的决定因素,因为它与Jupyter结合真的是太好用了。它不仅带给你快速可视化数据的方法,还提供高质量的图表。
为了使用Matplotlib,在Jupyter笔记本所有代码之前,加一句%matplotlib inline
,就可以开始使用了。