数据可视化是数据科学流程中的一个关键步骤。Python 在图形化表示数据方面提供了很多可能性,但创建合适的图表可能很困难且耗时。

Python 图表库 为此提供帮助。它展示了许多示例,并始终提供可复现的代码,让你可以在几分钟内构建所需的图表。

约 400 个图表,分为 40 个类别#

该图表库目前提供超过 400 个图表示例。这些示例被组织到 40 个类别中,每个类别代表一种图表类型:散点图箱线图条形图树状图 等等。这些图表类型被组织到 7 个大类中,正如 data-to-viz.com 所建议的那样:每个大类代表一个可视化目的。

需要注意的是,该图表库不仅涵盖最常见的图表类型,还包括一些不太为人所知的图表,比如 弦图流图气泡地图

overview of the python graph gallery sections

掌握基础知识#

每个类别都从一些非常基本的示例开始,让你可以在几秒钟内理解如何构建一种图表类型。希望通过在另一个数据集上应用相同的技术,你将可以非常快速地完成构建。

例如,散点图 类别从这个 matplotlib 示例开始。它展示了如何使用 pandas 创建数据集,并使用 plot() 函数进行绘图。主要图形参数(如 linestylemarker)都已描述清楚,以确保代码可理解。

博客文章概述:

a basic scatterplot example

Matplotlib 自定义#

该图表库使用了一些库,比如 seabornplotly 来生成图表,但主要关注 matplotlib。Matplotlib 具有很高的灵活性,可以让你毫无限制地构建任何类型的图表。

一个 完整页面 专用于 matplotlib。它描述了如何解决一些常见问题,比如自定义 标题,添加 注释(见下图)甚至使用 自定义字体

annotation examples

该图表库还包含许多非简单的示例。例如,它有一个 教程,解释了如何使用 matplotlib 构建流图。它基于 stackplot() 函数,并对其进行了一些平滑处理。

stream chart with python and matplotlib

最后但并非最不重要的一点是,该图表库还展示了一些可用于出版物的图表。这些图表通常涉及很多 matplotlib 代码,但展示了对绘图的细粒度控制。

以下是一个示例,该示例的帖子灵感来自 Tuo Wang 为 tidyTuesday 项目完成的作品。(从 R 翻译的代码可在 此处 获取)

python violin and boxplot example

贡献#

Python 图表库是一个不断发展的项目。它是开源的,其所有相关代码都托管在 github 上。

非常欢迎您为该图表库做出贡献。每个博客文章只是一个 jupyter 笔记本,因此建议可以通过问题或拉取请求非常轻松地进行!

结论#

Python 图表库Yan Holtz 在业余时间开发的项目。它可以帮助你在使用 Python 进行数据可视化时提升你的技术技能。

该图表库属于一个教育性网站生态系统。Data to viz 描述了数据可视化方面的最佳实践,Rpythond3.js 图表库为使用 3 个最常用工具构建图表提供了技术帮助。

如有任何关于该项目的问题,请在 Twitter 上联系 @R_Graph_Gallery