数据可视化是数据科学流程中的一个关键步骤。Python 在图形化表示数据方面提供了很多可能性,但创建合适的图表可能很困难且耗时。
Python 图表库 为此提供帮助。它展示了许多示例,并始终提供可复现的代码,让你可以在几分钟内构建所需的图表。
约 400 个图表,分为 40 个类别#
该图表库目前提供超过 400 个图表示例。这些示例被组织到 40 个类别中,每个类别代表一种图表类型:散点图、箱线图、条形图、树状图 等等。这些图表类型被组织到 7 个大类中,正如 data-to-viz.com 所建议的那样:每个大类代表一个可视化目的。
需要注意的是,该图表库不仅涵盖最常见的图表类型,还包括一些不太为人所知的图表,比如 弦图、流图 或 气泡地图。
掌握基础知识#
每个类别都从一些非常基本的示例开始,让你可以在几秒钟内理解如何构建一种图表类型。希望通过在另一个数据集上应用相同的技术,你将可以非常快速地完成构建。
例如,散点图 类别从这个 matplotlib 示例开始。它展示了如何使用 pandas 创建数据集,并使用 plot()
函数进行绘图。主要图形参数(如 linestyle
和 marker
)都已描述清楚,以确保代码可理解。
Matplotlib 自定义#
该图表库使用了一些库,比如 seaborn 或 plotly 来生成图表,但主要关注 matplotlib。Matplotlib 具有很高的灵活性,可以让你毫无限制地构建任何类型的图表。
一个 完整页面 专用于 matplotlib。它描述了如何解决一些常见问题,比如自定义 轴 或 标题,添加 注释(见下图)甚至使用 自定义字体。
该图表库还包含许多非简单的示例。例如,它有一个 教程,解释了如何使用 matplotlib 构建流图。它基于 stackplot()
函数,并对其进行了一些平滑处理。
最后但并非最不重要的一点是,该图表库还展示了一些可用于出版物的图表。这些图表通常涉及很多 matplotlib 代码,但展示了对绘图的细粒度控制。
以下是一个示例,该示例的帖子灵感来自 Tuo Wang 为 tidyTuesday 项目完成的作品。(从 R 翻译的代码可在 此处 获取)
贡献#
Python 图表库是一个不断发展的项目。它是开源的,其所有相关代码都托管在 github 上。
非常欢迎您为该图表库做出贡献。每个博客文章只是一个 jupyter 笔记本,因此建议可以通过问题或拉取请求非常轻松地进行!
结论#
Python 图表库 是 Yan Holtz 在业余时间开发的项目。它可以帮助你在使用 Python 进行数据可视化时提升你的技术技能。
该图表库属于一个教育性网站生态系统。Data to viz 描述了数据可视化方面的最佳实践,R、python 和 d3.js 图表库为使用 3 个最常用工具构建图表提供了技术帮助。
如有任何关于该项目的问题,请在 Twitter 上联系 @R_Graph_Gallery!