在 Python 的 Seaborn 库中可视化折线图
让我们讨论在 Seaborn 中创建折线图的不同可视化技术。
Seaborn 是 Python 中最流行的可视化工具之一。
它受欢迎的主要原因是在一行代码中创建复杂图表的简单性。
当我们在 python 中谈论折线图时,有很多方法可以创建一个简单的折线图。在 seaborn 中,我们有一个名为 line plot 的快速函数。
第一步是在我们当前的环境中安装 seaborn。
如果您使用的是 Anaconda,您可以使用以下命令(在 anaconda.org 中提到):
conda install -c anaconda seaborn
否则,下一个选项是使用 pypi.org 中提到的命令,即
点安装seaborn
安装完成后,下一步是使用以下命令导入seaborn库:
将 seaborn 导入为 sns
这里,“sns”是简写,也称为seaborn的别名,即,只要我们在代码中看到“sns”,就可以推断出我们正在使用seaborn库。
要查看一些图,让我们在我们的环境中加载一些数据。
我们将使用 Seaborn 库的内置数据集。最初,我们不知道哪些数据集已经可供我们使用。
要获取数据集名称列表,我们可以使用 seaborn 的 .get_dataset_names() 方法。
Image by Author
上面的命令为我们提供了可用于分析的 22 个数据集的列表。
让我们选择道琼斯数据集并创建一个线图。
我们使用“load_dataset()”方法并将信息读入名为 df 的数据帧中。
Image by Author
现在让我们使用 head 方法检查前五行数据。
Image by Author
我们观察到我们有日期和价格列。
让我们绘制不同日期对应的价格折线图。
我们运行以下命令:
Image by Author
在这里,我们指定 x 轴将包含日期,y 轴将包含价格。
data 参数将通知 seaborn 数据位置。
在这里,我们看到生成的图在 x 轴上具有误导性,即日期都重叠为一个,因为我们只能看到一条粗黑线。
让我们检查列的数据类型并在需要时进行一些预处理。
我们将使用 info() 方法来检查数据类型。或者,我们可以使用“dtypes”属性来检查数据类型。
df.info() 或 df.dtypes
Image by Author
我们看到 date 是一个字符串对象。让我们导入 pandas 库并使用 to_datetime() 方法来更正数据类型。
将熊猫导入为 pd
正如前面讨论的别名一样,这里的“pd”是 pandas 的别名,也就是 seaborn 的“sns”。
使用 to_datetime(),我们可以将字符串转换为正确的日期时间对象。
我们运行以下命令:
df[‘Date’] = pd.to_datetime(df[‘Date’])
在这里,我们将日期列转换为日期时间对象,然后将其重新分配回日期列。
完成转换后,让我们将日期格式化为“%Y-%m-%d”。
我将使用 matplotlib 库来调整图表大小。
因此,让我们将 matplotlib 添加到库导入部分。
Image by Author
这里我们将使用 matplotlib 的 pyplot 组件。
Image by Author
让我们逐行分解代码并理解它。
在第一行中,我们声明了一个名为“fig”的图形和一个名为“ax”的轴。
将图形视为一张空白纸,我们可以在其中绘制一些东西。
在第二行中,我们使用 line plot 命令。
接下来,我们将日期时间对象格式化为年、月和日。接下来,我们将它旋转 45 度,这样日期就不会重叠。
最后,我们使用 plt.显示()方法。
所有步骤组合生成以下输出。
Line Chart (Image by Author)
以上是seaborn中折线图的简单示例。
让我们考虑另一个数据集并检查线图函数最常用的参数。
让我们将企鹅的数据集用于下一组示例。
我们将使用前面显示的相同命令用企鹅的数据覆盖道琼斯数据。
df = sns.load_dataset(‘企鹅’)
在这里,让我们绘制纸币长度和纸币深度。为了区分企鹅的类型,让我们使用 ‘hue’ 参数根据企鹅种类为数据点着色。
sns.lineplot(x = ‘bill_length_mm’, y=’bill_depth_mm’, data=df, hue=’species’)
从图中我们可以看出,每个物种的颜色都不同。
Image by Author
因此,hue 参数帮助我们根据另一列分离数据。
接下来,我们有 ‘style’ 参数表示不同数据点的不同虚线。
Image by Author
在上图中,虚线是根据岛屿绘制的。
接下来,我们有“调色板”参数,它是调色板的缩写,用于更改图表颜色。
到目前为止,我们一直在使用 seaborn 提供的默认颜色。如果我们想改变生成图表的颜色组合,我们可以使用调色板参数。
我使用的一种技术是给调色板参数一个随机字符串,执行命令并检查错误块。 Seaborn 将告知我们参数的可接受值。
在下图中,您可以看到我给了一个随机字符串“abc”,Python 生成了一个值错误,其中包含调色板参数的所有有效选项
Image by Author
我正在为调色板选择“Gnuplot”选项。
Image by Author
您可以尝试所有可能的颜色选项,并为未来的情节挑选一些最喜欢的颜色。
最后,我们有了线宽,它允许我们修改在图形表面上绘制的图表线的粗细。
要使线宽加倍,我们需要使用参数“lw”,它是线宽的缩写。
Image by Author
默认情况下,线宽为1,可以根据需要增加或减少,即传入整数为double、triple等,或者使用0.5、0.8等浮点数使线更细。
直到下一次!
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
本文链接:https://www.qanswer.top/29392/24011200
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/288914.html