如何利用Python中的Pandas库绘制柱形图

人气:137 ℃/2023-07-28 08:07:00

我们利用Python的Pandas库可以绘制很多图形,那么如何绘制柱形图呢?下面小编给大家分享演示一下。

工具/材料

Pycharm

操作方法

首先我们打开Excel文件,准备要生成柱形图的数据表,如下图所示

接下来在Python文件中导入pandas库,然后将Excel文件加载到缓存对象中,如下图所示

然后我们导入matplotlib下面的pyplot库,如下图所示,导入以后给它起一个别名

接下来我们通过pandas库下面的bar来设置柱形图的X,Y坐标轴,如下图所示

然后通过pyplot的show方法将柱形图进行展示出来,如下图所示

接下来运行程序以后我们就看到柱形图生成出来了,如下图所示

然后如果我们想将柱形图中的数据排序的话可以利用sort_values实现,如下图所示

最后运行排序好后的程序,我们就可以看到柱形图中的数据已经排序好了,如下图所示

python做可视化用pandas

Python的Pandas库技巧,让你成为数据处理高手!

Pandas是一个开源的数据分析工具,在Python环境中广泛应用于数据处理、数据清洗、数据分析和数据可视化等领域。它提供了两个主要的数据结构:Series和DataFrame。

Series

Series是Pandas中的一维标记数组,类似于一维数组或列。

示例代码如下:

import pandas as pddata = [1, 3, 5, np.NaN, 6, 8]s = pd.Series(data)print(s)

输出结果为:

0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64DataFrame

DataFrame是Pandas中的二维数据结构,类似于数据库中的表。

示例代码如下:

import pandas as pddata = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 25, 30], 'City': ['New York', 'Paris', 'London']}df = pd.DataFrame(data)print(df)

输出结果为:

Name Age City0 Tom 20 New York1 Nick 25 Paris2 John 30 London

接下来,我将介绍一些Pandas库中常用的功能和方法:

数据读取和写入:

Pandas提供了各种函数用于读取和写入常见的数据格式,如CSV、Excel、SQL数据库、JSON等。

示例代码如下:

import pandas as pd# 从CSV文件读取数据df_csv = pd.read_csv('data.csv')# 将数据写入CSV文件df.to_csv('data.csv', index=False)# 从Excel文件读取数据df_excel = pd.read_excel('data.xlsx')# 将数据写入Excel文件df.to_excel('data.xlsx', index=False)数据清洗:

Pandas提供了强大的数据清洗功能,可以处理缺失值、重复值、异常值等。

示例代码如下:

import pandas as pd# 处理缺失值df.dropna() # 删除包含缺失值的行df.fillna(value) # 用指定值或统计量填充缺失值# 处理重复值df.drop_duplicates() # 删除重复行# 处理异常值df[(df['Age'] > 0) & (df['Age'] < 100)] # 筛选满足条件的行数据筛选和索引

Pandas提供了灵活的筛选和索引方式,可以通过条件、标签、位置等方式对数据进行访问和操作。

示例代码如下:

import pandas as pd# 通过标签筛选df.loc[df['Age'] > 20, ['Name', 'City']]# 通过位置筛选df.iloc[0:5, 1:3]# 通过条件筛选df[df['City'].isin(['New York', 'London'])]数据聚合和分组

Pandas支持对数据进行聚合和分组分析,可以方便地计算统计量、透视表、分组计算等。

示例代码如下:

import pandas as pd# 计算统计量df.mean() # 计算每列的平均值df.groupby('City').mean() # 按城市分组计算平均值# 透视表pd.pivot_table(df, values='Age', index='Name', columns='City', aggfunc='mean')# 分组计算df.groupby('City').agg({'Age': 'mean', 'Salary': 'sum'})

数据可视化

Pandas内置了Matplotlib库,可以方便地进行数据可视化,绘制各种类型的图表。

示例代码如下:

import pandas as pdimport matplotlib.pyplot as plt# 绘制折线图df.plot(x='Date', y='Price', kind='line')# 绘制柱状图df.plot(x='Category', y='Count', kind='bar')# 绘制散点图df.plot(x='Height', y='Weight', kind='scatter')# 绘制箱线图df.plot(y='Score', kind='box')# 绘制饼图df['Category'].value_counts().plot(kind='pie')plt.show()

综上所述,Pandas是一个功能强大且易用的数据分析库,具备数据读取、清洗、筛选、聚合、可视化等功能,适用于各种数据处理和分析场景。通过Pandas库,您可以更轻松高效地处理和分析数据,从而做出更准确的数据驱动决策。

推荐

首页/电脑版/网名
© 2025 NiBaKu.Com All Rights Reserved.