当前位置: 首页 > news >正文

Python进阶(十一)】—— Pandas和Seaborn可视化

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972

   个人介绍: 研一|统计学|干货分享
         擅长Python、Matlab、R等主流编程软件
         累计十余项国家级比赛奖项,参与研究经费10w、40w级横向

文章目录

  • 1 Pandas和Seaborn可视化
  • 2 Pandas可视化
  • 3 Seaborn可视化
    • 3.1 折线图
    • 3.2 核密度图
    • 3.3 散点图矩阵
    • 3.4 联合分布图
    • 3.5 直方图

【Python进阶(十一)】—— Pandas和Seaborn可视化,建议收藏!


该篇文章主要讲解了Python的Pandas和Seaborn可视化,通过实例演示对Pandas和Seaborn绘图方法进行熟悉,演示了常见绘图图形:折线图、核密度图等,同时部分图形进行美化。

1 Pandas和Seaborn可视化

  上一节我们演示了Matplotlib基础可视化,这一节,我们将进一步探索Python中另外两个强大的可视化工具:Pandas和Seaborn,它们各自在数据处理和美化图表方面有着独特的优势。

Pandas绘图的优势:

  1. 集成性:Pandas的绘图功能紧密集成在其DataFrame和Series对象上,使得数据分析和可视化可以无缝衔接。用户可以直接在数据处理后,利用Pandas的绘图函数快速生成图表,无需将数据转换到其他可视化库中。
  2. 便捷性:Pandas提供了多种快速生成图表的函数,如.plot(), .hist(), .boxplot()等,这些函数默认参数就能满足大部分基础需求,同时也支持高度自定义,以满足复杂的数据可视化需求。
  3. 灵活性:Pandas的绘图功能基于matplotlib构建,因此用户可以轻松地将matplotlib的样式和功能应用到Pandas生成的图表上,实现图表的美化和功能的扩展。
  4. 数据驱动的绘图:Pandas的绘图功能是基于数据的,它会自动处理数据索引、标签等,使得绘图过程更加直观和方便。用户无需手动设置图表的x轴、y轴标签等,这些都会根据DataFrame或Series的索引和列名自动生成。

Seaborn绘图的优势:

  1. 统计绘图:Seaborn是一个基于matplotlib的高级绘图库,它提供了更多面向统计学的绘图功能,如分布图、关系图、时间序列图等。这些功能使得Seaborn特别适合用于数据分析和统计建模的可视化。
  2. 美化效果:Seaborn通过提供丰富的样式和颜色主题,以及自动调整图表的美学参数(如字体大小、颜色搭配等),使得生成的图表更加美观和具有吸引力。这有助于在报告和演示中更好地展示数据。
  3. 集成性:尽管Seaborn是基于matplotlib构建的,但它提供了更高级别的接口,使得用户可以用更少的代码实现更复杂的数据可视化。同时,Seaborn也支持与Pandas的DataFrame对象直接交互,进一步增强了其集成性和便捷性。
  4. 数据探索:Seaborn的绘图功能特别适合用于数据探索,它可以帮助用户快速发现数据中的模式和关系。通过生成各种统计图表,用户可以直观地了解数据的分布情况、相关性等,从而为后续的数据分析和建模提供有力支持。

  综上所述,Pandas和Seaborn在绘图方面各有优势,Pandas更适合于快速生成基础图表和数据处理后的即时可视化,而Seaborn则更适合于统计绘图、数据探索和生成美观的图表。在实际应用中,用户可以根据具体需求选择适合的库进行可视化操作。

2 Pandas可视化

  运行程序:

import pandas as pd 
women = pd.read_csv('women.csv',index_col =0)  
women.plot(kind="bar")#柱状图
plt.show()women.plot(kind="barh") #横向柱状图
plt.show() women.plot(kind="bar",x="height",y="weight",color="g") #横轴为身高,纵轴为体重,颜色为g
plt.show()women.plot(kind="kde")#核密度估计曲线
plt.show()women.plot(kind="bar",x="height",y="weight",color="g") 
plt.legend(loc="best")#图例位置为“最优”
plt.show()

  运行结果:

3 Seaborn可视化

3.1 折线图

  运行程序:

#导入包
import matplotlib.pyplot as plt 
plt.style.use("classic")
%matplotlib inline#数据准备
import numpy as np
import pandas as pd
rng= np.random.RandomState(0)
x=np.linspace(0,10,500) 
y=np.cumsum(rng.randn(500,6),0) #计算各行数组累加值
plt.plot(x,y)
plt.legend("abcded",ncol=2,loc="upper left")

  运行结果:

  运行程序:

import seaborn as sns#seaborn绘图更加美观
sns.set()
plt.plot(x,y)
plt.legend("abcdef",ncol=2,loc="upper left")#设置图例参数;ncol:图例列数

  运行结果:

3.2 核密度图

  运行程序:

sns.kdeplot(women.height, shade=True) #核密度估计图  

  运行结果:

  运行程序:

sns.distplot(women.height)#displot图:直方图+kdeplot图

  运行结果:

3.3 散点图矩阵

  运行程序:

sns.pairplot(women)  #绘制散点图矩阵

  运行结果:

3.4 联合分布图

  运行程序:

sns.jointplot(women.height,women.weight,kind="reg")#联合分布图

  运行结果:

  运行程序:

with sns.axes_style("white"):sns.jointplot(women.height,women.weight,kind="reg")#加入with语句,使设置更美观

  运行结果:

3.5 直方图

  运行程序:

for x in ["height","weight"]:plt.hist(women[x],normed=True,alpha=0.5)#利用循环绘制直方图

  运行结果:


http://www.mrgr.cn/news/14300.html

相关文章:

  • Spring--三级缓存机制
  • 1.4 输入缓冲区相关的笔记
  • RocketMQ集群搭建,及RocketMQ-Dashboard部署(前RocketMQ-Console)
  • Java09 异常
  • Java的内存管理机制
  • OpenCV 图像处理基础算法介绍c++
  • USB端点
  • 云服务器在媒体处理中的应用有哪些
  • zsh 添加 用户@主机 路径显示
  • 遍历结果的推导
  • 迷雾大陆攻略:VMOS云手机流派辅助和技能加持助力!
  • 什么是云原生?
  • 易企秀Html5场景秀系统源码 海量模版可以选择 带源代码包以及搭建部署教程
  • python------python解释器,pycharm下载配置
  • 基于SpringBoot的在线答疑系统
  • 【系统分析师】-缓存
  • Spring概述
  • vue3 element-plus el-table 多层级表头动态渲染。
  • Android 12系统源码_输入系统(二)InputManagerService服务
  • C++领进门(第三讲)