如何进行探索性数据分析

admin 2025-08-25 阅读:70 评论:0
一般数据分析项目第一步都需要探索性数据分析。主要包括三个方面: 通过上述三个方面分析,可以在执行假设检验或统计模型之前对数据集的分布情况有基本理解whatsapp登录,并检测获得问题数据情况。 下面通过示例说明探索性数据分析,并给出Pyth...

一般数据分析项目第一步都需要探索性数据分析。主要包括三个方面:

通过上述三个方面分析,可以在执行假设检验或统计模型之前对数据集的分布情况有基本理解whatsapp登录,并检测获得问题数据情况。

下面通过示例说明探索性数据分析,并给出Python代码实现。

准备示例数据

首先创建pandas数据框:

import pandas as pd
import numpy as np
#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, np.nan, 9, 12]})

通过head()函数查看前五行数据:

df.head()
# 	team	points	assists	rebounds
# 0	A	18	5	11.0
# 1	A	22	7	8.0
# 2	A	19	7	10.0
# 3	A	14	9	6.0
# 4	B	14	12	6.0

查看数据概况

使用describe() 函数可以快速查看每个数值变量的概况:

df.describe()
#       points	    assists 	rebounds
# count	8.0000000	8.00000 	7.000000
# mean	18.250000	7.75000 	8.857143
# std	5.3652320	2.54951 	2.340126
# min	11.000000	4.00000 	6.000000
# 25%	14.000000	6.50000 	7.000000
# 50%	18.500000	8.00000 	9.000000
# 75%	20.500000	9.00000 	10.50000
# max	28.000000	12.0000     12.00000

每个数值变量的信息说明:

count: 非缺失值数量

std: 均值

min: T最小值

25%: 第一四分位值 (前25%)

50%: 中位数 (前50%)

75%: 第三四分位值 (前75%)

max: 最大值

对于类别变量,可以使用value_counts获得每个值的频数:

df['team'].value_counts()
# A    4
# B    4
# Name: team, dtype: int64

通过输出可以看到:

A: 共出现4次.

B: 共出现4次.

通过shape属性可以获得数据框的维度:即行数和列数:

df.shape
# (8, 4)

数据可视化

下面通过可视化方式了解数据集。举例telegram中文版,pandas的hist()函数创建每个数值变量的直方图:

每个直方图的x轴现实每个值,y轴现实值的频数。

import matplotlib.pyplot as plt
df.hist(grid=False, edgecolor='black')
plt.show()

在这里插入图片描述

我们还可以使用pandas的boxplot()函数创建箱线图:

# 创建每个变量的箱线图
df.boxplot(grid=False)

上面代码在一张图上展示多个变量的箱线图。但有时因单位不同,需要单独对每个变量画箱线图:

df['points'].plot(kind='box')
# 或下面语法
df.boxplot(column='points', grid=False)

在这里插入图片描述

也可以使用pandas的corr函数创建协方差矩阵:

df.corr()
#          points	  assists	 rebounds
# points	1.000000	-0.725841	 0.767007
# assists	-0.725841	 1.000000	-0.882046
# rebounds  0.767007	-0.882046	 1.000000

识别缺失值

下面代码统计所有缺失值:

df.isnull().sum()
# team        0
# points      0
# assists     0
# rebounds    1
# dtype: int64

输出显示仅rebounds变量一个缺失值,其他列没有缺失值。

总结

经过上面步骤whatsapp网页版,我们基本已经完成了该数据集的基本探索性数据分析,并且较好地理解了数据集中每个变量值的如何分布情况。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

3502文章数 0评论数
热门文章
  • 详细指南:WhatsApp国内使用方法全攻略-下载安装、注册登录及功能使用攻略

    详细指南:WhatsApp国内使用方法全攻略-下载安装、注册登录及功能使用攻略
    一、下载与安装WhatsApp WhatsApp是一款全球使用范围极广的即时通讯软件,不仅可以实现文本聊天,还能进行语音、视频通话WhatsApp中文版,发送文件等功能。由于众所周知的原因,国内用户想要下载和安装WhatsApp可能会遇到一些困难。不过,只要按照以下步骤操作,就能顺利完成WhatsApp的下载和安装。 首先,我们需要解决的是下载问题。由于WhatsApp在国内的应用商店无法直接下载,所以我们需要寻找其他的下载途径。Android用户可以选择到各大安卓市场搜索下...
  • 苹果IOS5.1.1机完美越狱

    苹果IOS5.1.1机完美越狱
    越狱工具下载:(需手动复制: http://bbs./read-htm-tid-4804612.html ) 详细的越狱教程: Absinthe 2.0.4的越狱方法与Absinthe 1.0的越狱方法完全一样,非常简单的“傻瓜一键式”。不过这里绿毒有说明,最好重新刷固件。支持越狱设备IOS5.1.1的固件下载地址请点击本站的IOS固件下载,看下图: 下载完固件之后,把设备连接iTunes,开始刷固件。你也可以选择不刷,但是在越狱的过程之中,新的系统在越狱时会比较的顺利,...
  • 电脑微信的聊天照片文件在哪里微信图片保存电脑哪个文件夹

    电脑微信的聊天照片文件在哪里微信图片保存电脑哪个文件夹
    1. 怎么找到微信聊天图片在哪个文件夹里 图片保存路径:/storage/emulated/tencent/MicroMsg/WeiXin/文件夹,这个是完整路径。而在文件夹中只需要找到/tencent/MicroMsg/WeiXinWhatsApp中文版,就可以了,前面两个文件夹是系统根目录。以下是保存及查找图片的方法步骤介绍。 第一步、找到桌面的微信APP,直接点击打开这个微信的APP。 2. 电脑微信图片保存在哪个文件夹 个人微信文件夹。 电脑版微信聊天的图片,都保存到...
  • Windows 11版WhatsApp将从UWP/Native切换回WebView2打包模式

    Windows 11版WhatsApp将从UWP/Native切换回WebView2打包模式
    Meta(最近更名为 Meta AI)悄然宣布,WhatsApp 将在 Windows 11 上放弃 UWP(WinUI)WhatsApp中文版,退回采用基于 Chromium 的容器。这意味着 WhatsApp 又回到了几年前的样子。由于 web.whatsapp.com 一直领先于 Windows 应用开发,它确实拥有一些新功能,但速度更慢,占用更多内存。 如果独立开发者因为无力维护所有平台的代码库而选择 Web 应用程序,那是一回事,但当像 Meta 这样价值万亿美元...
  • 小米下載WhatsApp的完整指南:安装与使用注意事项

    小米下載WhatsApp的完整指南:安装与使用注意事项
    综上所述,确保您的小米手机具备以上条件,将有助于您顺利下载和安装WhatsApp,享受便捷的通讯服务。在满足这些条件后,您就可以按照后续步骤进行WhatsApp的下载和安装。 2. 下载和安装WhatsApp的具体步骤 在小米手机上下载和安装WhatsApp的具体步骤相对简单,但需注意一些特殊情况。首先,确保你的手机系统已更新到最新版本,以保证最佳的兼容性。由于安卓手机商店内无法直接找到WhatsApp,你可以通过APKPure等第三方应用商店进行下载。打开APKPure应用...