特征提取(Feature Extraction)常见统计特征笔记(三)

news/2024/5/19 23:07:33

        统计特征是描述数据集中值的一组量,通常用于了解数据的分布、集中趋势和变异程度。常见的统计特征包括均值、中位数、众数、标准差、方差等。下面会详细解释每个统计特征,并给出相应的Python代码。

        1、均值(Mean):所有数据值的平均值。计算公式为:

        

        其中 𝑥𝑖是第 𝑖个数据值,是数据的总数。

def mean(data):return sum(data) / len(data)# Example
data = [1, 2, 3, 4, 5]
print("Mean:", mean(data))

        2、中位数(Median):将数据排序后位于中间位置的值,如果数据个数为奇数,则中位数为中间的值;如果为偶数,则为中间两个数的平均值。

def median(data):sorted_data = sorted(data)n = len(sorted_data)mid = n // 2if n % 2 == 0:return (sorted_data[mid - 1] + sorted_data[mid]) / 2else:return sorted_data[mid]# Example
data = [1, 2, 3, 4, 5]
print("Median:", median(data))

        3、众数(Mode):数据集中出现频率最高的值。一个数据集可能有一个或多个众数。

from collections import Counterdef mode(data):counts = Counter(data)max_count = max(counts.values())mode = [k for k, v in counts.items() if v == max_count]return mode# Example
data = [1, 2, 2, 3, 4, 4, 4, 5]
print("Mode:", mode(data))

        4、标准差(Standard Deviation):衡量数据集合中数据值的分散程度,标准差越大表示数据越分散。公式:

import mathdef standard_deviation(data):m = mean(data)variance = sum((x - m) ** 2 for x in data) / len(data)return math.sqrt(variance)# Example
data = [1, 2, 3, 4, 5]
print("Standard Deviation:", standard_deviation(data))

     5、方差(Variance):标准差的平方,表示数据分散程度的一个度量。

def variance(data):m = mean(data)return sum((x - m) ** 2 for x in data) / len(data)# Example
data = [1, 2, 3, 4, 5]
print("Variance:", variance(data))

        这些是常见的统计特征及其相应的Python实现。在实际应用中,可以根据数据的特点选择合适的统计特征来描述和分析数据。


http://www.mrgr.cn/p/38611316

相关文章

[智能网联汽车] 解读理想汽车的整车EEA电子电气架构 | 2020 [转]

0 序本文首发于华夏EV网、2020年。时至今日,这篇文章虽已过去了2年,今天的我们,对了解当前整车电子电气架构(EEA)的技术演进仍有一定的参考意义。 关键词:整车电子电气架构(EEA) 分布式架构 域集中式架构 中央集中式架构中央计算平台(CCU)导读 2020年,当我们谈论整车电子电…

DeepFilterNet复现

大概框架 有两路特征,一个ERB特征,另外一个是STFT之后的复数特征。 整体时延最低可达5ms。 这里提到的DeepFilter,其实就是说用神经网络对TF谱进行操作。因为这篇文章比较早,所以叫这么一个名字。ERB特征 ERB(Equivalent Rectangular Bandwidth)是一个与人耳听觉敏感性密…

geojson文件规格

geojson文件示例, {"type": "FeatureCollection","features": [{"type": "Feature","geometry": {"type": "Point","coordinates": [102.0, 0.5]},"properties&q…

【负载均衡在线OJ项目日记】项目简介

目录 前言 什么是负载均衡 所用的技术和开发环境 所用技术 开发环境 项目的宏观结构 leetcode 结构 结构 编写思路 前言 从C语言的文章到现在Linux网络部分,我已经涉猎了很多知识;终于在今天我要开始搞项目了,通过项目我也可以开始…

使用 docker-compose 部署 nexus

本篇博客主要介绍如何通过 docker-compose 快速搭建 nexus 服务,毕竟目前采用容器化部署是一件更加快速轻松的方案。 之前的博客已经介绍过 nexus 的搭建,以及为 IDEA 和 Visual Studio 提供代理服务,这里就不详细介绍了,提供出之前博客的链接。 nexus 在 windows 上的搭建…

简述Linux系统内核的作用

本文简述了Linux内核的5个子系统:进程调度(SCHED)、内存管理(MM)、虚拟文件系统(VFS)、网络接口(NET)和进程间通信(IPC)V 1.0 2024年5月7日 发布于博客园目录Linux内核的组成部分进程调度(SCHED)内存管理(MM)虚拟文件系统(VFS)网络接口(NET)进程间通信(IPC…

vue 实现项目进度甘特图

项目需求: 实现以1天、7天、30天为周期(周期根据筛选条件选择),展示每个项目不同里程碑任务进度。 项目在Vue-Gantt-chart: 使用Vue做数据控制的Gantt图表基础上进行了改造。 有需要的小伙伴也可以直接引入插件,自己…

Linux下GraspNet复现流程

Linux,Ubuntu中GraspNet复现流程 文章目录 Linux,Ubuntu中GraspNet复现流程1.安装cuda和cudnn2.安装pytorch3.编译graspnetAPIReference 🚀非常重要的环境配置🚀 ubuntu 20.04cuda 11.0.1cudnn v8.9.7python 3.8.19pytorch 1.7.0…

Spring SpringMVC概述

SpringMVC框架主要用于跟客户端交互,包括请求和响应。前端控制器的作用就是把一些功能封装,我们在开发时就不用再写一些繁杂的代码了 SpringMVC使用DispatcherServlet作为前端控制器,DispatcherServlet本质其实是一个Servlet原先我们在访问时,客户端发起请求直接找Servlet。…

做题速度太慢了,面不上

没办法,之前练了一个月的sql。两个月不写,现在差不多忘干净了。工作空窗期,或者休息期不能太久,不然学再多的内容都可能会忘完的。 sql题,腾讯四道sql题,限时45分钟完成。我只做了一道,还没做完…

Scanner中next()、nextInt()、nextLine()、hasNext()、hasNextInt()的使用方法及注意事项

目录 1、next()、nextInt()、nextLine()的使用方法及区分 2、循环时如何使用hasNext方法 3、用hasNextInt()作为判断下一个输入是否为数字需要配合next()方法使用 1、next()、nextInt()、nextLine()的使用方法及区分 三者简单定义 next():此方法遇见第一个有效字符…

物流行业新篇章:数字孪生系统助力仓储物流园区升级

在数字化浪潮的推动下,物流行业正迎来前所未有的变革,现代化仓储物流园区数字孪生系统正以其独特的魅力引领着物流行业迈向更加智能、高效的新时代。在数字化浪潮的推动下,物流行业正迎来前所未有的变革,现代化仓储物流园区数字孪生系统正以其独特的魅力引领着物流行业迈向…

IO一些基础必备知识点

IO编程 IO一些必备知识点 目录IO编程IO一些必备知识点①了解FAT32以及NTFS区别②了解MMU如何将虚拟地址与物理地址转换③请简述Linux内核的作用Linux内核是链接硬件和上层应用的桥梁,通过这个桥梁我们可以直接在上层完成对硬件的操作④Linux系统目录和文件夹的区别⑤库函数与系…

uniapp-ios支付

uniapp安卓包中的微信,支付宝逻辑放在iOS测试包中也能使用. 但询问iOS开发者后得知,有支付相关功能的app要上架苹果,必须先有苹果支付,不然苹果审核不给过.甚至没有支付逻辑,但打包时有支付相关的SDK也不行,苹果会认为你偷偷做了支付逻辑,想要绕开他. 一. 去苹果开发者后台把…

5.7总结

今天完成了五一极限测试最后一部分------将政策的分类用树状结构展示出来,执行对应的查询(其本质就是在条件查询的基础上,通过该组件按钮,多加了一个条件进行查询,其中还需要在分页功能上有所体现) 代码量:300 遇到的困难: ①不懂如何获取树形控件对应的key值(也就是在…

上传文件至linux服务器失败

目录 前言异常排查使用df -h命令查看磁盘使用情况使用du -h --max-depth1命令查找占用空间最大的文件夹 原因解决补充:删除文件后,磁盘空间无法得到释放 前言 使用XFTP工具上传文件至CentOS服务器失败 异常 排查 使用df -h命令查看磁盘使用情况 发现磁盘…

Tomcat简介

也就是说,将来我们在服务器端要安装一个Web服务器的软件,然后我们把我们自己写的Web项目放到服务器软件里边。服务器软件一启动起来,我们写的Web页面就可以被浏览器访问到

SaaS应用加速解决方案

随着企业业务的迅速扩展,SaaS应用成为企业提升办公效率的关键。然而,在SaaS应用广泛使用的同时,访问速度受限、网络拥堵等问题也逐渐浮现。为了解决这些挑战,SaaS应用加速方案应运而生,旨在助力企业高效运转&#xff0…

JVM笔记-常用命令

1、jstat jstat是一个极强的监视JVM的工具&#xff0c;可以用来监视JVM的各种堆和非堆的大小以及内存使用量。 Usage: jstat -help|-optionsjstat -<option> [-t] [-h<lines>] <vmid> [<interval> [<count>]]jstat的常用用法如图所示&#xff…

2024年五一数学建模C题完整解题思路代码

2024年第二十一届五一数学建模竞赛题目 C题 煤矿深部开采冲击地压危险预测 煤炭是中国的主要能源和重要的工业原料。然而&#xff0c;随着开采深度的增加&#xff0c;地应力增大&#xff0c;井下煤岩动力灾害风险越来越大&#xff0c;严重影响着煤矿的安全高效开采。在各类深…