当前位置: 首页 > news >正文

FFmpeg-chapter3-读取视频流(原理篇)

ffmpeg网站:About FFmpeg

1 库介绍

(1)libavutil是一个包含简化编程函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。

(2)libavcodec是一个包含音频/视频编解码器的解码器和编码器的库。

(3)libavformat是一个包含多媒体容器格式的拆装器和拆装器的库。

(4)libavdevice是一个包含输入和输出设备的库,用于抓取和呈现许多常见的多媒体输入/输出软件框架,包括Video4Linux、Video4Linux2、VfW和ALSA。

(5)libavfilter是一个包含媒体过滤器的库。 libswscale是一个执行高度优化的图像缩放和色彩空间/像素格式转换操作的库。

(6)libswresample是一个执行高度优化的音频重采样,重矩阵和样本格式转换操作的库。

2 实现步骤

上面是主要用到的函数

(1)av_register_all(): 注册 FFmpeg 支持的所有解码器、编码器、格式等;

(2)avformat_network_init(): 初始化网络支持(如果需要从网络流中读取数据);

调用一次即可

(3)avformat_alloc_context(): 分配一个 AVFormatContext,它是 FFmpeg 中用于管理多媒体文件或流的核心结构。返回值是一个指向 AVFormatContext 的指针。

(4)avformat_open_input(): 打开一个输入文件或流,并将其信息加载到 AVFormatContext 中。这一步会解析文件格式(如 MP4、AVI 等),并为后续的流处理做准备。

(5)avformat_find_stream_info(): 获取输入文件或流的详细信息,包括音视频流的编码格式、帧率、分辨率等。这一步会填充 AVFormatContext 中的 AVStream 信息。

(6)av_read_frame(): 从输入文件或流中读取一帧数据。每次调用 av_read_frame() 会返回一个 AVPacket,它包含了一帧的编码数据。如果读取成功,继续处理帧数据;如果读取失败或到达文件末尾,则停止。

(7)AVPacket: 包含编码的帧数据(如压缩的视频或音频数据)。AVFrame: 包含解码后的帧数据(如解压缩后的视频或音频数据)。AVPacket 需要通过解码器(如 avcodec_send_packet()avcodec_receive_frame())解码为 AVFrame

(8)avformat_close_input(): 关闭输入文件或流,并释放相关资源。这一步会释放 AVFormatContext 中的所有流信息。

(9)avformat_free_context(): 释放 AVFormatContext 及其占用的内存。

总结:

(1)初始化 FFmpeg 环境。

(2)创建并初始化 AVFormatContext

(3)打开输入文件或流,获取流信息。

(4)循环读取帧数据(AVPacket),并通过解码器解码为 AVFrame

(5)处理解码后的帧数据(如播放、保存等)。

(6)关闭输入流并释放资源。

3 代码

使用VS新建cmake工程实现上述步骤:

(1)定义一个MMAVReader读取视频的类,在其构造函数中分配一个 AVFormatContext,析构函数中释放AVFormatContext 及其占用的内存;

avformat_alloc_context(): 分配一个 AVFormatContext,它是 FFmpeg 中用于管理多媒体文件或流的核心结构。返回值是一个指向 AVFormatContext 的指针。

avformat_free_context(): 释放 AVFormatContext 及其占用的内存。

(2)定义一个open函数打开视频流,并获取相关信息;定义一个close函数关闭视频流;

avformat_open_input(): 打开一个输入文件或流

avformat_find_stream_info(): 获取输入文件或流的详细信息

avformat_close_input(): 关闭输入文件或流

(3)定义一个read函数读取每一帧视频

av_read_frame(): 从输入文件或流中读取一帧数据。

(4) 具体代码在这里:MMAVPlayer/chapter3 at main · StudyWinter/MMAVPlayer · GitHub

这里重新封装了AVPacket和AVFormatContext

(5)主函数实现分配、打开、读取、关闭、释放流程。

参考:

ffmpeg 4.22库文件:GitCode - 全球开发者的开源社区,开源代码托管平台


http://www.mrgr.cn/news/92773.html

相关文章:

  • 自然语言处理:词频-逆文档频率
  • 驱动开发系列40 - Linux 显卡驱动KMD代码分析(一) - 设备初始化过程
  • C++ 的编译和链接
  • 寒假刷题Day26
  • Spring Web MVC
  • RNN实现精神分裂症患者诊断(pytorch)
  • 2025年2月文章一览
  • FloodFill 算法(典型算法思想)—— OJ例题算法解析思路
  • Windows安装sql server2017
  • 深度学习的正则化深入探讨
  • 基于SSM实现的bbs论坛系统功能实现八
  • 数据集笔记:新加坡 一些交通的时间序列统计量
  • 聊聊Java的SPI机制
  • 高频面试题(含笔试高频算法整理)基本总结回顾3
  • 稀疏数组学习
  • 3 算法1-4 过河卒
  • 2025-03-01 学习记录--C/C++-PTA 7-35 有理数均值
  • 如何使用 Jenkins 实现 CI/CD 流水线:从零开始搭建自动化部署流程
  • C/C++:conan包管理工具的使用
  • 音乐游戏Drummania(GITADORA)模拟器