Qt-FFmpeg开发-音频解码为PCM文件（9）

2023年4月17日下午2:18 • C++

音视频/FFmpeg #Qt

Qt-FFmpeg开发-使用libavcodec API的音频解码示例（MP3转pcm）

音视频/FFmpeg #Qt
Qt-FFmpeg开发-使用libavcodec API的音频解码示例（MP3转pcm）

更多精彩内容
?个人内容分类汇总 ?
?音视频开发 ?

1、概述

最近研究了一下FFmpeg开发，功能实在是太强大了，网上ffmpeg3、4的文章还是很多的，但是学习嘛，最新的还是不能放过，就选了一个最新的ffmpeg n5.1.2版本，和3、4版本api变化还是挺大的；

这是一个libavcodec API示例；

这里主要是研究FFmpeg官方示例产生的一个程序，官方示例可以看Examples；

由于官方示例有一些小问题，编译没通过，并且是通过命令行执行，不方便，这里通过修改为使用Qt实现这个音频解码为PCM文件的示例。

开发环境说明

系统：Windows10、Ubuntu20.04
Qt版本：V5.12.5
编译器：MSVC2017-64、GCC/G++64
FFmpeg版本：n5.1.2
- 官方下载
- 我使用的库

2、实现效果

将.mp3文件解码转换为.pcm文件；（PCM数据时最原始的音频数据）；

使用Qt重新实现，方便操作，便于使用；

解决官方示例中解码失败程序会终止问题；

关键步骤加上详细注释，比官方示例更便于学习。

实现效果如下：

3、主要代码

啥也不说了，直接上代码，一切有注释

widget.h文件

#ifndef WIDGET_H
#define WIDGET_H

#include <QFile>
#include <QWidget>

QT_BEGIN_NAMESPACE
namespace Ui { class Widget; }
QT_END_NAMESPACE

struct AVCodecParserContext;
struct AVCodecContext;
struct AVCodec;
struct AVPacket;
struct AVFrame;

class Widget : public QWidget
{
    Q_OBJECT

public:
    Widget(QWidget *parent = nullptr);
    ~Widget();

private slots:

    void on_but_in_clicked();

    void on_but_out_clicked();

    void on_but_start_clicked();

private:
    int  initDecode();
    int  decode(QFile& fileOut);
    void showError(int err);
    void showLog(const QString& log);

private:
    Ui::Widget *ui;

    AVCodecParserContext*   m_parserContex  = nullptr;             // 裸流解析器
    AVCodecContext*         m_context       = nullptr;             // 解码器上下文
    const AVCodec*          m_codec         = nullptr;             // 音频解码器
    AVPacket*               m_packet        = nullptr;             // 未解码的原始数据
    AVFrame*                m_frame         = nullptr;             // 解码后的数据帧
};
#endif // WIDGET_H

widget.cpp文件

#include "widget.h"
#include "ui_widget.h"
#include <qfiledialog.h>
#include <QDebug>
#include <qthread.h>
#include <qtimer.h>

extern "C" {        // 用C规则编译指定的代码
#include <libavutil/frame.h>
#include <libavutil/mem.h>
#include <libavcodec/avcodec.h>
}

#define AUDIO_INBUF_SIZE 20480
#define AUDIO_REFILL_THRESH 4096

Widget::Widget(QWidget *parent)
    : QWidget(parent)
    , ui(new Ui::Widget)
{
    ui->setupUi(this);

    this->setWindowTitle(QString("使用libavcodec API的音频解码示例（mp3转pcm） V%1").arg(APP_VERSION));
}

Widget::~Widget()
{
    delete ui;
}

/**
 * @brief    自定义非阻塞延时
 * @param ms
 */
void msleep(int ms)
{
    QEventLoop loop;
    QTimer::singleShot(ms, &loop, SLOT(quit()));
    loop.exec();

}

void Widget::showLog(const QString &log)
{
    ui->textEdit->append(log);
}

/**
 * @brief        显示ffmpeg函数调用异常信息
 * @param err
 */
void Widget::showError(int err)
{
    static char m_error[1024];
    memset(m_error, 0, sizeof (m_error));        // 将数组置零
    av_strerror(err, m_error, sizeof (m_error));
    showLog(QString("Error：%1  %2").arg(err).arg(m_error));
}

/**
 * @brief 获取输入文件路径
 */
void Widget::on_but_in_clicked()
{
    QString strName = QFileDialog::getOpenFileName(this, "选择用于解码的.mp3音频文件~！", "/", "音频 (*.mp3);");
    if(strName.isEmpty())
    {
        return;
    }
    ui->line_fileIn->setText(strName);
}

/**
 * @brief 获取解码后的原始音频文件保存路径
 */
void Widget::on_but_out_clicked()
{
    QString strName = QFileDialog::getSaveFileName(this, "解码后数据保存到~！", "/", "原始音频 (*.pcm);");
    if(strName.isEmpty())
    {
        return;
    }
    ui->line_fileOut->setText(strName);
}

void Widget::on_but_start_clicked()
{
    int ret = initDecode();
    if(ret < 0)
    {
        showError(ret);
    }

    avcodec_free_context(&m_context);   // 释放编解码器上下文和与之相关的所有内容，并将NULL写入提供的指针。
    av_parser_close(m_parserContex);
    av_frame_free(&m_frame);
    av_packet_free(&m_packet);
}

QString get_format_from_sample_fmt(int fmt)
{
    typedef struct sample_fmt_entry {
        enum AVSampleFormat sample_fmt;
        QString fmt_be;          // 大端模式指令
        QString fmt_le;          // 小端模式指令
    }sample_fmt_entry;

    sample_fmt_entry sample_fmt_entryes[] = {
        { AV_SAMPLE_FMT_U8,  "u8",    "u8"    },
        { AV_SAMPLE_FMT_S16, "s16be", "s16le" },
        { AV_SAMPLE_FMT_S32, "s32be", "s32le" },
        { AV_SAMPLE_FMT_FLT, "f32be", "f32le" },
        { AV_SAMPLE_FMT_DBL, "f64be", "f64le" },
    };

    for(int i = 0; i < FF_ARRAY_ELEMS(sample_fmt_entryes); i++)
    {
        sample_fmt_entry entry = sample_fmt_entryes[i];
        if(fmt == entry.sample_fmt)
        {
            return AV_NE(entry.fmt_be, entry.fmt_le);   // AV_NE：判断大小端
        }
    }

    return QString();
}
/**
 * @brief   开始解码
 * @return
 */
int Widget::initDecode()
{
    QString strIn  = ui->line_fileIn->text();
    QString strOut = ui->line_fileOut->text();
    if(strIn.isEmpty() || strOut.isEmpty())
    {
        return AVERROR(ENOENT);        // 返回文件不存在的错误码
    }

    m_packet = av_packet_alloc();      // 创建一个AVPacket
    if(!m_packet)
    {
        return AVERROR(ENOMEM);        // 返回无法分配内存的错误码
    }

    m_frame = av_frame_alloc();      // 创建一个AVFrame
    if(!m_frame)
    {
        return AVERROR(ENOMEM);        // 返回无法分配内存的错误码
    }

    // 通过ID查询MPEG音频解码器
    m_codec = avcodec_find_decoder(AV_CODEC_ID_MP2);
    if(!m_codec)
    {
        return AVERROR(ENXIO);        // 找不到解码器
    }

    m_parserContex = av_parser_init(m_codec->id);
    if(!m_parserContex)
    {
        return AVERROR(ENOMEM);        // 解析器初始化失败
    }

    m_context = avcodec_alloc_context3(m_codec);  // 分配AVCodecContext并将其字段设置为默认值
    if(!m_context)
    {
        return AVERROR(ENOMEM);        // 解码器上下文创建失败
    }

    // 使用给定的AVCodec初始化AVCodecContext。
    int ret = avcodec_open2(m_context, m_codec, nullptr);
    if(ret < 0)
    {
        return ret;
    }

    // 打开输入文件
    QFile fileIn(strIn);
    if(!fileIn.open(QIODevice::ReadOnly))
    {
        return AVERROR(ENOENT);
    }
    // 打开输出文件
    QFile fileOut(strOut);
    if(!fileOut.open(QIODevice::WriteOnly))
    {
        return AVERROR(ENOENT);
    }

    showLog("开始解码！");
    msleep(1);
    QByteArray buf = fileIn.readAll();        // 读取所有数据
    char inbuf[AUDIO_INBUF_SIZE];
    while(buf.count() > 0)
    {
        int len = (buf.count() <= AUDIO_INBUF_SIZE) ? buf.count() : AUDIO_INBUF_SIZE;
        memcpy(inbuf, buf.data(), len);
        // 解析数据包
        ret = av_parser_parse2(m_parserContex, m_context, &m_packet->data, &m_packet->size,
                               reinterpret_cast<const uchar*>(inbuf),        // 这里不能直接使用buf.data(),否则会出现[mp2 @ 000001c8dbd40b00] Multiple frames in a packet.
                               len,
                               AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0);
        if(ret < 0)
        {
            break;
        }
        buf.remove(0, ret);  // 移除已解析的数据

        if(m_packet->size)
        {
            ret = decode(fileOut);
            if(ret < 0)
            {
//                return ret;
            }
        }
    }
    m_packet->data = nullptr;
    m_packet->size = 0;
    decode(fileOut);               // 需要传入空的数据帧才可以将解码器中所有数据读取出来

    enum AVSampleFormat sfmt = m_context->sample_fmt;
    // 检查样本格式是否为平面
    if(av_sample_fmt_is_planar(sfmt))
    {
        const char* name = av_get_sample_fmt_name(sfmt);  // 获取音频样本格式名称
        showLog(QString("警告：解码器生成的样本格式是平面格式（%1）。此示例将仅输出第一个通道。").arg(name));
        sfmt = av_get_packed_sample_fmt(sfmt);   // 获取样本格式的替代格式
    }

    // 音频通道数
#if FF_API_OLD_CHANNEL_LAYOUT
    int channels = m_context->channels;
#else
    int channels = m_context->ch_layout.nb_channels;
#endif
    QString strFmt = get_format_from_sample_fmt(sfmt);
    if(!strFmt.isEmpty())
    {
        showLog(QString("使用下列命令播放输出音频文件！\n"
                        "ffplay -f %1 -ac %2 -ar %3 %4\n")
                        .arg(strFmt).arg(channels)
                        .arg(m_context->sample_rate).arg(strOut));
    }

    return 0;
}

/**
 * @brief           解码并写入文件
 * @param fileOut
 * @return
 */
int Widget::decode(QFile &fileOut)
{
    // 将包含压缩数据的数据包发送到解码器
    int ret = avcodec_send_packet(m_context, m_packet);   // 注意：官方Demo中这里如果返回值<0则终止程序，由于数据中有mp3文件头，所以一开始会有返回值<0的情况

    // 读取所有输出帧（通常可以有任意数量的输出帧
    while (ret >= 0)
    {
        // 读取解码后的数据帧
        int ret = avcodec_receive_frame(m_context, m_frame);
        if(ret == AVERROR(EAGAIN)   // 资源暂时不可用
        || ret == AVERROR_EOF)      // 文件末尾
        {
            return 0;
        }
        else if(ret < 0)
        {
            return ret;
        }

        // 返回每个样本的字节数。例如格式为AV_SAMPLE_FMT_U8，则字节数为1字节
        int size = av_get_bytes_per_sample(m_context->sample_fmt);   // 返回值不会小于0
        for(int i = 0; i < m_frame->nb_samples; ++i)   // 音频样本数（采样率）
        {
#if FF_API_OLD_CHANNEL_LAYOUT
            for(int j = 0; j < m_context->channels; ++j)         // 5.1.2以后版本会弃用channels
#else
            for(int j = 0; j < m_context->ch_layout.nb_channels; ++j)
#endif
            {
                fileOut.write((const char*)(m_frame->data[j] + size * i), size);
            }
        }
    }
    return 0;
}

4、完整源代码

github
gitee

原文链接：https://www.cnblogs.com/IntelligencePointer/p/17299368.html

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Qt-FFmpeg开发-音频解码为PCM文件（9） - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

MordernC++之左值（引用）与右值（引用）

上一篇 2023年4月17日

Qt-FFmpeg开发-视频播放（5）

下一篇 2023年4月17日

Qt-FFmpeg开发-视频播放（5）

音视频/FFmpeg #Qt Qt-FFmpeg开发-视频播放【软/硬解码 + OpenGL显示YUV/NV12】目录音视频/FFmpeg #Qt Qt-FFmpeg开发-视频播放【软/硬解码 + OpenGL显示YUV/NV12】 1、概述 2、实现效果 3、FFmpeg硬解码流程 4、优化av_hwframe_transfer_data()性能低问题…

C++ 2023年4月17日
000
如何将 Spire.Doc for C++ 集成到 C++ 程序中

Spire.Doc for C++ 是一个专业的 Word 库，供开发人员在任何类型的 C++ 应用程序中阅读、创建、编辑、比较和转换 Word 文档。本文演示了如何以两种不同的方式将 Spire.Doc for C++ 集成到您的 C++ 应用程序中。通过 NuGet 安装 Spire.Doc for C++ 通过手动导入库安装 Spire.Doc f…

C++ 2023年4月27日
000
用C++编写一个简单的发布者和订阅者

摘要：节点（Node）是通过 ROS 图进行通信的可执行进程。本文分享自华为云社区《编写一个简单的发布者和订阅者》，作者： MAVER1CK 。 @[toc] 参考官方文档：Writing a simple publisher and subscriber (C++) 背景节点（Node）是通过 ROS 图进行通信的可执行进程。在本教程中，节点将通过话…

C++ 2023年4月27日
000
高效c语言1快速入门

本章将开发你的第一个C语言程序：传统的 “Hello, world!”程序。然后讨论一些编辑器和编译器的选项，并阐述移植性问题。 Hello, world! #include <stdio.h> #include <stdlib.h> int main(void) { puts(“Hello, world!”); return EXI…

C++ 2023年5月10日
000
第一部分：介绍 Spdlog 日志库

什么是 Spdlog 日志库 Spdlog 是一个 C++ 的日志库，它具有高效、易用、跨平台等特点。它可以写入到控制台、文件等输出目标，支持多种日志级别、多线程安全等功能，非常适合在 C++ 项目中使用。 Spdlog 日志库的历史和背景 Spdlog 日志库最初由 Gabi Melman 开发，它最初是为了解决 C++ 中的日志记录问题而创建的。在很长一…

C++ 2023年4月18日
000
【Visual Leak Detector】配置项 ForceIncludeModules

说明使用 VLD 内存泄漏检测工具辅助开发时整理的学习笔记。本篇介绍 VLD 配置文件中配置项 ForceIncludeModules 的使用方法。同系列文章目录可见《内存泄漏检测工具》目录目录说明 1. 配置文件使用说明 2. 设置需要检测的第三方模块 2.1 测试代码 2.2 ForceIncludeModules 为空时的输出 2.3 For…

C++ 2023年4月18日
000
NX二次开发：Checkmate例子根据dfa文件检查模型数据

NX中的checkmate功能是用于检查模型、图纸数据的工具，在UGOPEN中有例子。手动操作可以检查已加载的装配下所有零部件，可以设置通过后保存模型，检查结果保存到Teamcenter中，默认保存在零组件版本下。代码中可以设置多个检查规则。相关设置可以在用户默认设置中进行设置。 1 //============================= 2 //…

C++ 2023年4月18日
000
linux开发之gdb记录

简述 GDB, the GNU Project debugger, allows you to see what is going on ‘inside’ another program while it executes — or what another program was doing at the moment it crashed.GDB, G…

C++ 2023年4月17日
000

合作推广

合作推广

返回顶部