CANN开发实践:4个DVPP内存问题的典型案例解读

yizhihongxing

摘要:由于DVPP媒体数据处理功能对存放输入、输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,那么本期就分享几个关于DVPP内存问题的典型案例,并给出原因分析及解决方法。

本文分享自华为云社区《FAQ_DVPP内存问题案例》,作者:昇腾CANN。

DVPP是昇腾AI处理器内置的图像处理单元,通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力,主要功能包括图像编解码、视频编解码、图像抠图缩放等。

由于媒体数据处理功能对存放输入、输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,那么本期就分享几个关于DVPP内存问题的典型案例,并给出原因分析及解决方法:

  1. 使用错误的DVPP内存申请接口,导致应用程序报错并退出
  2. 内存大小不符合DVPP的要求,导致应用程序报错并退出
  3. DVPP内存被提前释放,导致视频流解码输出的图像异常
  4. DVPP读/写内存地址无效,导致应用程序异常中断

01 使用错误的DVPP内存申请接口,导致应用程序报错并退出

现象描述

从日志存放路径(默认为“$HOME/ascend/log”)下获取运行应用程序的日志,日志中的报错示例如下:

device:0 chn 0, input buffer is invalid, make sure it has been allocated with hi_mpi_dvpp_malloc or acldvppMalloc.

 

device:0 chn 0, output buffer is invalid, make sure it has been allocated with hi_mpi_dvpp_malloc or acldvppMalloc.

可能原因

根据日志提示,是因为没有使用指定的接口申请内存,导致内存地址校验出错。

由于DVPP媒体数据处理功能对存放输入、输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,如下:

  • 调用媒体数据处理V1版本的接口对图片进行抠图、缩放等操作时,调用acldvppMalloc接口申请内存。
  • 调用媒体数据处理V2版本的接口对图片进行抠图、缩放等操作时,调用hi_mpi_dvpp_malloc接口申请内存。

处理步骤

检查代码,确认在DVPP媒体数据处理的各功能中,是否使用acldvppMalloc接口/ hi_mpi_dvpp_malloc接口申请存放输入或输出数据的Device内存。

但需注意:

  • 可将DVPP媒体数据处理的输出作为模型推理的输入,从性能角度,减少拷贝,实现内存复用。
  • 由于DVPP媒体数据处理访问的专用地址空间有限,为确保媒体数据处理时内存足够,除媒体数据处理功能外,其它使用Device内存的功能,建议调用aclrtMalloc接口申请内存。

02 内存大小不符合DVPP的要求,导致应用程序报错并退出

现象描述

从日志存放路径(默认为“$HOME/ascend/log”)下获取运行应用程序的日志,日志中的报错示例如下:

buffer size(3110400) is smaller than need buffer size(4147200) when format is 3.

 

device 0, vpc end address is illegal, check allocated buffer size: configured buffer size: 3110400, current pic: format 3 width_stride 1920 height_stride 1080.

可能原因

虽然使用了正确的DVPP内存申请接口,但:

  • 代码中申请的内存大小小于该格式所需的输入或输出内存大小;
  • 或者传入接口的内存大小正常,与输入格式也匹配,但是超出了实际申请的内存大小,所以校验出来结束地址非法。

处理步骤

1. 进入昇腾文档中心(https://www.hiascend.com/zh/document),拖动到“推理”区域,通过API参考进入最新版本的文档(或者可以在左上方选择需要的版本),在媒体数据处理章节,根据DVPP各功能对内存大小的要求,检查代码中对应格式的内存大小是否正确;

2. 在代码中增加打印内存长度的日志,检查传入接口的内存大小是否与实际申请的内存大小一致。

03 DVPP内存被提前释放,导致视频流解码输出的图像异常

现象描述

原始H264/H265每一帧视频流正常,解码过程无异常(无异常日志),仅输出图片有异常。

可能原因

解码过程无异常,说明送入的视频码流不是异常码流,仅输出被破坏,可能由于:

  • 输出内存被复用、被踩或者被提前释放;
  • 解码需要的输出内存比实际申请的内存大。

处理步骤

  1. 对于DVPP内存申请接口,增加日志打印内存大小及地址,检查VDEC输出内存,检查申请的内存大小是否与实际使用的一致,比如典型的错误场景,VDEC解码输出格式预期是RGB,实际仍按照YUV420SP申请内存。
  2. 在DVPP内存释放接口处、以及hi_mpi_vdec_get_frame/aclvdecCallback/acldvppJpegDecodeAsync接口处,增加内存大小及地址的打印日志,确认内存释放时序,是否存在内存地址解码完成前被提前释放的情况。

04 DVPP读/写内存地址无效,导致应用程序异常中断

现象描述

从日志存放路径(默认为“$HOME/ascend/log”)下获取运行应用程序的日志,Device侧内核态日志报错图像处理模块异常,报错示例如下:

vpc get err int: vpc_cvdr_axi_rd_resp_err

 

vpc get err int: vpc_cvdr_axi_wr_resp_err

可能原因

  • cvdr_axi_rd_resp_err:表示读地址越界,可能申请的输入内存太小或内存地址无效,昇腾AI处理器执行读操作时访问到了无效地址。
  • cvdr_axi_wr_resp_err:表示写地址越界,可能申请的输出内存太小或内存地址无效,昇腾AI处理器执行写操作时访问到了无效地址。

处理步骤

1. 在申请DVPP内存的接口处、以及在异常任务接口处增加日志打印,检查申请的输入\输出内存大小与实际使用的输入\输出内存大小是否一致;

2. 在释放DVPP内存的接口处增加打印日志,检查任务完成之前是否存在内存被提前释放的情况。

05 更多介绍

[1]昇腾文档中心

[2]昇腾社区在线课程

[3]昇腾论坛

 

点击关注,第一时间了解华为云新鲜技术~

原文链接:https://www.cnblogs.com/huaweiyun/p/17333559.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:CANN开发实践:4个DVPP内存问题的典型案例解读 - Python技术站

(0)
上一篇 2023年4月19日
下一篇 2023年4月19日

相关文章

  • caffe之(二)pooling层

    在caffe中,网络的结构由prototxt文件中给出,由一些列的Layer(层)组成,常用的层如:数据加载层、卷积操作层、pooling层、非线性变换层、内积运算层、归一化层、损失计算层等;本篇主要介绍pooling层 1. Pooling层总述 下面首先给出pooling层的结构设置的一个小例子(定义在.prototxt文件中)  layer { nam…

    Caffe 2023年4月8日
    00
  • python数据分析&挖掘,机器学习环境配置

    目录 一.什么是数据分析 1.这里引用网上的定义: 2.数据分析发展与组成 3.特点 二.python数据分析环境及各类常用分析包配置 1.处理的数据类型 2.为什么选择python 三.python数据分析环境安装 1.Ipython (1)简介 (2)安装方法如下 2.Jupyter (1)简介 (2)安装 3.Anaconda安装器 (1)简介 (2)…

    机器学习 2023年4月11日
    00
  • 机器学习之一:初认识

      本文是作者通过对《机器学习实践》这本书的学习,下面做出了自己的学习笔记。文笔拙劣,望指正!   机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习已经…

    机器学习 2023年4月16日
    00
  • 机器学习之路–Matplotlib

    1.绘制折线图 在pandas里面有一种数据类型为datatime ,可以将不规范的日期改为:xxxx-xx-xx import pandas as pd import numpy as np a = pd.read_csv(‘UNRATE.csv’) a[‘DATE’] = pd.to_datetime(a[‘DATE’]) print(a.head(12…

    机器学习 2023年4月13日
    00
  • 卷积神经网络(Convolutional Neural Networks,CNN)

    1、原理 1.1、基本结构 卷积神经网络(Convolutional Neural Networks,CNN)是深度学习中的一种网络,它和其他神经网络最大的区别在于其独特的卷积层。通常情况下它是由多层网络组合而成,每层又包含由特征图组成的多个平面,而这些平面都是由多个独立神经元组成。     通常情况下,因为包含卷积操作,C层被称为特征提取层。上一层的局部感…

    卷积神经网络 2023年4月7日
    00
  • 深度学习可形变卷积

    深度学习可形变卷积 Deformable Convolutional Networks 参考文献链接:https://arxiv.org/pdf/1703.06211.pdf 参考代码链接: https://github.com/ msracver/Deformable-ConvNets 可形变卷积 卷积神经网络(CNNs)由于其构建模块中固定的几何结构,其…

    2023年4月8日
    00
  • <模型汇总_5>生成对抗网络GAN及其变体SGAN_WGAN_CGAN_DCGAN_InfoGAN_StackGAN

    前面介绍了CNN(Convolutional Neural Network)、BNN(Binarizedneural network)、dual-learningNMT和DBN,以及深度学习优化算法BatchNormalization和Layer Normalization。感兴趣的同学可以添加微信公众号“深度学习与NLP”,回复关键词“CNN”、“BNN”…

    2023年4月6日
    00
合作推广
合作推广
分享本页
返回顶部