Linux音频采集和在国产化平台中遇到的坑(一)

最近在做一个国产化平台的软件项目的开发,是基于国产芯片的银河麒麟系统。其中有一个重要模块,是采集和播放音频数据,播放不用多说了,采集的话,包括采集麦克风和采集桌面系统声音。很多人都觉得银河麒麟不就是linux么,那不直接用ALSA就好了,我原本也是这么想的,但是实际开发下来才发现,还是有各种坑需要自己去趟的。这里我简单记录一下。

虽然都是linux,芯片也是基于同样的架构,同样的指令集,但是考虑到芯片的实现毕竟是不同的,于是所有涉及到硬件交互的软件部分,也会有所差异,最终会导致了有些应用层面的接口,不能按照普通linux的通常用法去使用。

linux ALSA音频采集

首先,银河麒麟既然是linux系统,那首先考虑到的是通过ALSA(Advanced Linux Sound Architecture)来进行采集,ALSA是linux的默认声卡驱动,同时在用户层还有一个ALSA Lib来供应用程序调用,它的整体上的结构图是这个样子的:

image

应用程序通常都是通过alsa-lib来使用,如果系统没有的话,可以通过命令安装开发库,就可以使用了。例如

sudo apt-get install libasound2-dev

另外需要注意一点的是,如果是android系统,那么系统里通常是不存在alsa的,而是它的简化版tiny-alsa,接口名称也不一样,但是大致调用流程是相同的。

alsa音频采集,有几个关键函数

#include <sys/asoundlib.h>

/***
 创建alsa pcm handle去连接设备
 @param handle: 返回创建的PCM handle
 @param name: 设备名称,ASCII编码
 @param stream: 标明采集或者播放(SND_PCM_STREAM_CAPTURE, SND_PCM_STREAM_PLAYBACK)
 @param mode: 打开模式(see SND_PCM_NONBLOCK, SND_PCM_ASYNC)
 @return: 0表示成功,小于0表示错误
*/
int snd_pcm_open( snd_pcm_t **handle, const char* name, int stream, int mode );

/***
 读取音频帧
 @param handle: PCM handle
 @param buffer: frames containing buffer
 @param size: frames to be read
 @return: 实际读取的音频帧个数,小于0表示错误
*/
ssize_t snd_pcm_readi( snd_pcm_t *handle, void *buffer, size_t size );

/***
 关闭
 @param handle: PCM handle
 @return: 实际读取的音频帧个数,小于0表示错误
*/
int snd_pcm_close( snd_pcm_t *handle );

/***
 准备使用PCM
 @param handle: PCM handle
 @return: 实际读取的音频帧个数,小于0表示错误
*/
int snd_pcm_prepare( snd_pcm_t *handle );

接口简单,参数也少,所以使用起来很方便,基本上是linux下采集和播放的第一选择,下面写个简单的例子演示下如何调用

  1. 打开音频设备并设置参数
SIMPLE_LOG("try open %s\n", device_name_.c_str());

int ret = snd_pcm_open(&alsa_pcm_, device_name_.c_str(), SND_PCM_STREAM_CAPTURE, SND_PCM_NONBLOCK);
if (!alsa_pcm_ || ret < 0)
{
	SIMPLE_LOG("open %s failed, ret: %d\n", device_name_.c_str(), ret);

	return false;
}

snd_pcm_hw_params_t* params;

snd_pcm_hw_params_alloca (&params);
snd_pcm_hw_params_any (alsa_pcm_, params);
snd_pcm_hw_params_set_access (alsa_pcm_, params,
	SND_PCM_ACCESS_RW_INTERLEAVED);

snd_pcm_format_t format;
switch (bits_per_sam_) {
case 8:
	format = SND_PCM_FORMAT_S8;
	break;
case 16:
	format = SND_PCM_FORMAT_S16_LE;
	break;
case 24:
	format = SND_PCM_FORMAT_S24_LE;
	break;
case 32:
	format = SND_PCM_FORMAT_S32_LE;
	break;
default:
	format = SND_PCM_FORMAT_S16_LE;
	break;
}
snd_pcm_hw_params_set_format (alsa_pcm_, params, format);

snd_pcm_hw_params_set_channels (alsa_pcm_, params, channel_count_);

unsigned int rate = sample_rate_;
snd_pcm_hw_params_set_rate_near (alsa_pcm_, params, &rate, NULL);

sample_size_ = channel_count_ * (bits_per_sam_/8);

/* Activate the parameters */
ret = snd_pcm_hw_params (alsa_pcm_, params);
if (ret < 0)
{
	SIMPLE_LOG("set param failed, ret: %d\n", ret);

	snd_pcm_close (alsa_pcm_);
	alsa_pcm_ = NULL;
	return false;
}
  1. 读取音频数据
bool AlsaCapture::ReadData()
{
    int read_size = 0;
    snd_pcm_uframes_t need_frames = real_sample_count_;
    for (;;)
    {
        if (read_size >= pcm_buf_.size())
        {
            break;
        }

        int ret = 0;
        while (true)
        {
            char* read_buf = &pcm_buf_[0] + read_size;
            ret = snd_pcm_readi(alsa_pcm_, read_buf, need_frames);
            if (ret >= 0)
            {
                break;
            }

            if (ret == -EAGAIN)
            {
                SIMPLE_LOG("snd_pcm_readi EAGAIN\n");
                return false;
            }

            if (AlsaXRunRecover(alsa_pcm_, ret) < 0)
            {
                SIMPLE_LOG("ALSA read error: %s\n", snd_strerror(ret));
                return false;
            }
        }

        read_size += ret * sample_size_;
        need_frames -= ret;
    }
    return true;
}

这样就可以完成音频数据的采集,需要注意的是,在第二步读取数据之前,需要先调用snd_pcm_prepare,否则是无法驱动数据采集正常进行的。

在国产化芯片平台上出现的问题

在普通Linux下,这样写下来,就可以实现想要的音频采集功能了,后面对数据做进一步的规整和编码就可以发送了。但是在某个国产芯片平台的银河麒麟系统下,我却遇到了一个问题,那就是打开设备的函数调用以及所有的参数设置都是成功的,但是数据采集却总是异常,要么返回无意义噪声数据,要么read接口干脆就报EAGAIN错误。

刚开始我以为是ALSA默认设备的问题,因为出问题的国产化芯片平台,有两个声卡,其中一个是可以正常使用的,另一个是无效声卡。这些信息可以通过使用命令行来查看,例如:

查看声卡:

cat /proc/asound/cards

查看采集设备:

sudo arecord -l

查看播放设备:

cat aplay -l

于是我尝试通过系统配置的方式,来设置默认声卡,这里推荐一个工具“alsamixer”,是一个字符化界面的ALSA配置工具,可以通过如下命令安装:

sudo apt-get install alsa-utils

启动后就是一个这样的界面

image

然而,修改以后,发现默认设备的修改,并不能影响到alsa采集的结果。于是通过罗列所有录音设备,并且指定设备名称,但是仍然出现同样的结果。在多次尝试无果以后,最终只能放弃使用ALSA来进行音频设备的数据采集,而采用复杂一些的PulseAudio框架。最后的结果也证明,更加上层的PulseAudio还是正确的处理了有效的音频设备和无效音频设备,并正确返回了麦克风/桌面系统声音。具体过程我下一篇再写。

image

合作请加QQ或微信hbstream。(转载请注明作者和出处)

Linux音频采集和在国产化平台中遇到的坑(一)