Linux音频采集和在国产化平台中遇到的坑（一）

最近在做一个国产化平台的软件项目的开发，是基于国产芯片的银河麒麟系统。其中有一个重要模块，是采集和播放音频数据，播放不用多说了，采集的话，包括采集麦克风和采集桌面系统声音。很多人都觉得银河麒麟不就是linux么，那不直接用ALSA就好了，我原本也是这么想的，但是实际开发下来才发现，还是有各种坑需要自己去趟的。这里我简单记录一下。

虽然都是linux，芯片也是基于同样的架构，同样的指令集，但是考虑到芯片的实现毕竟是不同的，于是所有涉及到硬件交互的软件部分，也会有所差异，最终会导致了有些应用层面的接口，不能按照普通linux的通常用法去使用。

linux ALSA音频采集

首先，银河麒麟既然是linux系统，那首先考虑到的是通过ALSA（Advanced Linux Sound Architecture）来进行采集，ALSA是linux的默认声卡驱动，同时在用户层还有一个ALSA Lib来供应用程序调用，它的整体上的结构图是这个样子的：

应用程序通常都是通过alsa-lib来使用，如果系统没有的话，可以通过命令安装开发库，就可以使用了。例如

sudo apt-get install libasound2-dev

另外需要注意一点的是，如果是android系统，那么系统里通常是不存在alsa的，而是它的简化版tiny-alsa，接口名称也不一样，但是大致调用流程是相同的。

alsa音频采集，有几个关键函数

#include <sys/asoundlib.h>

/***
 创建alsa pcm handle去连接设备
 @param handle: 返回创建的PCM handle
 @param name: 设备名称，ASCII编码
 @param stream: 标明采集或者播放(SND_PCM_STREAM_CAPTURE, SND_PCM_STREAM_PLAYBACK)
 @param mode: 打开模式(see SND_PCM_NONBLOCK, SND_PCM_ASYNC)
 @return: 0表示成功，小于0表示错误
*/
int snd_pcm_open( snd_pcm_t **handle, const char* name, int stream, int mode );

/***
 读取音频帧
 @param handle: PCM handle
 @param buffer: frames containing buffer
 @param size: frames to be read
 @return: 实际读取的音频帧个数，小于0表示错误
*/
ssize_t snd_pcm_readi( snd_pcm_t *handle, void *buffer, size_t size );

/***
 关闭
 @param handle: PCM handle
 @return: 实际读取的音频帧个数，小于0表示错误
*/
int snd_pcm_close( snd_pcm_t *handle );

/***
 准备使用PCM
 @param handle: PCM handle
 @return: 实际读取的音频帧个数，小于0表示错误
*/
int snd_pcm_prepare( snd_pcm_t *handle );

接口简单，参数也少，所以使用起来很方便，基本上是linux下采集和播放的第一选择，下面写个简单的例子演示下如何调用

打开音频设备并设置参数

SIMPLE_LOG("try open %s\n", device_name_.c_str());

int ret = snd_pcm_open(&alsa_pcm_, device_name_.c_str(), SND_PCM_STREAM_CAPTURE, SND_PCM_NONBLOCK);
if (!alsa_pcm_ || ret < 0)
{
	SIMPLE_LOG("open %s failed, ret: %d\n", device_name_.c_str(), ret);

	return false;
}

snd_pcm_hw_params_t* params;

snd_pcm_hw_params_alloca (&params);
snd_pcm_hw_params_any (alsa_pcm_, params);
snd_pcm_hw_params_set_access (alsa_pcm_, params,
	SND_PCM_ACCESS_RW_INTERLEAVED);

snd_pcm_format_t format;
switch (bits_per_sam_) {
case 8:
	format = SND_PCM_FORMAT_S8;
	break;
case 16:
	format = SND_PCM_FORMAT_S16_LE;
	break;
case 24:
	format = SND_PCM_FORMAT_S24_LE;
	break;
case 32:
	format = SND_PCM_FORMAT_S32_LE;
	break;
default:
	format = SND_PCM_FORMAT_S16_LE;
	break;
}
snd_pcm_hw_params_set_format (alsa_pcm_, params, format);

snd_pcm_hw_params_set_channels (alsa_pcm_, params, channel_count_);

unsigned int rate = sample_rate_;
snd_pcm_hw_params_set_rate_near (alsa_pcm_, params, &rate, NULL);

sample_size_ = channel_count_ * (bits_per_sam_/8);

/* Activate the parameters */
ret = snd_pcm_hw_params (alsa_pcm_, params);
if (ret < 0)
{
	SIMPLE_LOG("set param failed, ret: %d\n", ret);

	snd_pcm_close (alsa_pcm_);
	alsa_pcm_ = NULL;
	return false;
}

读取音频数据

bool AlsaCapture::ReadData()
{
    int read_size = 0;
    snd_pcm_uframes_t need_frames = real_sample_count_;
    for (;;)
    {
        if (read_size >= pcm_buf_.size())
        {
            break;
        }

        int ret = 0;
        while (true)
        {
            char* read_buf = &pcm_buf_[0] + read_size;
            ret = snd_pcm_readi(alsa_pcm_, read_buf, need_frames);
            if (ret >= 0)
            {
                break;
            }

            if (ret == -EAGAIN)
            {
                SIMPLE_LOG("snd_pcm_readi EAGAIN\n");
                return false;
            }

            if (AlsaXRunRecover(alsa_pcm_, ret) < 0)
            {
                SIMPLE_LOG("ALSA read error: %s\n", snd_strerror(ret));
                return false;
            }
        }

        read_size += ret * sample_size_;
        need_frames -= ret;
    }
    return true;
}

这样就可以完成音频数据的采集，需要注意的是，在第二步读取数据之前，需要先调用snd_pcm_prepare，否则是无法驱动数据采集正常进行的。

在国产化芯片平台上出现的问题

在普通Linux下，这样写下来，就可以实现想要的音频采集功能了，后面对数据做进一步的规整和编码就可以发送了。但是在某个国产芯片平台的银河麒麟系统下，我却遇到了一个问题，那就是打开设备的函数调用以及所有的参数设置都是成功的，但是数据采集却总是异常，要么返回无意义噪声数据，要么read接口干脆就报EAGAIN错误。

刚开始我以为是ALSA默认设备的问题，因为出问题的国产化芯片平台，有两个声卡，其中一个是可以正常使用的，另一个是无效声卡。这些信息可以通过使用命令行来查看，例如：

查看声卡：

cat /proc/asound/cards

查看采集设备：

sudo arecord -l

查看播放设备：

cat aplay -l

于是我尝试通过系统配置的方式，来设置默认声卡，这里推荐一个工具“alsamixer”，是一个字符化界面的ALSA配置工具，可以通过如下命令安装：

sudo apt-get install alsa-utils

启动后就是一个这样的界面

然而，修改以后，发现默认设备的修改，并不能影响到alsa采集的结果。于是通过罗列所有录音设备，并且指定设备名称，但是仍然出现同样的结果。在多次尝试无果以后，最终只能放弃使用ALSA来进行音频设备的数据采集，而采用复杂一些的PulseAudio框架。最后的结果也证明，更加上层的PulseAudio还是正确的处理了有效的音频设备和无效音频设备，并正确返回了麦克风/桌面系统声音。具体过程我下一篇再写。