门禁可视对讲中的音视频同步原理

日期：2012-12-11

一、音视频同步问题概述

音视频同步问题是可视对讲中的重点需要解决的问题之一，也是一直以来被模拟门禁产品厂商攻击的一个弱点，因为模拟可视对讲产品都采用专线传输，不存在这个问题。解决同步问题的方法有很多种，其中时间戳是最成熟最完美也是最复杂的解决办法，可以解决任何多媒体领域的音视频同步问题；其原理是选择一个参考时间，在生成数据流时依据参考时间上的时间给每个数据块都打上时间戳；在播放时，读取数据块上的时间戳，同时参考当前时钟上的时间来安排播放，让快于这个参考时间的包等待，丢弃慢于这个参考时间的包。在基于时间戳的同步机制中，仅仅对不同步的数据进行处理是不完备的，还需要反馈机制，如基于Windows平台的DirectShow就提供这样一个反馈机制，它的质量控制 (QualityControl)可以将播放的状态反馈给源，让源端加快或者放慢数据流的速度。

在多媒体文件采集，播放及对同步的要求都非常严格，如果从多媒体文件中分离出音视频数据的数据不同步，音视频的时间差则会越来越大，这是无法忍受的，所以在多媒体文件中，不但要求有同步机制，还要求有反馈机制。

二、数字可视对讲中的音视频同步方案

在数字可视对讲中，可以考虑的音视频同步方案有两种：一是发送端解决；二是接收端解决。

发送端解决方法比较简单，具体措施是在发送端先将一段时间内采集到音视频数据打包。比如采集到一帧视频图像，将这帧图像与采集这帧视频的时间内采集到的视频数据打成一个包，接收端接收到这个包之后解包分别播放就可以了。发送端解决的控制方法比较简单，但是在高清要求清晰度比较高的情况下就不是很理想，清晰度高，意味着每个音视频包数据量就大，能保证同步，却难以保证连续。我们在同一个线程中按照先后顺序发送PCM音频和H.264视频，测试结果表明这种方法确实存在连续问题。

接收端解决方案绕不开的问题是时间戳，接收端根据接收到的音视频数据的时间戳安排播放。时间戳需要一个参考时间，而采集过程中视频的时间是不定的，数字摄像头采集图像的帧率是一个平均值，不宜用来做参考时间，所以只能用音频时间作为参考时间。

三、声卡编程和声卡驱动的时间机制

门禁可视对讲中音频是双向的。本文的门禁可视对讲方案中，音频的采用PCM(PulseCodeModulation——脉码调制录音)采集，在网络中传送的也是原始数据，之所以没有对音频数据进行编码处理是基于以下原因：一是S3C6410没有提供对音频的硬编解码，如果使用软件实现编解码，在有限的系统资源条件下难以实现；二是音频数据量较小：采用8000采样率和量化位数为8位的电话语音标准，一秒的音频数据是8K字节，只相当于视频1帧数据的两倍，这对普遍拥有百兆网卡的局域网来说，数据量很小。实验的结果表明，这种简单的处理方式被证明是有效的。

标签： 音视频视频图像采集过程

12

更多>同类技术

全年征稿 / 资讯合作

2398080099

联系邮箱：

版权与免责声明

凡本网注明“来源：CK365测控网”的所有作品，均为北京新科时代传媒信息技术有限公司-CK365测控网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：CK365测控网”。违反上述声明者，本网将追究其相关法律责任。
本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

推荐图文

利用加速度计和陀螺仪测量车辆运动	陀螺仪技术在电动车上的应用
陀螺仪、加速度计在鼠标上的应用

推荐技术

可能喜欢

• 详解智能家居的控制系统工作原理	• 音视频文件格式转换器的介绍
• A7125-2.4GHZ 2Mbps无线音视频传输Rf IC	• 基于LabVIEW和TestStand的DVD音视频自动测试系统