采样(信号处理)

信号采样表示。连续信号st )用绿色线表示,而离散样品则由蓝色垂直线表示。

信号处理中,采样是将连续时间信号降低为离散时间信号。一个常见的例子是将声波转换为“样品”序列。样品是在时间点和/或空间上的信号值;该定义与该术语在统计信息中的用法不同,该术语是指一组此类值。

采样器是从连续信号中提取样品的子系统或操作。理论上的理想采样器产生的样品等于所需点处连续信号的瞬时值。

可以通过通过重建滤波器将样品序列传递给原始信号,从一系列样品序列重建到Nyquist极限

理论

可以对空间,时间或任何其他维度的函数进行采样,并在两个或多个维度中类似。

对于随时间变化的函数,让St )为要采样的连续函数(或“信号”),并通过每t秒测量连续函数的值来执行抽样,称为采样间隔采样期。然后,采样函数由序列给出:

snt ),用于n的整数值。

采样频率采样率f s是样品的数量除以发生的间隔长度,因此f s = 1/ t每秒单位样本,有时称为hertz ,例如KHz是每秒48,000个样品。

从样品中重建连续函数是通过插值算法完成的。 Whittaker-Shannon插值公式在数学上等同于理想的低通滤波器,其输入是一系列DIRAC DELTA函数的序列,该函数被调制(乘以样品值)。当相邻样品之间的时间间隔是常数( t )时,增量函数的序列称为狄拉克梳子。从数学上讲,调制的狄拉克梳子等同于梳子函数与st )的乘积。该数学抽像有时被称为脉冲抽样

大多数采样信号不简单地存储和重建。理论重建的保真度是对抽样有效性的共同度量。当st )包含循环长度(周期)小于2个样本间隔的频率成分时,该保真度会降低(请参见混蛋)。相应的频率极限为每秒循环Hertz ),为0.5循环/样品× F S样品/秒= F S /2,称为采样器的奈奎斯特频率。因此, St )通常是低通滤波器的输出,该滤波器在功能上称为抗氧化滤镜。没有抗缩合过滤器,高于Nyquist频率的频率将以插值过程误解的方式影响样品。

实际考虑

实际上,使用具有各种物理限制的设备使用类似物到数字转换器(ADC)对连续信号进行采样。这会导致偏离理论上完美的重建,共同称为失真

可能发生各种失真,包括:

  • 混音。不可避免的是一定数量的混叠,因为只有理论上的无限长,功能才能具有高于Nyquist频率的频率内容。通过使用足够大的抗氧化过滤器,可以任意将混叠起来。
  • 孔径误差是由于采样区域内的时间平均值获得的事实,而不是仅等于采样时的信号值。在基于电容器样品和保持电路中,通过多种机制引入了光圈误差。例如,电容器无法立即跟踪输入信号,并且电容器无法立即与输入信号隔离。
  • 抖动或偏离精确的样本时间间隔。
  • 噪声,包括热传感器噪声,模拟电路噪声等。
  • 由ADC输入值无法迅速更改而导致的降率极限误差。
  • 量化是由于代表转换值的单词的有限精度。
  • 由于将输入电压映射到转换的输出值的其他非线性效应引起的误差(除了量化的效果外)。

尽管过采样的使用可以通过将孔径转移到通带中,从而完全消除了孔径误差和混叠,但是该技术实际上不能在几个GHz上方使用,并且在较低的频率下可能会非常昂贵。此外,尽管过采样可以减少量化误差和非线性,但它不能完全消除这些误差和非线性。因此,在音频频率下的实用ADC通常不会表现出异叠,光圈误差,并且不受量化误差的限制。相反,模拟噪声主导。在RF和微波频率下,过采样不切实际,过滤器很昂贵,光圈误差,量化误差和混叠可能是显著的局限性。

通常通过将它们建模为添加到样本值中的随机误差来分析抖动,噪声和量化。可以将集成和零级保持效应分析为低通滤波的一种形式。通过用建议的非线性函数替换理想的线性函数映射来分析ADC或DAC的非线性。

申请

音频采样

数字音频使用脉冲代码调制(PCM)和数字信号进行声音复制。这包括模数转换(ADC),数字到分析转换(DAC),存储和传输。实际上,通常称为数字的系统实际上是先前电气类似物的离散时间,离散级别的类似物。尽管现代系统的方法可能非常微妙,但数字系统的主要实用性是能够存储,检索和传输信号而不会损失任何质量。

当有必要捕获涵盖整个20-20,000 Hz人类听力范围的音频时,例如录制音乐或许多类型的声学事件时,音频波形通常以44.1 kHz( CD ),48 kHz,88.2 kHz或96 kHz采样千赫。大约双率要求是Nyquist定理的结果。采样率高于约50 kHz至60 kHz,无法为人类听众提供更多可用信息。出于这个原因,早期专业音频设备制造商选择了40至50 kHz区域的采样率。

远远超出了基本要求的行业趋势,例如96 kHz甚至192 kHz,即使超声波频率对人类听不及,以较高的采样率记录和混合有效地消除了可能由造成的失真,这可能会导致。折叠式别名。相反,超声声音可能与频谱的可听见部分相互作用并调节频谱的可听见部分,从而降低了保真度。较高的采样率的一个优点是,它们可以放松ADCDAC的低通滤波器设计要求,但是使用现代化的超采样三角洲 - 近距离转换器,这一优势不太重要。

音频工程协会在大多数应用中建议使用48 kHz的采样率,但可识别为CD和其他消费者用途的44.1 kHz,用于传输相关应用的32 kHz和96 kHz,用于更高的带宽或放松的反异化过滤。 Lavy Engineering和J. Robert Stuart都指出,理想的采样率约为60 kHz,但是由于这不是标准频率,因此建议88.2或96 kHz用于记录。

更完整的常见音频采样率列表是:

采样率使用
8,000 Hz电话和加密的对讲机无线对讲机无线麦克风变速器;足以适合人类的言语,但没有任何沉默ESS听起来像EFF/ s // f / ))。
11,025 Hz四分之一的音频CD采样率;用于低质量的PCM,MPEG音频和低音炮带通道的音频分析。
16,000 Hz宽带频率扩展超过标准电话窄带8,000 Hz。用于大多数现代VoIP和VVOIP通信产品。
22,050 Hz音频CD的抽样率的一半;用于低质量的PCM和MPEG音频以及低频能量的音频分析。适合数字化20世纪初的音频格式,例如78SAM广播
32,000 HzMinIDV数字视频摄像机,带有额外音频频道的录像带(例如带有四个音频频道的DVCAM ), DAT (LP模式),德国的Digitales Satellitenradio, Nicam Digital Audio,与某些国家/地区的模拟电视声音一起使用。高质量的数字无线麦克风。适用于数字化FM收音机
37,800 HzCD-XA音频
44,056 Hz由数字音频锁定到NTSC彩色视频信号(每行3个样本,每个字段245行,每秒59.94个字段=每秒29.97帧)。
44,100 Hz音频CD ,也最常用于MPEG-1音频( VCDSVCDMP3 )。最初是由索尼选择的,因为它可以记录在以每秒25帧(PAL)或30帧/s(使用NTSC单色视频录音机)运行的修改视频设备上,并覆盖20 kHz带宽,以匹配专业模拟录音设备所需的必要的时间。 PCM适配器将数字音频示例拟合到模拟视频通道中,例如,使用每行3个样本,每帧588行,每秒25帧。
47,250 HzNippon Columbia (Denon)的世界第一台商业PCM录音机
48,000 Hz专业数字视频设备(例如磁带录制器,视频服务器,视觉混音器等)使用的标准音频采样率。之所以选择此速率,是因为它可以重建高达22 kHz的频率,并使用29.97帧每秒NTSC视频,以及25帧/s,30帧/s和24帧/s系统。使用29.97帧/S系统,必须每帧处理1601.6音频样本,仅提供整数数量的音频样本。还用于使用消费者视频格式,例如DV, Digital TVDVD和Films。专业的串行数字接口(SDI)和高清串行数字接口(HD-SDI)用于将广播电视设备连接在一起使用此音频采样频率。大多数专业的音频装备都使用48 kHz采样,包括混合游戏机数字录音设备。
50,000 Hz70年代后期的第一个商业数字音频录制器和Soundstream
50,400 Hz三菱X-80数字音频记录器使用的采样率。
64,000 Hz罕见的使用,但得到了一些硬件和软件的支持。
88,200 Hz当目的地为CD时,某些专业记录设备使用的采样率(44,100 Hz的倍数)。一些Pro Audio Gear使用(或能够选择)88.2 kHz采样,包括搅拌机,EQ,压缩机,混响,跨界设备和录制设备。
96,000 HzDVD-Audio ,一些LPCM DVD轨道, BD-ROM (蓝光碟片)音轨, HD DVD (高清DVD)音轨。一些专业的录音和生产设备可以选择96 kHz采样。该采样频率是专业设备上常用于音频的48 kHz标准的两倍。
176,400 HzHDCD记录器和其他专业应用用于CD生产的采样率。 44.1 kHz的频率四倍。
192,000 HzDVD-Audio ,一些LPCM DVD轨道, BD-ROM (BLU-RAY DISC)音轨和HD DVD (高清DVD)音轨,高清音频录制设备和音频编辑软件。该采样频率是专业视频设备上常用于音频的48 kHz标准的四倍。
352,800 Hz数字极端定义,用于录制和编辑超级音频CD ,因为1位直接流数字(DSD)不适合编辑。 44.1 kHz的频率八倍。
2,822,400 HzSACD ,1位三角洲 - 西格玛调制过程,称为Direct Stream Digital ,由SonyPhilips共同开发。
5,644,800 Hz双速率DSD,1位直接流数字数字为2×SACD的速率。用于一些专业的DSD记录器。
11,289,600 Hz四率DSD,1位直接流数字数为4×SACD的速率。用于一些罕见的专业DSD录音机。
22,579,200 HzOctuple-rate DSD,1位直接流数字数为8×SACD的速率。用于罕见的实验DSD记录器。也称为DSD512。
45,158,400 HzSEXDECUPLE-IS-rate DSD,1位直接流数字为16×SACD的速率。用于罕见的实验DSD记录器。也称为DSD1024。

位深度

音频通常以8-,16和24位深度记录,该深度产生理论的最大信号量化噪声比(SQNR),用于纯正弦波,大约为49.93 dB ,98.09 dB和122.17 dB 。 CD质量音频使用16位样品。热噪声限制了可用于量化的真实位。很少有模拟系统具有超过120 dB的信号与噪声比(SNR) 。但是,数字信号处理操作可以具有很高的动态范围,因此,以32位精度执行混合和掌握操作是常见的,然后转换为16或24位进行分发。

语音采样

语音信号,即仅携带人类语音的信号,通常可以以低得多的速度进行采样。对于大多数音素,几乎所有能量都包含在100 Hz - 4 kHz范围内,允许采样速率为8 kHz。这是使用G.711采样和量化规范的几乎所有电话系统使用的采样率

视频抽样

标准定义电视(SDTV)用于可见的图片区域,使用720 x 480像素(US NTSC 525线)或720 x 576像素(英国PAL 625线)。

高清电视(HDTV)使用720p (渐进式), 1080i (交错)和1080p (渐进式,也称为Full-HD)。

数字视频中,定义了时间抽样率,即帧速率(或更确切地说是现场速率),而不是名义像素时钟。图像采样频率是传感器集成周期的重复率。由于整合周期可能比重复之间的时间明显短,因此采样频率可能与样本时间的倒数不同:

  • 50 Hz - PAL视频
  • 60 / 1.001 Hz〜 = 59.94 Hz - NTSC视频

视频数字到Analog转换器在Megahertz系列中运行(从早期游戏机中的低质量复合视频缩放器的〜3 MHz到最高分辨率VGA输出的250 MHz或更多)。

当模拟视频转换为数字视频时,会发生不同的采样过程,这次是在像素频率下,对应于沿扫描线的空间采样率。常见的像素抽样率是:

在另一个方向上的空间采样是由扫描线在栅格中的间距确定的。两个空间方向上的采样率和分辨率都可以以每个图片高度的线单位来测量。

高频Luma色度视频组件的空间混叠表示为Moiré模式

3D采样

体积渲染的过程是一个体素的3D网格,以产生切片(层析成像)数据的3D渲染。假定3D网格代表3D空间的连续区域。体积渲染在医学成像, X射线计算机断层扫描(CT/CAT),磁共振成像(MRI),正电子发射断层扫描(PET)中很常见。它也用于地震层析成像和其他应用。

前两个图描绘了以特定速率采样时产生相同结果的两个不同函数的傅立叶变换。基带函数的采样速度比其Nyquist速率快,并且带通函数被缩采样,有效地将其转换为基带。较低的图表明采样过程的别名如何产生相同的光谱结果。

底采样

带通信号的采样速度慢于其Nyquist速率时,样品与高频信号的低频别名的样品没有区别。通常以最低频率别名满足Nyquist标准的方式进行有意进行,因为带通信号仍然是唯一的代表和可恢复的。这种不足的采样也称为带通采样谐波采样(如果采样)以及直接直接进行数字转换。

过采样

大多数现代模数转换器中都使用了过采样,以减少实用数字到Analog转换器所引入的失真,例如零级保持,而不是理想化的惠特克 - 香农插值公式等理想化。

复杂的采样

复杂的采样(或I/Q采样)是两个不同但相关的波形的同时采样,导致一对样品对,随后被视为副本。当一个波形时是另一波形的希尔伯特变换复杂值函数, 称为分析信号,对于所有频率的负值,其傅立叶变换为零。在这种情况下,没有频率≥b的波形的nyquist速率可以降低到B (复杂样品/秒),而不是2 B (实际样品/秒)。显然,等效的基带波形还具有B的Nyquist速率,因为其所有非零频率含量都移至间隔[-b/2,B/2)。

尽管可以如上所述获得复杂值的样品,但它们也是通过操纵实价波形的样品而创建的。例如,可以在不明确计算的情况下创建等效的基带波形通过处理产品序列通过数字低通滤波器的截止频率为b /2。仅计算输出序列的所有其他样本会降低样本率与降低的Nyquist速率相称。结果是原始样品数量的一半是复杂值的一半。没有信息丢失,如有必要,可以恢复原始的S(t)波形。

也可以看看