虚拟演播室系统设备的分析与比较
虚拟演播室系统设备的分析与比较 目前,许多厂家致力于虚拟演播室技术的开发与研究,并在把产品推向市 场的同时,不断的改进与完善。面对市场上繁多的各种产品类别,本文力求站在 专业用户的角度,对面临的选择做一个理性的思考。以下通过对VI[Z]SET公司的 IBIS虚拟演播室系统和国内一些厂家的产品,在虚拟演播室系统的三个关键性环 节系统主机部分、跟踪部分和色键部分的比较,对虚拟演播室系统的设备进行分 析。一、 系统主机部分 在虚拟演播室系统中,系统的硬件平台应该为软件运行提供强有力的保证。
衡量的标准关键在于它的实时计算能力,绘图能力和视频处理能力。IBIS虚拟演 播室系统采用SGI公司的O2图形工作站,而目前国内的几乎所有的公司都采用 NT基PC作为虚拟演播室系统的主机。两者之间的内部机理有何不同呢?现分析 如下:
(1) 体系结构 PC工作站利用系统总线连接PC的各个子系统和独立的本地缓存(包括帧 存、纹理内存、Z缓存或图像存储)。即在整个存储结构制造了许多独立的数据 区,这些数据区可以通过总线连接。在这种结构中,Microsoft/Intel Windows BIOS (基本输入输出系统)定义了只有CPU和主存储能够使用系统总线。所有其他子 系统的数据只能驻留在PCI或ISA总线中,与CPU和主存储的数据交换通过桥接完 成。如下图(1)所示。
每个子系统共同分享具有50-80MB/sec处理能力的PCI总线。而用于I/O上 30MB/sec 的UltraSCSI通道也要消耗PCI总线,使得PCI总线趋近于饱和。虽然PC 系统结构中在特殊区域采用了能够控制并实时地在本地缓存之间传递数据的高 速总线将各部分连接起来,但是CPU与本地缓存之间不能实现实时数据交换。由 于系统瓶颈,当把数据通过桥接传向系统总线时,这些数据到系统总线不可能实 现实时传递。
O2的UMA(一体化存储结构)不同于PC的结构,它将一个系统内所有的 缓存捆绑在一起形成一个存储池,成为系统的主CPU存储区。它拥有基于4组多 路复用的SDRAM来支持2.1GB/sec的带宽。主存储单元通过这个充分预留的带宽来确保各子系统不会发生数据堵塞现象。如图(2)所示。
以下是O2的UMA(一体化存储结构)的特点:
A、本地缓存 O2中的所有子系统都用主存储区作为数据缓存,这样可以显著地降低系 统开销。对O2而言不需要对视频、图像、图形处理或压缩数据等建立单独的缓 存。主存储区存储的数据类型有:
帧存(支持双32bit缓存、Z-缓存、模板平面和材质贴图) 2D图形数据 CCIR601中规定的未压缩的Y、Cr、Cb视频信号 应用程序数据和操作系统内核 P缓存(非演示的帧缓存渲染) 低压缩的JPEG、MPEG-1和H.261数据 B、低数据运动量 O2中各种类型的数据都被保存在主存储区中,数字媒体数据从一个数据 源传递到另一个数据源只须提出申请。这个过程中无数据的运动。这项技术使得 在处理过程可省去数微秒至数秒的时间。此外O2又引入了一种数字媒体流的机 制,当有数据从一个子系统传递到另一个子系统时,数字媒体流从源到目的地的 连接就建立起来。如果数据不需要转换,则只需发出一个到目的地的指令。如果 需要数据转换,则转换方式会被放置于源和目的地之间。
C、有效存储 O2的统一存储结构不仅通过降低本地缓存数量来降低系统开销,也能有 效地提高存储使用效率。存储单元只有需要时才会分配。当不被使用时,可被其 它子系统或应用程序调用。
D、CPU可视察性数据 O2的另一个关键优点在于CPU可以实时视察和操作各种类型数据。这种 能力意味着一个应用程序在对子系统进行数据操作的同时也可有效并实时地支 持大范围系统的特性,减少系统整体开销。简而言之,O2的UMA(一体化存储结构)具有以下特性:
(1)避免了系统之间相互拷贝数据的需要,因此削弱了系统的瓶颈。
(2)随着每个子系统的本地存储缓存的削减,整个系统的开销显著降低。
(3)存储资源的高效利用。未被使用的存储单元会返回到CPU存储池供其 它子系统或应用软件使用。
(4)允许申请直接提交运算结果,而无须通过应用软件或算法程序。
2、CPU和操作系统 现阶段,PC的CPU大多是32位的CPU,采用CISC指令集执行命令,PC采 用Windows操作系统将CPU的95%的处理能力放在GUI的运行和对子系统传递控 制信息之上。而O2采用64位的CPU,尽管主频慢,但采用RISC算法执行命令, 可以同时执行4条命令,所以主频相当于PC的4倍,而且有专用的Mips芯片执行 浮点运算,用于多媒体、图形图像的实时处理。此外,O2的CPU承认全部类型 数据,使它具有灵活的运算能力。而PC的CPU没有这种能力。
通过对PC和O2的内部机制分析,具体到采用PC的虚拟演播室系统和采用 SGI O2的 IBIS虚拟演播室系统的比较,有以下几点:
1、 图形运算:
PC将图形卡置于PCI总线上,图形卡上依靠专用的不可以扩展的图形处理、 显示内存进行图形处理,当图形运算量超过图形卡的内存时,只能以牺牲图形质 量来完成运算,而且可能发生系统死机。而O2由于将图形卡的功能置于主板上, 又是一体化存储结构,对图形处理所需的内存自动优化配置,可以避免系统死机 现象的发生。
2、 图形质量:
PC对图像处理时,对图形边缘必须作反锯齿效果,占用有限的系统资源, 从而使图形质量下降。PC的图形分辨率一般为512*512像素,虚拟场景设置的颜 色最多为24位真彩色。而O2可以进行实时图像处理,不会占用系统资源,图形 视频指标不会下降。且图形分辨率高达4096*4096像素。虚拟场景设置的颜色可 达全32位真彩色。在IBIS系统的实际应用中,一般由SGI图形工作站制作高质量 场景图像,再导入给O2的虚拟演播室应用软件使用。以具有Vpro图形系统的SGI的图形工作站为例。每个彩色分量通路处理信号的精度最高为12bit。较高的分辨 率,加上透视校正的彩色和纹理。意味着更高的透视精度,对具有透明度的形体 有更好的色彩交融,具有三维纹理的更高质量的体视化。SGI独有的Vpro图形系 统包含的单个芯片执行Open GL的功能,几何图形加速流水线以及专业水平的纹 理映射功能,保证向O2提供高质量的背景图像,而O2工作站的标准32位双缓冲 图像显示、硬件OpenGL图形子系统和对纹理映射及Z缓冲的硬件支持,可以尽量 保证SGI图形工作站提供的原始大型高分辨率背景图像信号质量。而PC由于硬件 处理能力不足,很难支持这种高质量的原始背景图像。
3、 活动视频输入:
PC最多支持一路活动视频,而且是将活动视频在图形卡内存上帖图的方 式来实现的。需要缓存的支持,占用系统资源。而IBIS支持两路512*512全视频 分辨率活动视频,且都在内存中实现。
另外,在视频窗口DVE效果上,PC在视频窗口作特效时明显视频指标下 降,而IBIS系统不会出现这种问题,且视频窗口能做淡入淡出、划像、柔化边缘、 阴影效果等特效。在延时上,PC虚拟演播室系统的视频延时有3帧或更多的延时, 而IBIS系统只有2帧延时。在用户界面上,PC的操作要在多个视频窗口中切换, 而IBIS系统标准的用户界面均在一个窗口中,非常容易操作及维护,一个操作员 就能控制工作站中的几台不同的摄像机。在制作上,PC不能读取几个场景及容 易地变换场景,而IBIS系统能够读取多个场景文件并且非常容易地相互快速转换。
在摄像机位置校准上,IBIS系统也比PC系统要迅速,节省很多时间。
综上所述,作为虚拟演播室系统的主机,IBIS虚拟演播室系统采用的SGI 公司O2图形工作站强于目前大多数国内公司采用的NT基PC。此外,SGI公司还 有Onyx超级图形工作站,由于Onyx模块化的扩充方式可以使系统带宽随CPU的 数量而增加,与此同时内存访问延时大大降低。使用Onyx用户可以通过硬件支 持的剪切贴图,纹理分页处理,体积模型渲染以及在高分辨率模式下全屏反走样 处理等功能来实现实时渲染和交互应用,所以可以用于实时处理三维图形、图像 和视频数据。Onyx通常用于三维虚拟演播室系统,这里就不再详细阐述。
二、摄像机跟踪部分 对于摄像机跟踪部分的设备考虑,主要在于使用图案辨识技术还是采用机 械跟踪技术。两者都是通过摄像机跟踪器把真实演员及物体与摄像机之间的位置及透视信息送给图形计算机,然后以摄像机的镜头产生虚拟环境,把真实演员与 虚拟场景匹配起来。以IBIS系统为例,它采用的是机械跟踪,而一些厂家采用图 案辨识。对二者的分析如下:
(1)图案辨识 图案辨识是将一个精确的网格图案以两种不同的蓝色形状绘制于蓝背景 上。通过摄像机识别这种图案并与计算机跟踪软件及硬件预先确定的模型进行对 比,以确定物体与虚拟场景的透视关系及距离。
图案辨识的优势在于无需镜头校准;
同一个跟踪器可同时用于一个以上的 摄像机;
摄像机可以不用轨道进行运动。不足之处在于精确的蓝色图案必须被绘 制在蓝背景之上;
蓝色网格图案在制作色键过程中的阴影很难处理,并且很难保 持良好的键的质量;
摄像机拍摄不能垂直于蓝色网格图案,必须偏离30度角以上, 否则不能准确定位。而且为了保持精确的跟踪,摄像机的焦点必须始终保证在网 格上,否则真实的演员会有模糊的缺点。
摄像机只能有限的运动,不能摇移及俯仰出网格,否则不能定位,但仍然 可以跟踪真实物体,例如演员。摄像机必须同时观察4个网格点以保持跟踪。这 就不可能对人物进行特写镜头的拍摄。人物不能在蓝背景上自由移动。人物必须 站在网格之前,由于网格大小是固定的,这使在虚拟环境中的人物看起来很不自 然。摄像机必须缓慢移动以避免跟踪混淆引起跳帧,并且摄像机的俯仰角度受到 网格角度的限制。另一方面,真实及虚拟物体的使用也很有限,真实物体一定不 能遮挡网格,否则跟踪信号将消失。象蓝色盒子之类用于为虚拟物体提供支持的 道具一定不能遮挡网格。
图案辨识需要附加的硬件,需要额外的工作站把网格坐标信息转换为摇移、 俯仰及变焦坐标信息供图形计算机使用。在延时上,图案辨识的延时有时高达8 至12帧。
(2)机械跟踪 这种摄像机跟踪系统采集摄像机的位置及透视数据,它通常被安装在三角 架或基座之上。机械跟踪器一般使用传感器来确定需要的数据。信息经常通过一 些串行接口类型如RS 232或RS 422被传送给计算机。
机械跟踪的优势在于单颜色蓝背景,无需用户绘制背景墙。很容易照亮蓝色背景而不用担心照亮网格。跟踪数据没有延时。摄像机运动不受限制,可以60 Hz速率进行摇移、俯仰及变焦,允许更好的摄像机角度及更好的拍摄。演员的 活动不受限制,在蓝色舞台范围内可以任意速度自由活动。机械跟踪无需额外的 工作站处理跟踪信息。可以自由使用真实的蓝色支持道具,不用担心遮挡网格。
另外,在合成拍摄过程中可以很容易处理阴影,无需进行额外的修补。不足之处 仅在于每台摄像机必须有一个跟踪器。
在经过广泛的研究及现场测试后,结论是图案辨识是一种令人感兴趣的技 术,但对虚拟演播室来说却是不实用的。虽然这种技术有几处优势,但它的不足 之处却远远多于它的优点。详细对比见表 三、色键部分 色键的优劣直接决定虚拟演播室系统的生产质量的好坏。为了使同一节目 中的演员、实物道具和虚拟背景之间可以相互动态遮挡,实现演员在虚拟或实际 物体后方或前方行走,要求色键具有纵深方向的信息,即虚拟摄像机到每个像素 的距离。使用传统的色键技术,将演员从蓝色幕布中提取出来的同时产生一个前 景遮挡信号即键信号,然后通过深度键发生器求出色键的深度值。获得深度键可 以通过近似判断的方法得出。IBIS系统就是用近似的方法判断出前景演员和摄像 机的相对距离,并且用这个值作为整个前景的深度值。如果演员移动,那么这个 值也将改变。通过对合成画面上每个像素Z值的计算和实际内容的需要用手控方 式决定前景演员和虚拟背景的相对关系,这种方法实现起来比较容易,缺陷是逼 真度差,而且对演员的要求较高。
IBIS系统采用美国Ultimatte公司的400型数字色键。高质量的数字色键针 对画面的三个分量(Y,B-Y,R-Y)的每一路进行处理,并分别产生一个线性 键。这种将一个色键分为三个键来处理的方法,可以允许保留更多的图像细节。
Ultimatte的数字色键处理是在前后景间作混合而非切换,前后景先分别处理,, 然后再相加产生合成图像,在处理时它不用限制整体信号。传统的键采用的是非 相加的混合,在前后景之间做切换,这种方法的局限性就是没办法将透明或半透 明的前景物体叠加到背景上,而同时还要透过它看到背景。
ULTIMATTE的数字色键处理提供了以下的功能:
与传统的色键处理相比,Ultimatte的数字色键处理具有以下特点:第一、 完全相加混合前景与背景,可以再生象 透明物体上的倒影那样的清晰效果。第二、用特有的算法产生遮罩(matte)信号,可以更好地从前景物体中区分出背景。
第三、用抑制衬底及平抑蓝溢出的特殊算法处理前景的同时,允许在前景上再现 蓝色阴影。
Ultimatte在处理前景时,不削弱前景,只削减描绘背衬的蓝色分量,对前景物 体的外边缘的处理,Ultimatte可以高保真。它采用独特的算法有选择地减去信号级 来表现出衬底,而线性键在处理前景时是在衬底所有的色调范围内抵消色度值,在 混合时前景被减弱,留下的亮度级也被消减,有时前景物体的蓝色阴影可能变得灰 暗。在遮罩(matte)信号的产生上,Ultimatte色键处理区别于其他色键设备的第二 个特点是用来从前景产生遮罩信号的特殊算法。
Ultimatte从前景RGB得出遮罩 信号的处理较一般色键信号复杂、灵活,Ultimatte可以更好地区分衬底与前景物 体的颜色,操作者可以更多的控制选取生成遮罩信号所用的颜色纯度,也可以比 一般色键更好地支持蓝屏前的蓝色与灰色阴影。Ultimatte含有专门用来抑制由衬 底溢出的光引起的前景物体的色污染,这是处理前景生成遮罩信号的处理过程的 一部分。Ultimatte在处理前景时,将衬底的蓝(绿)抑制为黑,前景中的其他区 域的蓝(绿)被减弱到一个合适的水平。传统色键通过抵消色度中的指定色调来 抑制蓝溢出,而Ultimatte是有选择的减少蓝(绿)色分量。不同在于传统色键中 的前景物体的蓝色将变为灰色,而Ultimatte中的蓝色仍保持蓝色。
由于Ultimatte色键具有以上特点,特别适合于虚拟演播室的应用,可以保 证图像合成的最后质量。这也是许多厂家选用该色键的原因。
四、总结 通过以上对虚拟演播室关键设备的分析与比较,可以看出厂家针对虚拟演 播室系统所做出的努力。在实际确定采购方向时,价格因素肯定是一个极为重要 的因素,因与本文讨论的主题无关,不再涉及。虚拟演播室技术的发展方兴未艾, 相信它将会成为一种极为有力的节目制作工具。