1.视音频技术
视频技术包括视频数字化和视频编码技术两个方面。视频数字化是将模拟视频信号经模数转换变换为计算机可处理的数字信号,使计算机可以显示和处理视频信号。视频编码技术是将数字化的视频信号经过编码成为视频信号,从而可以录制或播放。
音频技术包括音频数字化、语音处理、语音合成及语音识别4个方面。随着计算机的普及,如何给不熟悉计算机的人提供一个友好的人机交互手段,是人们感兴趣的问题,而语音识别技术就是其中自然的一种交流手段。
1)视音频编码
编解码器指的是能够对一个信号或者一个数据流进行变换的设备或者程序。视音频编码的目的是对视音频数据进行传输和存储,在很多多媒体数据流中,往往需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据(如字幕)。通常,这种编码后的封装是通过视频文件格式来实现的,如常见的*.mpg、*.avi、*.mov、*mp4、*.rm、*ogg和*tta等2)视音频压缩方法
目前,视音频压缩方法有上百种,这些方法总体上可归类为有损(Lossy)压缩和无损(Lossless)压缩两类。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。而有损压缩意味着解压缩后的数据与压缩前的数据不一致,在压缩的过程中要丢失一些人眼和人耳不敏感的图像或音频信息,这些丢失的信息是不可恢复的。无损压缩常见的格式有WAV、PCM、TTA、FLAC、AU、APE、TAK和WavPack(WV)等;有损压缩常见的格式有MP3、Windows Media Audio(WMA)、Ogg Vorbis(OGG)等。
2.通信技术
通信技术是多媒体系统中的一项关键技术,是指将信息从一个地点传送到另一个地点所采取的方法和措施。这里所说的通信技术仅仅涵盖多媒体系统采用的通信方法。
通信技术通常包括了数据传输信道技术和数据传输技术。数据传输信道是指通信的物理介质,包括同轴电缆、双绞线、光纤、越洋海底电缆、微波信道、短波信道、无线通信和卫星通信等。数据传输技术是指在物理介质上如何组织、传送数据的方法,包括基带传输、频带传输及调制技术、同步技术、多路复用技术、数据交换技术、编码、加密、差错控制技术和数据通信网、设备、协议等。
3.数据压缩技术
在多媒体系统中,由于所涉及的各种媒体信息主要是非常规数据类型,如图形、图像、视频和音频等,这些数据所需要的存储空间是十分巨大的。为了使多媒体技术达到实用水平,除了采用新技术手段增加存储空间和通信带宽外,对数据进行有效压缩将是多媒体发展中必须解决的最关键技术之一。
数据压缩的算法非常多,不同特点的数据有不同的数据压缩算法(也就是编码方式),按类别分主要存在以下3类。
(1)即时压缩和非即时压缩。即时/非即时压缩的区别在于信息在传输过程中被压缩还是信息压缩后再传输。即时压缩一般应用在影像、声音数据的传送中。即时压缩常用到专门的硬件设备,如压缩卡等。
(2)数据压缩和文件压缩。数据压缩是专指一些具有时间性的数据,这些数据常常是即时采集、即时处理或传输的。而文件压缩是指对将要保存在磁盘等物理介质的数据进行压缩。
(3)无损压缩与有损压缩。无损压缩是利用数据的统计冗余进行压缩,通常无损压缩的压缩比比较低。而有损压缩是利用了人类对视觉、听觉对图像、声音中的某些频率成分不敏感的特性,允许压缩的过程中损失一定的信息。
国际上已广泛使用数据压缩技术处理各类图形、图像、视频数据,比较流行的几种编码格式已形成国际编码标准。
(1)静态图像压缩编码的国际标准。
联合图像专家小组标准(Joint Photographic Experts Group,JPEG)是一种对静态图像压缩的编码算法。“联合”的含义是:国际电报电话咨询委员会(Consultative Committee onInternational Telephone and Telegraph,CCITT)和国际标准化协会联合组成的图像专家小组。静态图像压缩标准有JPEG、JPEG2000。
(2)动态图像视频编码标准(MPEG)。
运动图像专家组(Moving Picture Experts Group,MPEG)是专门制定多媒体领域内的国际标准的一个组织。该组织成立于1988年,由全世界大约300名多媒体技术专家组成。MPEG标准是面向运动图像压缩的一个系列标准。目前有MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21、DVI。
(3)视频编解码器标准(H.26L)。
H.26L标准最初是由ITU-T的VCEG(Video Coding Experts Group)在1997年制定的一个视频编码标准,ISO/IEC MPEG和ITU-T VCEG联合组成了新的组织Joint Video Team(JVT)
的H.26L研究,在2002年第H.26L标准正式确定。H.26L旨在提供更高的压缩效率和更灵活的网络适应性,以及增强对于差错的健壮性,适用于可视电话和视频会议等实时视频通信应用。
4.虚拟现实(VR)/增强现实(AR)技术
虚拟现实(Virtual Reality,VR)又称人工现实、临境等,是近年来十分活跃的技术领域,是多媒体发展的更高境界,VR技术涵盖了传统多媒体技术的所有内容。VR是一种可以创建和体验虚拟世界的计算机仿真系统,它利用计算机生成一种模拟环境,使用户沉浸到该环境中,让人有种身临其境的感觉。
VR采用计算机技术生成一个逼真的视觉、听觉、触觉、味觉及嗅觉的感知系统,用户可以用人的自然技能与这个生成的虚拟实体进行交互操作,其概念包含3层含义。
虚拟实体是用计算机生成的一个逼真的实体。
用户可以通过人的自然技能(头部转动、眼动、手势或其他身体动作)与该环境交互。
要借助一些三维传感设备来完成交互动作,常用的有头盔立体显示器、数据手套、数据服装和三维鼠标等。
增强现实(Augmented Reality,AR)技术是指把原本在现实世界的一定时间和空间范围内很难体验到的实体信息(视觉信息、声音、味道和触觉等),通过模拟仿真后,再叠加到现实世界中被人类感官所感知,从而达到超越现实的感官体验。增强现实的出现与计算机图形图像技术、空间定位技术和人文智能(Hmanistic Intelligence)等技术的发展密切相关。
(1)计算机图形图像技术。增强现实的用户可以戴上透明的护目镜,透过它看到整个世界,连同计算机生成而投射到这一世界表面的图像,从而使物理世界的景象超出用户的日常经验之外。这种增强的信息可以是在真实环境中与之共存的虚拟物体,也可以是实际存在的物体的非几何信息。
(2)空间定位技术。为了改善效果,增强现实所投射的图像必须在空间定位上与用户相关。
当用户转动或移动头部时,视野变动,计算机产生的增强信息随之做相应的变化。
(3)人文智能。该技术以将处理设备和人的身心能力结合起来为特点,并非仿真人的智能,而是试图发挥传感器、可穿戴计算等技术的优势,使人们能够捕获自己的日常经历、记忆及所见所闻,并与他人进行更有效的交流。
随着计算机图形学、人机接口技术、多媒体技术、传感技术和网络技术等快速发展,虚拟现实和增强现实技术已进入应用阶段,开始对教育、工业生产、旅游、建筑、医疗等领域带来颠覆性影响。
VR/AR技术主要分为桌面式、分布式、沉浸式和增强式4种。表2-7给出了这4类VR/AR的具体定义和特点。
VR/AR技术发展至今,虽然被广泛应用,其主要关键技术还有待深入研究,这些关键技术主要包括:
(1)数据采集与优化传输技术。数据采集主要解决如何获取光照、火焰、动态地形等自然现象的数据问题,通常用3种设备获取,即全向相机、高速摄像机和激光设备。优化数据传输技术是要满足低功耗、低延时、高效率等特点,保证数据传输的可靠性。
(2)交互与情形实时再现技术。交互技术的接触方式可分为力觉反馈和触觉反馈两种。力觉反馈是指借助操作控制杆的反作用力效果将虚拟物体的运动轨迹转换成真实物体的机械运动;触觉反馈是指通过手戴3D数据手套获取手掌和手指的形态和温度等信息,来满足用户对虚拟物体的移动、抓取和触摸等操作。情形实时再现包含了跟踪定位技术、高效可靠的渲染技术和逼真的显示技术等。
领取专属 10元无门槛券
私享最新 技术干货