增强现实(Augmented Reality,AR)是一个新韵研究领域,是一种通过将计算机产生的图形、文字注释等虚拟信息有机的融合到使用者所看到的真实世界景象中,对人的视觉系统进行景象增强或扩张的技术。Azuma是这样定义增强现实的:虚实结合,实时交互,三维注册。
增强现实的产生得益于六十年代以来计算机图形学技术的迅速发展,实际上图形学领域的虚拟现实技术(Virtual Reality,VR)就是AR技术的前身。增强现实系统的最终目标是要将计算机生成的虚拟环境和人所处的真实环境有机的合成起来,使它们看起来就像一个整体,并通过硬件和软件系统的协调作用,使得身处其中的用户可以以更加自然的方式与环境中的真实和虚拟物体进行三维实时交互。随着硬件的发展和各种实际应用需要的出现,AR技术不再仅仅局限于在视觉上对真实场景进行增强,实际上任何不能被人的感官所察觉但却能被机器(各种传感器)检测到的信息,通过转化,以人可以感觉到的方式(图像、声音、触觉和嗅觉等)叠加到人所处的真实场景中,都能起到对现实的增强作用。
由于增强现实在虚拟现实与真实世界之间的沟壑上架起了一座桥梁。因此,增强现实的应用潜力是相当巨大的。例如:在军事上,可以将计算机产生的虚拟信息(虚拟军事目标、战场环境信息、战略部署信息等)叠加到战场人员所看到的真实场景中,进行模拟战术演练和战术指导;可以利用叠加在真实场景中的图形信息和文字注释信息,以指导操作者对复杂设备进行操作、维护或者修理;在医学上,可以将通过CT或MRI扫描获得的人体透视三维图形叠加在相应的身体部位,对手术过程进行指导可以将增强现实技术应用于游戏和电影电视画面中的特技制作;以及可以利用增强现实系统的虚实结合技术进行辅助教学和进行高度专业化训练等等。由于其在军事、医学、机械、设计、娱乐等领域的良好应用前景,增强现实技术的研究正受.到越来越广泛的重视。
1、增强现实与虚拟现实的区别
与VR技术让用户完全沉浸在一个计算机生成的虚拟环境中不同,增强现实系统产生的是一副合成图像,它是把计算机产生的虚拟物体或其它信息合成到用户看到的真实世界景象中,起到景象增强或扩张的作用使用户能以一种更自然的方式与真实和虚拟的混合世界交互,更好地完成任务。
AR技术与VR技术的一个明显的区别在于两者带给用户的沉浸感程度的差异。VR技术追求的是完全意义上的沉浸感,它包括人的视觉、听觉、触觉等身体感受完全处于系统控制之下。而AR技术所追求的目标恰好相反,它仅仅只是利用虚拟信息对真实景象进行增强,并不改变用户身处真实环境这一客观感受。这实际上也是由AR技术本身的应用背景所决定的:首先,真实环境中的信息过于复杂,其中很多信息是不可能通过建模来由计算机仿真的;其次,AR系统的目标是通过景象增强来辅助用户更好的完成真实环境中的任务,使用户仍然感觉处在真实的任务环境中,而不是处在一个完全与真实世界隔离的虚拟环境中,可以使身处其中的用户在与环境中的物体交互起来更加自然。
无论AR还是VR系统都追求给身处其中的用户一种沉浸感,不同之处在于前者偏重于真实世界,而后者偏重于虚拟景象。沉浸感实现的关键在于系统能够通过各种传感器的输入来实时的跟踪用户的运动和姿态改变,并且相应的调整显示在用户眼前的景象。对于VR系统,它的一个主要性能指标就是要求能够产生与用户运动姿态相一致的虚拟图形输出,也就是要使得用户的运动姿态和虚拟景象显示之间保持同步,由于人体本身的感官系统与眼前的虚拟图形系统之间并没有天然的联系,为使两者能够协调一致,必须在两者之间搭建一个人工桥梁——传感器,由传感器误差等因素而造成的注册错误反映在用户角度是视觉系统与肌肉运动系统的感觉差异,由于人的视觉系统具有视觉暂留的特性,使得VR用户可以逐渐克服和适应这种感觉差异所带来的不适应性。对于AR系统,它的主要性能指标是要求实时地检测出回路中人的头部位置和指向,以便能够根据这些信息实时确定所要添加的虚拟信息在真实空间坐标中的映射位置,从而产生与用户所看到的真实世界景象相匹配的虚拟图形输出。虚实景象注册错误反映在用户角度是我们欲融合为一个整体的两个视觉通道景象视觉匹配上的误差,而人眼对这种视觉上的误差特别的敏感。正是由于人眼的高分辨率及人类视觉系统对差异的高敏感性,即使的微小的注册误差(像素级)都会使用户感到明显的虚实场景的不匹配。因此,与VR系统相比,AR系统对注册精度提出了更高的要求。
从上面对虚拟现实和增强现实技术的分析和比较可以看出,两者是具有一定共性,但存在本质上差别的两个不同的概念。国内外的学者在对这两个概念的关系及定义的理解上存在一定差异,1994年由Milgram等人提出的一种分类方法较好的说明了AR与VR之间的关系(如图1所示)。
图1 Milgram的VR和AR关系诠释图
2、增强现实的系统组成
一个完整的增强现实实用系统是由一组紧密联结、实时工作的硬件部件协同实现的。下面我们来讨论几种典型的AR系统组成。
2.1 Monitor-based增强现实系统
在基于计算机显示器的AR实现方案中,摄像机摄取的真实世界图像输入到计算机中,与计算机图形系统产生的虚拟景象合成,并输出到屏幕显示器,用户从屏幕上看到最终的增强场景图片。它虽然不能带给用户多少沉浸感,但却是一套最简单使用的AR实现方案。由于这套方案的硬件要求很低,因此被实验室中的AR系统研究者们大量采用。Monitor-based增强现实系统实现方案如图2所示。
图2 Monitor-based增强现实系统实现方案
2.2 Video see-through增强现实系统
头盔式显示器(Head-mounted displays-HMD)被广泛应用于虚拟现实系统中,用以增强用户的视觉沉浸感。增强现实技术的研究者们也采用了类似的显示技术,这就是在AR中广泛应用的穿透式HMD。根据具体实现原理又划分为两大类,分别是基于视频合成技术的穿透式HMD(video see-through HMD)和基于光学原理的穿透式HMD(optical see-through HMD)。Video see-through增强现实系统实现方案如图3所示。
图3 Video see-through增强现实系统实现方案
2.3 Optical see-through增强现实系统
在图2、图3所示的两套系统实现方案中,输入计算机中的有两个通道的信息,一个是计算机产生的虚拟信息通道,一个是来自于摄像机的真实场景通道。而在optical see-through HMD实现方案中去处了后者,真实场景的图像经过一定的减光处理后,直接进入人眼,虚拟通道的信息经投影反射后再进入人眼,两者以光学的方法进行合成。Optical see-through增强现实系统实现方案如图4所示。
图4 Optical See-through增强现实系统实现方案
2.4三种系统结构的性能比较
三种AR显示技术实现策略在性能上各有利弊。在基于monitor-based和video see-through显示技术的AR实现中,都通过摄像机来获取真实场景的图像,在计算机中完成虚实图像的结合并输出(如图5所示)。整个过程不可避免的存在一定的系统延迟,这是动态AR应用中虚实注册错误的一个主要产生原因。但这时由于用户的视觉完全在计算机的控制之下,这种系统延迟可以通过计算机内部虚实两个通道的协调配合来进行补偿。而基于optical see-through显示技术的AR实现中,真实场景的视频图像传送是实时的,不受计算机控制,因此不可能用控制视频显示速率的办法来补偿系统延迟。
图5 三种AR显示技术实现原理示意图
另外,在基于monitor-based和video See-through显示技术的AR实现中,可以利用计算机分析输入的视频图像,从真实场景的图像信息中抽取跟踪信息(基准点或图像特征),从而辅助动态AR中虚实景象的注册过程。而基于optical see-through显示技术的AR实现中,可以用来辅助虚实注册的信息只有头盔上位置传感器。
3、增强现实系统的性能指标
下面给出对于一个增强现实实用系统,我们所关心的一些性能指标:
·低成本。为了使得AR系统得到广泛的应用,在系统设计阶段必须尽量压缩系统成本。
·静态AR应用中虚实景象的正确注册。在静态AR应用中,放置在真实场景中的虚拟物体,在用户看来,无论从任意的角度观察,都应该保持三维欧式空间的几何一致性,除非用户或其它物体与它发生交互作用。
·动态AR应用中虚实景象的正确注册。在动态AR应用中,视频图像的刷新率起码要达到15Hz,理想的情况要达到30Hz。要尽量减少系统的计算延时,因为如果虚拟物体的绘制速度跟不上用户的运动速度,将直接导致人体视觉系统与运动系统的不匹配,给用户造成一种虚拟物体在三维空间漂浮的感觉。
·视觉与触觉的匹配一致性。视觉与触觉感官的正确匹配将给人一种“所见即所感”体验。要实现这一点,AR系统中视觉传感器和触觉传感器的工作必须协调一致。当增强图像中显示用户接触到AR场景中的虚拟物体时,触觉传感器必须马上相应的给人一种触摸到物体的感觉,并且视觉和触觉反应的发生必须在同一时间和,同一物体部位。
·虚实景象结合的紧密性。AR系统除了要完成图形系统应用软件中的虚拟物体相片渲染和生成功能,从自身特点出发,由于AR场景中既有虚拟物体又有真实场景中的物体存在,虚拟物体和真实场景中的物体之问可能产生错综复杂的遮掩关系,这使得AR图像生成时的光照和阴影处理变得格外复杂,光照的一致性是实现虚实景象紧密和有机结合的关键。
·用户具有在AR场景中的充分自由度。AR系统中用户充分运动自由度的实现有赖于三维交互手段的完善。理想情况下,AR用户在3D增强场景中交互时应不受机械的限制;能够观察到增强场景中的任何虚实物体,不存在盲点;没有运动方向和方式约束。
·尽量减少定标和运行时的用户设置操作。在成像阶段,为了实现从三维欧式空间到二维平面的映射,AR系统需要对相机进行定标。在系统运行开始和过程中,AR用户还必须完成大量的交互设置操作,如:基准点的测量,3D空间里虚拟物体在真实场景中交互放置等。简化这些操作将有利于AR技术的实用化发展。
需要强调的是,这些仅仅是对完全意义上的增强现实系统所提出的一些理想性能要求。正如前面我们在讨论增强现实技术在军事、医学和娱乐等方面的应用背景时所提到的,大部分的AR应用从实际需要出发,并不需要一定是完全意义上的增强现实系统。
4、 AR技术的现状和发展方向
4.1现状
目前大多数的AR应用是按照如下步骤进行的:首先是计算真实场景到摄像机的坐标系变换,AR系统通过各种传感器(机械式、磁力式、光学式)测量相机相对于真实场景的姿态参数(位置和方向角);通过复杂的相机定标过程获取相机的内部参数(焦距和像元的高宽比等),从而确定三维场景到二维成像平面的坐标系变换;最后通过测量定位,确定虚拟物体在真实场景三维欧式空间里的位置和方向,完成虚拟物体到真实场景的坐标系变换。通过上述步骤,可以得到各个坐标系之间的变换关系,至少在理论上能够实现虚拟物体在真实场景中的绘制和融合。
从其自身实现原理出发,上述传统的AR实现方法存在必然的局限性。位置跟踪和相机定标过程本身就极易出错,这都将直接导致虚实注册错误的发生。而且目前还没有哪个位置传感器能完全满足AR应用系统的要求,总是存在这样和那样的不足。例如,机械式传感器不灵活,因为要求有固定联接,所以对工作空间的幅度有限制。磁力传感器信号容易受周围环境中其它磁场的干扰而发生畸变,其本身具有的延迟特性也可能影响虚实图像的实时注册。
相机定标也是一个复杂且烦琐的过程。相机的内部参数可能随着时间不断变化,因此往往需要不断的重新定标。变焦问题是相机定标中一个很头疼的问题,普通摄像机镜头的焦距可能随着缩放设置或相机自身的移动而随时改变。由于很难实时获得相机精确的缩放设置,因此镜头的焦距一旦变化,就需要重新定标。如果忽略系统的成本要求,可以采用高级的专用相机镜头,对镜头的每一级缩放设置预先定标。
上述位置跟踪和相机定标过程可能产生的错误都将直接导致虚实注册错误的发生。Durlach和Mavor得出结论,由于系统的不精确性和延迟,目前单一的跟踪技术不可能很好的解决AR应用的位置跟踪问题。一个很有希望的发展前景是采用两极跟踪策略,先用传统的位置跟踪技术进行注册过程的粗定位,再利用基于图像分析和计算机视觉的方法进行精确定位校正,通过两种技术的结合最终完成虚实注册的全过程。
4.2发展方向
由上述讨论可见,为了创建和维护一幅虚实景象正确注册的增强场景,需要知道系统的许多先验知识(信息)。这些知识(信息)可能以多种方式呈现,任何一个AR应用都需要以下的一条或更多的系统信息。
·摄像机相对于观测场景的位置和方向角;
·相机的内部参数;
·场景中基准点的位置坐标。
在以上讨论的传统的虚实注册问题解决方法中,都忽略了一个重要的可利用工具——计算机视觉技术。计算机视觉研究中许多成熟的技术成果可用于AR中虚实注册问题的解决,例如可以辅助我们提取场景的结构信息、相机的内部参数和相机相对于场景的姿态角。
计算机视觉技术和传统传感器技术相结合的方法,也是目前AR应用中一个主要的研究方向。例如在预先初始化的过程中确定了相机内部参数的情况下,采用计算机视觉技术与磁力传感器相结合的方法,完成虚实注册问题中的位置跟踪问题。前者对于相临两帧之间变化过大或视觉遮挡的情况无能为力,这时就需要磁力传感器的反馈数据来辅助场景中标识的定位。
上述提到的大多数AR应用有一个共同点,所有的场景都是定义在三维欧式空间中的,所有的虚实注册任务都在3D环境中完成。从二维图像中提取(生成)三维空间定义是一个极易发生错误的过程,如果根据实际应用的需要,可以对这个条件有所放松,即不要求所有的场景都有三维欧式空间定义,那么就有可能不必强调精确的定标和位置跟踪。但由于此时不是工作在3D空间中,那么三维虚拟物体在场景中的放置和绘制就显得比较困难。
有的AR应用为了绕开虚实注册中的定标问题,尝试引入仿射变换理论,即将观测者和物体同处于一个坐标系下,这样就不在需要相机内外部参数的先验知识。研究如何将AR中的触觉感知技术引入到AR应用中来,也是AR技术的一个新的研究领域。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:增强现实技术及其应用