(5)运动物体生成和全景图生成一样,同样可以用以上3种方法生成。在用照相机拍摄物体时,如果对物体的水平方向和垂直方向各拍摄一圈,就可以对物体进行二维的交互控制。链接是指:①把得到的全景图按一定方式组织起来,供交互式显示用;②把运动物体嵌入到全景图中去,成为“热点”,使用户可以对它进行交互式控制。
图1 全景图制作流程3 全景图像拼接技术的研究3.1全景图生成的经典算法自全景图的概念提出到目前,有很多学者都对全景图的生成算法做过深入的研究,其中mcmillan和szeliski等人的工作尤其突出。mcmillan和bishop提出了全景函数模型,该算法根据摄像机绕轴旋转360度所拍摄的图像序列求解每个相机的参数,由此进行全景图拼接,但是该算法不太适合于照相机,因为它要求两幅图像之间要有超过2/3 的重叠,这样对一个场景如用照相机去采集图像就需要拍摄大量的图片,而这显然增大了图像采集的难度,也增加了计算量和误差量。而且mcmillan试图通过柱面极几何约束实现匹配点自动匹配,但是极几何约束核心基础矩阵对误差过分敏感,也因此导致匹配结果无法实用。szeliski和shum[3]在他们的一系列的文章中提出了用8参数的二维(2d)投影模型求解投影矩阵m。该模型的数学表达如下所示: (1) (2)3.2全景图像拼接算法归类及其比较 现有的全景图像拼接生成算法主要可以分为三类:基于相位的方法、基于流的方法和基于特征的方法。 (1)基于相位的方法:该方法利用傅立叶变换、小波变换等等先对图像进行变换,再利用变换后的图像的某些特征进行匹配。但是如果存在空间上的局部变化,就会导致该方法产生较大误差。 (2)基于流的方法:也叫做基于面积的方法。该方法是通过比较两幅图像亮度(或颜色)差异,并使之最小化来寻找最佳匹配点的。上文描述的两种经典算法就是属于该方法,采用这种方法的还有:duffin [4]和barrett在szeliski研究的基础上提出的一种恢复6个参数模型的算法。基于面积方法的缺点就是它的计算量明显偏大。 (3)基于特征的方法:该方法的主要思想就是从一幅图像中提取一定的特征,如:点、线、边缘等等,并用此特征为匹配模板,在第二幅图像中搜索。该方法可以提高计算速度,但是提取合适的图像特征比较困难。[5] 如何提取合适的图像特征,很多学者在这个方面做了探讨,其中 kim[6]等人利用抽取物体轮廓作为特征,而钟力[7]等人利用重叠图像两列象素的亮度(或颜色)比或者亮度(或颜色)作为特征模板,张鹏[8]等人利用象素灰度值信息提取某一矩形区域作为特征模板进行匹配。需要注意的另一个问题就是采集的图像中重叠部分并不是单纯的平面位移变换,还存在伸缩变形等,所以这也增大了特征提取的难度。 4 算法的选择与改进 以上三种算法都有其自身的特点,当然也有各自的局限性,应该根据全景模型的不同和图像采集方式的差异选择合适的算法。下面根据全景图生成过程详细描述对算法的选择和改进。4.1 全景模型选择本文提出的方法中采用圆柱模式,这种模式相对简单,同时又不影响全景图像浏览的真实性。由于立方体模式过于简单,该模式在展示全景图时存在明显的边界痕迹,降低了全景图像真实性;球面模式虽然相对扩大了全景图浏览的视野,可是也相应增加了算法复杂度和图像采集的难度。4.2 图像采集为了提高图像拼接算法的复杂度处理能力以及能够自适应抖动、光照差、扭曲等。本文对图像采集方式未做过多限制:不用三角架固定相机,绕摄影者中心360度旋转相机拍摄图像,每次拍摄相机旋转的角度为θ,不固定相机的焦距,这样做的目的是进一步提高算法自适应校准图像拼接能力。4.3 图像拼接 首先,抽取合适的图像特征来定位拼接,为了尽可能多的保留图像的特征,利用数字图像处理中的laplace算子边缘检测算法,再加上二值化处理和平滑滤波3*3模板的噪音消除抽取出图像的特征图。 图2 特征提取后图象的二值化图图象经过变换之后,得到了具有重叠相似区域的两幅图象,对于相似区域的寻找,一般的算法都是根据人体视觉特征定义1个模板矢量(pattern vector),对两幅图象分别运算相似距离,根据相似距离来寻找图象的相似部分。本文提出了一种新的重叠区域的搜寻方法,它基于差值图象的极值点搜寻,可以方便地提取两幅图象之间的相似部分,不需要频域上的任何运算。设有两个矩形区域a和b,已知b中包含一个区域a2,a与a2是相同的模块,求b中a2的位置。典型的算法是从b的左下角起,把每一块与a大小相同的区域c与a相比较,得出评价函数,其值最小的区域就是a2。评价函数一般定义为:对于a和c中每一对对应点p和q,(1)考虑到两幅图象的亮度不一样,即使是同一模块,由于亮度不同,评价函数的值也很大,把评价函数定义为: (2)4.4 图像缝合图像缝合分两个步骤。拼接处会有明显的一条缝。可用颜色拟合的方法来调和相邻图象的亮度,生成无缝的合成图象。以合成图象的拼接线为中心,两边各取10个象素点的距离,此区域为矫正区。第一步是图像经过矩阵投影生成新的图像需要用到双性插值。第二步是两幅图像重叠区域之间的线性插值。4.5柱面投影柱面投影变换及其反变换算法的核心是投影变换公式,为此建立坐标系,如图4所示。原始图象i、投影柱面图象j和柱面k,原点为观察点o(投影中心)。设柱面半径为r,投影宽度角为θ,图象宽度为w,高度为h。能很容易得到柱面图象的宽度为r×sin(θ/2),高度仍为h。对图象i上的任意一点p,假设它在图象上的坐标为(x,y),p在柱面图象j上的对应点q,假设q在j上的坐标是(x’,y’)。[5]图3 柱面投影变换这里θ角由每张图象所占的角度唯一确定。一个全景的角度是360º那么每张图象对应的角度就显而易见了一般的θ角约为30 - 40º。最后,根据两幅图像的平移量,柱面投影,最后拼接全景图(见图4和图)。5 实验结果基于全景图的虚拟实景生成系统的实现在是一台windows nt操作系统下的pc工作站,p3-1g,128m内存,显卡(硬件支持opengl加速),使用microsoft visual c++6.0和opengl编程。图4 图象拼接前的情况图5 图象拼接后的全景图6 结论及展望随着基于图象绘制技术发展,全景图现已广泛应用在军事、教育、科研、商业、影视、娱乐、工程训练等,并随着java和internet的发展成为一种快捷、实用、效果很好的虚拟现实漫游系统。本文对基于全景图的虚拟现实模型进行了比较深入的研究,在根据前人对全景图的研究资料中,本文提出了一种基于全景图的虚拟现实系统模型的构想,并给出了较为实用的解决方案,克服了抖动、光照差、扭曲等对全景图的影响,对图象拼接算法作了比较和改进尝试,对圆柱面投影作了较深入的探讨,实用价值高效率。未来基于全景图的虚拟现实各种技术发展将前景广阔。参考文献[1] cai yong, liu xue hui, wu eng hua. image-based rendering: a technology for virtual reality system. journal of software, 1997, 8 (10): 721- 728 ( in chinese)(蔡 勇, 刘学慧, 吴恩华. 基于图像绘制的虚拟现实系统环境.软件学报, 1997, 8 (10) : 721- 728)[2] chen s e. quick time vr ——an image-based approach to virtual environment navigation. in: p roc s iggra ph 95, new york, 1995. 29- 38[3] szeliski r, shum h-y. creating full view panoramic image mosaics and texture-mapped models. in: proc siggra ph‘97,los angeles, california, 1997. 251- 258 [4] kirk duffin, william barrett. globally optimal image mosaics[c].in: proceedings graphics interface’98,19982:217~222[5] brown l g. a survey of image registration techniques. acm computing surveys, 1992, 24 (4): 325- 376[6] min-a kim, sung-soo kim, hwan-gue mosaicing technique using feature-based graph matching algorithm[7] 钟力,张茂军,孙立峰等.360 度柱面全景图象生成算法及其实现[j]. 小型微型计算机系统,1999:20(12):899~903[8] 张鹏,周东翔,郝建新等.ibr技术中柱面全景图镶嵌的快速算法[j].计算机工程,1999;25(12):17~18
中国论文网(www.lunwen.net.cn)免费学术期刊论文发表,目录,论文查重入口,本科毕业论文怎么写,职称论文范文,论文摘要,论文文献资料,毕业论文格式,论文检测降重服务。 返回电子论文列表