【多视角立体视觉系列】几何变换的层次——投影变换仿射度量和欧几里德_升博体育网站是多少

【多视角立体视觉系列】几何变换的层次——投影变换仿射度量和欧几里德

文章出处：升博体育网站是多少发表时间： 2023-10-18 18:06:44

【多视角立体视觉系列】几何变换的层次——投影变换，仿射变换，度量变换和欧几里德变换

几何变换很常见，在计算机视觉和图形学上更是如此，而这里指的几何一般是由点，线维图形。几何变换可以在一定程度上完成不同空间几何元素的对应，在很多领域中很有多的应用，立体视觉便是其中一个。本文尝试对四种不一样的几何变换进行辨析，这些几何变换是一系列计算机视觉处理和相机成像的基础，因此有必要进行掌握。如有谬误，请联系指出，转载请注明出处。

研究一个几何问题，通常能通过两种方式进行，第一种是进行“纯粹”的几何研究，也就是说这种研究应该是和所谓坐标系一点关系都没有的，在不使用任何代数方法的情况下，用几何公理推出其他定理，也就是传统的欧几里德几何；第二种，我们其实也是很熟悉的，就是解析几何，由笛卡尔提出并流行，在这种方法中，我们用代数元素，比如向量去表示几何的点，线，面，用点乘，叉乘去表示元素的一系列操作，从而可以用代数方法进行几何关系的推理。由于现在计算机本质上是对数值进行计算，因此通过解析几何的方法，也就是代数法更容易设计计算机可以解决的算法，因此本文首先要对几何元素进行代数表示。

正如我们在前言所说的，几何元素无非就是点线]中其实已经初步探讨过为什么要引进齐次坐标这个概念，然而，这里希望重新进行解释，因此我们将从线的代数表示开始说起。

这个线 = (a,b,c)^\mathrm{T}的组合给决定了，因此可以用l_1这个向量表示这个直线，我们又注意到对于该线)同样成立：

l_2 = k(a,b,c)^\mathrm{T}和l_1表示的是同一个直线，于是我们知道，对于这条直线，其表示有无穷多种，此尺度大小也就是k只要不为0都是等价的。特别的，如果k = \dfrac{1}{c}那么我们的原先的c就变为了1，于是该直线)^\mathrm{T}，其实只需要两个变量就可以决定一个2D直线了。

在该线上。为什么一个二维的点，会需要在尾巴上多一个1去表示呢？显然，这个是我们之前提到的齐次坐标系[3]，但是为什么要这个坐标系，我们虽然之前也提到过，但是本文后面还会继续解释的。

表示，而在面上的点，同样的是在齐次坐标下表示的，为p = (x,y,z,1)^\mathrm{T}。我们发现到，无论是点线面，都能够最终靠一个向量进行表示。

(c_2-c_1)，我们发现其交点是(b,-a,0)^{\mathrm{T}}。如果把这个齐次坐标转变为非齐次坐标，我们有(b/0, -a/0)^{\mathrm{T}}，这个显然是无法计算的，这也意味着平行线的交点都在无穷远处的点上，为了在欧几里德空间中表示这种无穷远处的点，非齐次坐标系是无能为力的，我们只能引入齐次坐标系，也就是在欧几里德空间坐标的基础上，在最后一维再加上一个维度。>

Fig 2.1 即便是平行线也会在无限远处相交，这个相交点称之为理想点。

在之前的章节中，我们用代数的方式定义了很多几何元素，这些几何元素都是在几何变换中的基本变换单元，在本章节，我们将正式起航，讨论在空间中几何变换。我们首先要考虑的是最为熟悉的欧几里德空间，我们日常生活一般可以建模为欧几里德空间，可以定义出一个原点，然后两个或者三个互为正交的坐标轴，然后客体，也就是我们要研究的物体主体就在这个欧式空间中移动，旋转等，我们会发现，这里如果把客体看成是一个刚体，也就是自身不发生形变的物体，那么客体在欧式空间的旋转，平移等，都是所谓的

好的我们继续，注意到，虽然欧几里德空间坐标系一般都有一个原点，有相应的坐标轴，但是这个原点并没有什么特别的地方，坐标轴的方向也没有任何特别的地方，都是我们研究人员为了方便自己设定的，事实上，这个原点和坐标轴我们可以任意的指定，任何一个在

内的，可以用代数表达的原点和坐标轴方向我们都可以指定，只要满足约束条件：

的，意味着每个在欧式空间的点都是等价的，因此你在平移原点坐标，旋转坐标轴的同时，其实也是在进行着一系列的欧式变换。显然了，欧式变换并不能改变客体的实际长度，毕竟是看作刚体而研究的，同时也改变不了客体的线与线之间的角度，当然，平行线更是不会被改变了，原来相对平行的线，经过欧式变换后仍然还是相对平行的，如Fig 3.1所示。这个当然不是理所当然的，几何变换很多是不保留这些几何元素的，如果大家学过绘画或者摄影，就会发现所谓的透视原理就是典型的一种，不过这个暂且作为后话吧。

Fig 3.1 欧式变换之一的旋转，我们发现，原来是直角的，变换后还是直角，原先平行的直线，转换后还是直角。

我们对欧几里德变换有了初步的认识，那么欧几里德变换是不是在研究工作中就足够使用了呢？很遗憾，显然不是的，比如计算机图形学中那么多需要对图形进行放大，缩小的操作在欧几里德变换中显然是失效的。因此我们还需要定义一种变换，能使得放大，缩小能够操作起来有理论依据。

这个其实并不困难，我们只需要在保持原点位置，坐标轴的指向方向不变的情况下，将每个坐标轴都“拉伸”或者“缩小”相同的倍数就行了，注意，是每个坐标轴都是相同的倍数。如果结合起欧几里德变换，那么我们就会发现我们可以旋转，平移，放大缩小我们的研究客体了，我们将其称之为

然而，有了放大缩小，我们似乎还是还缺少了一些变换工具，去描述客体在某个特定方向的单独的拉伸或者缩小，而这在某些特殊情况下的成像中是必须的工具（见[5,6]中的仿射相机部分知识点）。于是我们引入了仿射变换(affine transformation)，在仿射变换中，每个轴不再是像相似性变换中一样都是放缩同样的倍数了，而是可能放缩不同的尺度。注意到，仿射变换包括了相似性变换和欧几里德变换，即是G\{欧几里德变换\} \subseteq G\{相似性变换\} \subseteq G\{仿射变换\}

这样足够了吗？我们成像出来的物体，在引入了仿射变换之后，也就是如果我们用仿射相机去拍摄一个正方体，会形成如Fig 3.2所示的效果的平面图形（当然，忽视虚线部分）。我们会发现，如果光从这个平面图形，我们完全没法推断出这个客体在三维立体空间的深度信息，客体因为在空间中各个部分距离相机中心的距离或多或少有所不同，正如我们在[7]中的“透视投影的若干性质”中曾经讨论过的，这种因为客体深度不同本应该导致投影缩放（foreshortening）在内的投影变形，而这种变形表现出来就是远小近大，在客体某些线条就算本身尺度上是一样的，在投影的平面上都可能会产生一定的比例关系。这种变形有时候正是我们想要的，对于我们人类从平面图形中理解客体在立体工具的深度是不可或缺的存在。因此，如果光用仿射相机，那么形成出来的二维图像就完全失去了推断出客体深度的信息

>

Fig 3.2 在仿射相机角度下的立方体，是没有任何立体感的，因为其线条长度的比例不能体现因为客体不同部件距离相机的距离不同而导致的投影变形，这种变形对于我们人类在平面上认识客体的深度信息，却是非常关键的。

G\{欧几里德变换\} \subseteq G\{相似性变换\} \subseteq G\{仿射变换\} \subseteq G\{投影变换\} \\因此投影变换是一个非常大的种类，其中能解决我们刚才提到的，在二维平面上体现三维客体的深度信息的成像方法，称之为透视法（perspective）

消失点（vanish point），联想到我们曾经定义的理想点的概念，我们大家都知道消失点便是理想点。透视法呈现的图像如Fig 3.3所示：

Fig 3.3 通过透视法绘画得到的场景，可以通过计算线条之间的相对比例从而恢复出相对景深的大小，当然绝对景深光从比例还是不够的，例如你不可能知道这个椅子的绝对尺寸是多少，但是你可以推算出每个椅子之间的具体尺寸比例。

从Fig 3.3中，我们可以通过计算线条比例，从而对场景客体的相对景深进行一定程度上的重建，当然这个重建不是完美的，我们需要很多后续讨论的工具才能更好地进行重建。但是，起码通过投影变换中的透视法，我们能够在二维图像上保存更多的三维客体的信息了。

这里我要插个嘴，到底什么叫做投影（projectivity）呢？我们最为直观的印象就是太阳光照着不可透光的房子，形成的倒影，如Fig 3.4所示。这个直观感觉是正确的，确实我们也是这样定义的：

Fig 3.4 投影，我们的直观印象就是太阳光在不可透光客体上的形成的影子。

是的你没看错，这一章又会和齐次坐标系扯上关系了，不过我们还是从欧几里德几何空间说起吧。还记得我们的欧几里德空间吗，在这个空间里面的变换不管你怎么变换，无限远处的点永远都在无限远处，而有限的点永远都不可能跑到无限远处对吧，这个是显而易见的。这个性质同样在相似几何空间，仿射几何空间成立，有限远的就是有限远的，无限远的就是无限远的，各自为政，谁也不干扰谁。因此在这些空间去描述变换，实际上并不需要齐次坐标系，只需要非齐次坐标系就足够了，因为我们根本就不需要去描述理想点。

但是，我们还有个投影几何空间，而在这个空间里面，几何变换是很“任性”的，变换前后平行性是得不到保证的，为什么呢？因为正是没办法保证平行性，我们才能提供视觉上的深度信息，这个正是我们想要的。平行性得不到保证，意味着变换前是平行的线，我们知道其交点在理想点处，变化后就可能不再平行了，那么其交点就变成了在有限远处的一个点了，反过来也是成立的。这个在非齐次坐标系下根本没办法解决，毕竟非齐次坐标连理想点和理想线，理想面都没办法描述，又怎么能描述其变换过程呢？因此我们正式引入齐次坐标系，在投影几何空间中，我们必须使用齐次坐标系描述变换过程，为了四个种类变换的公式表达的形式上的统一，我们对于这四种几何空间的变换，一致性地采用齐次坐标系。

数学形式的四大类型几何变换在用数学形式描述四大类型的几何变换之前，我们要先探讨下，到底什么叫“几何变换”？几何变换不应该只是几个公式咻咻咻地套进去，然后从一堆数字到另一堆数字的过程，几何变换的过程中，我们要留意的是，到底什么几何元素一直没有改变，而什么几何元素可能会改变的。这种变换前后的不变性，对于研究几何变换来说是很重要的，变换的不变性在计算机视觉中也会提供很重要的点子，是一个不可忽视的要点。不管怎么说，我们接下来要留意几何变换的不变性了。注意，接下来的讨论都在三维空间的例子中讨论，涉及到二维空间时将会特别提醒。

其实自由度是15，虽然他有16个元素，具体原因见[4]中的关于自由度的说明。在投影变换中，只有共线性，切线性和交叉比(cross-ratio)是不变的。共线性我们之前说过了，切线性指的是，在变换前某个直线是某个曲线的切线，那么变换后这个性质同样保留。投影变换不保留平行性，也不保留无限远处的理想点的位置，因此变换前后，无限可能变成有限，反之亦然。

至于交叉比，我们这样理解，假设客体上有四个点共线，那么在选定了参考点之后，其他的共线的点可以被如下式子统一表示：

这个交叉比的具体比例和参考点的选定无关，并且其在投影变换下保持不变。这个性质为我们通过平面的几何体线条比例去计算客体的相对深度信息提供了依据。

如图Fig 5.1所示，这个是一个特殊的投影变换——透视法后的一个正方体的二维透视图。我们得知平行线相交于理想点

仿射变换的数学形式如(5.4)(5.5)所示，可以发现是对投影变换进行了一些元素上的约束后产生的，一般常见的仿射变换子类型包括旋转（rotation），尺度放缩（scale），平移（translation），切变（shear），具体的公式和约束条件见以前的博文[3]。注意到仿射变换前后的不变性继承了投影变换的不变性，也即是共线性，交叉比和切线性。

容易发现的是，仿射变换的自由度是12，并且容易可以验证仿射变换不会移动无限远处的理想面\Pi_{\infty}，可以简单证明下：

因此未曾改变理想面。然而，在理想面上的理想点的位置即便没有从无限远处变成有限远处，在仿射变换下也可能在理想面上发生偏移，也就是说仿射变换不保留理想面上点的位置。这一点可以简单证明下，假设理想面上有一个圆锥线]\mathbf{x}^{\mathrm{T}} \mathbf{C} \mathbf{x} = 0其中

Fig 5.3 这里阐述了描述一个正方体，在投影几何空间和仿射几何空间中的表示方式。

正如我们之前所说的，相似性变换是在欧几里德空间的每个坐标轴都拉伸收缩相同的幅度产生的，那么自然地，理想面上的圆锥曲线形状是不会改变的，至于这个圆锥曲线变得“多大多小”，这种尺度小大的是不影响不变性的。相似性变换的公式如：

是一个正交矩阵，并且其行列式值为1（可以视为进行过归一化）。事实上，这里的\mathbf{R}_M可以视为是旋转矩阵，而

可以视为是将变换前的原点坐标挪到该处，是一个平移偏置向量。而\sigma表示的正是对整个客体的放缩尺寸大小。于是我们得知，整个\mathbf{T}_M的自由度为7，其中3个是朝向相关的自由度，3个是平移相关的，而1个是尺度大小相关的。考虑到相似性变换前后的不变性，除了继承了仿射变换的不变性之外，还添加了两个重要的新的不变性：**相对距离不变 **和角度不变。相对距离不变指的是变换前后每个线条的比例是一定的，线条之间的距离的比例也是不变的；角度不变就很好理解了，变换前后，线条之间的夹角不变。对比仿射变换，相似性变换的理想面的圆锥线有个非常重要的性质，其变换前后形状不变。我们大家可以尝试对此进行证明。正如Fig 5.2所示，我们假设理想面\Pi_{\infty}上的二次曲锥面为

，但是二次曲锥面是一个立体图形，不容易可视化，我们经常用其对偶二次曲锥面为\Omega^{*}表示，其表现为一系列的平面。理想面上的二次曲锥面称之为

。二次曲锥面是在三维情况下的，在平面上的情况，二次曲锥面就变成了圆锥线\omega_{\infty}，其对偶形式为一系列的直线，表示为\omega_{\infty}^*。我们将理想面上的圆锥线称之为绝对圆锥线（Image of Absolute Conic， IAC）。

欧几里德变换在相似性变换的基础上，只是把尺度因子\sigma = 1设置为了1，其他不变，因此在继承了相似性变换的所有不变性特性的基础上，又增加了

相似性变换，自由度7，不变性：交叉比，共线性，切线性，轴方向的相对距离不变，平行不变，理想面不变，

欧几里德变换，自由度6，不变性：交叉比，共线性，切线性，轴方向的相对距离不变，平行不变，理想面不变，相对距离不变，角度不变，绝对圆锥线不变，

PS: 本文引出绝对圆锥线的概念，是为了以后的立体视觉中的恢复重建任务和相机参数标定等任务进行铺垫。

[1]. Hartley R, Zisserman A. Multiple View Geometry in Computer Vision[J]. Kybernetes, 2008, 30(9/10):1865 - 1872.

上一篇:箱变在我国的应用现状及存在问题下一篇:“转”出广阔新天地

【多视角立体视觉系列】几何变换的层次——投影变换仿射度量和欧几里德

预制构件安装式：近半世纪的探究之路

南方电网试点首个预制舱工程顺畅在中山投运

预制舱出产之扶贫小能手-光伏预制舱

新规划！双层飞机座椅！经济舱的乘客也能够平躺了

【多视角立体视觉系列】 几何变换的层次——投影变换仿射度量和欧几里德

预制构件安装式：近半世纪的探究之路

南方电网试点首个预制舱工程顺畅在中山投运

预制舱出产之扶贫小能手-光伏预制舱

新规划！双层飞机座椅！经济舱的乘客也能够平躺了

【多视角立体视觉系列】几何变换的层次——投影变换仿射度量和欧几里德