80c1984bdea587d40890d3ec314889242cdc0bb8
[platform/upstream/opencv.git] / doc / tutorials / features2d / homography / homography.markdown
1 Basic concepts of the homography explained with code {#tutorial_homography}
2 ====================================================
3
4 @tableofcontents
5
6 Introduction {#tutorial_homography_Introduction}
7 ============
8
9 This tutorial will demonstrate the basic concepts of the homography with some codes.
10 For detailed explanations about the theory, please refer to a computer vision course or a computer vision book, e.g.:
11 *   Multiple View Geometry in Computer Vision, @cite HartleyZ00.
12 *   An Invitation to 3-D Vision: From Images to Geometric Models, @cite Ma:2003:IVI
13 *   Computer Vision: Algorithms and Applications, @cite RS10
14
15 The tutorial code can be found here [C++](https://github.com/opencv/opencv/tree/3.4/samples/cpp/tutorial_code/features2D/Homography),
16 [Python](https://github.com/opencv/opencv/tree/3.4/samples/python/tutorial_code/features2D/Homography),
17 [Java](https://github.com/opencv/opencv/tree/3.4/samples/java/tutorial_code/features2D/Homography).
18 The images used in this tutorial can be found [here](https://github.com/opencv/opencv/tree/3.4/samples/data) (`left*.jpg`).
19
20 Basic theory {#tutorial_homography_Basic_theory}
21 ------------
22
23 ### What is the homography matrix? {#tutorial_homography_What_is_the_homography_matrix}
24
25 Briefly, the planar homography relates the transformation between two planes (up to a scale factor):
26
27 \f[
28   s
29   \begin{bmatrix}
30   x^{'} \\
31   y^{'} \\
32   1
33   \end{bmatrix} = H
34   \begin{bmatrix}
35   x \\
36   y \\
37   1
38   \end{bmatrix} =
39   \begin{bmatrix}
40   h_{11} & h_{12} & h_{13} \\
41   h_{21} & h_{22} & h_{23} \\
42   h_{31} & h_{32} & h_{33}
43   \end{bmatrix}
44   \begin{bmatrix}
45   x \\
46   y \\
47   1
48   \end{bmatrix}
49 \f]
50
51 The homography matrix is a `3x3` matrix but with 8 DoF (degrees of freedom) as it is estimated up to a scale. It is generally normalized (see also \ref lecture_16 "1")
52 with \f$ h_{33} = 1 \f$ or \f$ h_{11}^2 + h_{12}^2 + h_{13}^2 + h_{21}^2 + h_{22}^2 + h_{23}^2 + h_{31}^2 + h_{32}^2 + h_{33}^2 = 1 \f$.
53
54 The following examples show different kinds of transformation but all relate a transformation between two planes.
55
56 *   a planar surface and the image plane (image taken from \ref projective_transformations "2")
57
58 ![](images/homography_transformation_example1.jpg)
59
60 *   a planar surface viewed by two camera positions (images taken from \ref szeliski "3" and \ref projective_transformations "2")
61
62 ![](images/homography_transformation_example2.jpg)
63
64 *   a rotating camera around its axis of projection, equivalent to consider that the points are on a plane at infinity (image taken from \ref projective_transformations "2")
65
66 ![](images/homography_transformation_example3.jpg)
67
68 ### How the homography transformation can be useful? {#tutorial_homography_How_the_homography_transformation_can_be_useful}
69
70 *   Camera pose estimation from coplanar points for augmented reality with marker for instance (see the previous first example)
71
72 ![](images/homography_pose_estimation.jpg)
73
74 *   Perspective removal / correction (see the previous second example)
75
76 ![](images/homography_perspective_correction.jpg)
77
78 *   Panorama stitching (see the previous second and third example)
79
80 ![](images/homography_panorama_stitching.jpg)
81
82 Demonstration codes {#tutorial_homography_Demonstration_codes}
83 -------------------
84
85 ### Demo 1: Pose estimation from coplanar points {#tutorial_homography_Demo1}
86
87 \note Please note that the code to estimate the camera pose from the homography is an example and you should use instead @ref cv::solvePnP if you want to estimate the camera pose for a planar or an arbitrary object.
88
89 The homography can be estimated using for instance the Direct Linear Transform (DLT) algorithm (see \ref lecture_16 "1" for more information).
90 As the object is planar, the transformation between points expressed in the object frame and projected points into the image plane expressed in the normalized camera frame is a homography. Only because the object is planar,
91 the camera pose can be retrieved from the homography, assuming the camera intrinsic parameters are known (see \ref projective_transformations "2" or \ref answer_dsp "4").
92 This can be tested easily using a chessboard object and `findChessboardCorners()` to get the corner locations in the image.
93
94 The first thing consists to detect the chessboard corners, the chessboard size (`patternSize`), here `9x6`, is required:
95
96 @snippet pose_from_homography.cpp find-chessboard-corners
97
98 ![](images/homography_pose_chessboard_corners.jpg)
99
100 The object points expressed in the object frame can be computed easily knowing the size of a chessboard square:
101
102 @snippet pose_from_homography.cpp compute-chessboard-object-points
103
104 The coordinate `Z=0` must be removed for the homography estimation part:
105
106 @snippet pose_from_homography.cpp compute-object-points
107
108 The image points expressed in the normalized camera can be computed from the corner points and by applying a reverse perspective transformation using the camera intrinsics and the distortion coefficients:
109
110 @snippet pose_from_homography.cpp load-intrinsics
111
112 @snippet pose_from_homography.cpp compute-image-points
113
114 The homography can then be estimated with:
115
116 @snippet pose_from_homography.cpp estimate-homography
117
118 A quick solution to retrieve the pose from the homography matrix is (see \ref pose_ar "5"):
119
120 @snippet pose_from_homography.cpp pose-from-homography
121
122 \f[
123   \begin{align*}
124   \boldsymbol{X} &= \left( X, Y, 0, 1 \right ) \\
125   \boldsymbol{x} &= \boldsymbol{P}\boldsymbol{X} \\
126                  &= \boldsymbol{K} \left[ \boldsymbol{r_1} \hspace{0.5em} \boldsymbol{r_2} \hspace{0.5em} \boldsymbol{r_3} \hspace{0.5em} \boldsymbol{t} \right ]
127   \begin{pmatrix}
128   X \\
129   Y \\
130   0 \\
131   1
132   \end{pmatrix} \\
133              &= \boldsymbol{K} \left[ \boldsymbol{r_1} \hspace{0.5em} \boldsymbol{r_2} \hspace{0.5em} \boldsymbol{t} \right ]
134   \begin{pmatrix}
135   X \\
136   Y \\
137   1
138   \end{pmatrix} \\
139   &= \boldsymbol{H}
140   \begin{pmatrix}
141   X \\
142   Y \\
143   1
144   \end{pmatrix}
145   \end{align*}
146 \f]
147
148 \f[
149   \begin{align*}
150   \boldsymbol{H} &= \lambda \boldsymbol{K} \left[ \boldsymbol{r_1} \hspace{0.5em} \boldsymbol{r_2} \hspace{0.5em} \boldsymbol{t} \right ] \\
151   \boldsymbol{K}^{-1} \boldsymbol{H} &= \lambda \left[ \boldsymbol{r_1} \hspace{0.5em} \boldsymbol{r_2} \hspace{0.5em} \boldsymbol{t} \right ] \\
152   \boldsymbol{P} &= \boldsymbol{K} \left[ \boldsymbol{r_1} \hspace{0.5em} \boldsymbol{r_2} \hspace{0.5em} \left( \boldsymbol{r_1} \times \boldsymbol{r_2} \right ) \hspace{0.5em} \boldsymbol{t} \right ]
153   \end{align*}
154 \f]
155
156 This is a quick solution (see also \ref projective_transformations "2") as this does not ensure that the resulting rotation matrix will be orthogonal and the scale is estimated roughly by normalize the first column to 1.
157
158 A solution to have a proper rotation matrix (with the properties of a rotation matrix) consists to apply a polar decomposition
159 (see \ref polar_decomposition "6" or \ref polar_decomposition_svd "7" for some information):
160
161 @snippet pose_from_homography.cpp polar-decomposition-of-the-rotation-matrix
162
163 To check the result, the object frame projected into the image with the estimated camera pose is displayed:
164
165 ![](images/homography_pose.jpg)
166
167 ### Demo 2: Perspective correction {#tutorial_homography_Demo2}
168
169 In this example, a source image will be transformed into a desired perspective view by computing the homography that maps the source points into the desired points.
170 The following image shows the source image (left) and the chessboard view that we want to transform into the desired chessboard view (right).
171
172 ![Source and desired views](images/homography_source_desired_images.jpg)
173
174 The first step consists to detect the chessboard corners in the source and desired images:
175
176 @add_toggle_cpp
177 @snippet perspective_correction.cpp find-corners
178 @end_toggle
179
180 @add_toggle_python
181 @snippet samples/python/tutorial_code/features2D/Homography/perspective_correction.py find-corners
182 @end_toggle
183
184 @add_toggle_java
185 @snippet samples/java/tutorial_code/features2D/Homography/PerspectiveCorrection.java find-corners
186 @end_toggle
187
188 The homography is estimated easily with:
189
190 @add_toggle_cpp
191 @snippet perspective_correction.cpp estimate-homography
192 @end_toggle
193
194 @add_toggle_python
195 @snippet samples/python/tutorial_code/features2D/Homography/perspective_correction.py estimate-homography
196 @end_toggle
197
198 @add_toggle_java
199 @snippet samples/java/tutorial_code/features2D/Homography/PerspectiveCorrection.java estimate-homography
200 @end_toggle
201
202 To warp the source chessboard view into the desired chessboard view, we use @ref cv::warpPerspective
203
204 @add_toggle_cpp
205 @snippet perspective_correction.cpp warp-chessboard
206 @end_toggle
207
208 @add_toggle_python
209 @snippet samples/python/tutorial_code/features2D/Homography/perspective_correction.py warp-chessboard
210 @end_toggle
211
212 @add_toggle_java
213 @snippet samples/java/tutorial_code/features2D/Homography/PerspectiveCorrection.java warp-chessboard
214 @end_toggle
215
216 The result image is:
217
218 ![](images/homography_perspective_correction_chessboard_warp.jpg)
219
220 To compute the coordinates of the source corners transformed by the homography:
221
222 @add_toggle_cpp
223 @snippet perspective_correction.cpp compute-transformed-corners
224 @end_toggle
225
226 @add_toggle_python
227 @snippet samples/python/tutorial_code/features2D/Homography/perspective_correction.py compute-transformed-corners
228 @end_toggle
229
230 @add_toggle_java
231 @snippet samples/java/tutorial_code/features2D/Homography/PerspectiveCorrection.java compute-transformed-corners
232 @end_toggle
233
234 To check the correctness of the calculation, the matching lines are displayed:
235
236 ![](images/homography_perspective_correction_chessboard_matches.jpg)
237
238 ### Demo 3: Homography from the camera displacement {#tutorial_homography_Demo3}
239
240 The homography relates the transformation between two planes and it is possible to retrieve the corresponding camera displacement that allows to go from the first to the second plane view (see @cite Malis for more information).
241 Before going into the details that allow to compute the homography from the camera displacement, some recalls about camera pose and homogeneous transformation.
242
243 The function @ref cv::solvePnP allows to compute the camera pose from the correspondences 3D object points (points expressed in the object frame) and the projected 2D image points (object points viewed in the image).
244 The intrinsic parameters and the distortion coefficients are required (see the camera calibration process).
245
246 \f[
247   \begin{align*}
248   s
249   \begin{bmatrix}
250   u \\
251   v \\
252   1
253   \end{bmatrix} &=
254   \begin{bmatrix}
255   f_x & 0 & c_x \\
256   0 & f_y & c_y \\
257   0 & 0 & 1
258   \end{bmatrix}
259   \begin{bmatrix}
260   r_{11} & r_{12} & r_{13} & t_x \\
261   r_{21} & r_{22} & r_{23} & t_y \\
262   r_{31} & r_{32} & r_{33} & t_z
263   \end{bmatrix}
264   \begin{bmatrix}
265   X_o \\
266   Y_o \\
267   Z_o \\
268   1
269   \end{bmatrix} \\
270   &= \boldsymbol{K} \hspace{0.2em} ^{c}\textrm{M}_o
271   \begin{bmatrix}
272   X_o \\
273   Y_o \\
274   Z_o \\
275   1
276   \end{bmatrix}
277   \end{align*}
278 \f]
279
280 \f$ \boldsymbol{K} \f$ is the intrinsic matrix and \f$ ^{c}\textrm{M}_o \f$ is the camera pose. The output of @ref cv::solvePnP is exactly this: `rvec` is the Rodrigues rotation vector and `tvec` the translation vector.
281
282 \f$ ^{c}\textrm{M}_o \f$ can be represented in a homogeneous form and allows to transform a point expressed in the object frame into the camera frame:
283
284 \f[
285   \begin{align*}
286   \begin{bmatrix}
287   X_c \\
288   Y_c \\
289   Z_c \\
290   1
291   \end{bmatrix} &=
292   \hspace{0.2em} ^{c}\textrm{M}_o
293   \begin{bmatrix}
294   X_o \\
295   Y_o \\
296   Z_o \\
297   1
298   \end{bmatrix} \\
299   &=
300   \begin{bmatrix}
301   ^{c}\textrm{R}_o & ^{c}\textrm{t}_o \\
302   0_{1\times3} & 1
303   \end{bmatrix}
304   \begin{bmatrix}
305   X_o \\
306   Y_o \\
307   Z_o \\
308   1
309   \end{bmatrix} \\
310   &=
311   \begin{bmatrix}
312   r_{11} & r_{12} & r_{13} & t_x \\
313   r_{21} & r_{22} & r_{23} & t_y \\
314   r_{31} & r_{32} & r_{33} & t_z \\
315   0 & 0 & 0 & 1
316   \end{bmatrix}
317   \begin{bmatrix}
318   X_o \\
319   Y_o \\
320   Z_o \\
321   1
322   \end{bmatrix}
323   \end{align*}
324 \f]
325
326 Transform a point expressed in one frame to another frame can be easily done with matrix multiplication:
327
328 *   \f$ ^{c_1}\textrm{M}_o \f$ is the camera pose for the camera 1
329 *   \f$ ^{c_2}\textrm{M}_o \f$ is the camera pose for the camera 2
330
331 To transform a 3D point expressed in the camera 1 frame to the camera 2 frame:
332
333 \f[
334   ^{c_2}\textrm{M}_{c_1} = \hspace{0.2em} ^{c_2}\textrm{M}_{o} \cdot \hspace{0.1em} ^{o}\textrm{M}_{c_1} = \hspace{0.2em} ^{c_2}\textrm{M}_{o} \cdot \hspace{0.1em} \left( ^{c_1}\textrm{M}_{o} \right )^{-1} =
335   \begin{bmatrix}
336   ^{c_2}\textrm{R}_{o} & ^{c_2}\textrm{t}_{o} \\
337   0_{3 \times 1} & 1
338   \end{bmatrix} \cdot
339   \begin{bmatrix}
340   ^{c_1}\textrm{R}_{o}^T & - \hspace{0.2em} ^{c_1}\textrm{R}_{o}^T \cdot \hspace{0.2em} ^{c_1}\textrm{t}_{o} \\
341   0_{1 \times 3} & 1
342   \end{bmatrix}
343 \f]
344
345 In this example, we will compute the camera displacement between two camera poses with respect to the chessboard object. The first step consists to compute the camera poses for the two images:
346
347 @snippet homography_from_camera_displacement.cpp compute-poses
348
349 ![](images/homography_camera_displacement_poses.jpg)
350
351 The camera displacement can be computed from the camera poses using the formulas above:
352
353 @snippet homography_from_camera_displacement.cpp compute-c2Mc1
354
355 The homography related to a specific plane computed from the camera displacement is:
356
357 ![By Homography-transl.svg: Per Rosengren derivative work: Appoose (Homography-transl.svg) [CC BY 3.0 (http://creativecommons.org/licenses/by/3.0)], via Wikimedia Commons](images/homography_camera_displacement.png)
358
359 On this figure, `n` is the normal vector of the plane and `d` the distance between the camera frame and the plane along the plane normal.
360 The [equation](https://en.wikipedia.org/wiki/Homography_(computer_vision)#3D_plane_to_plane_equation) to compute the homography from the camera displacement is:
361
362 \f[
363   ^{2}\textrm{H}_{1} = \hspace{0.2em} ^{2}\textrm{R}_{1} - \hspace{0.1em} \frac{^{2}\textrm{t}_{1} \cdot n^T}{d}
364 \f]
365
366 Where \f$ ^{2}\textrm{H}_{1} \f$ is the homography matrix that maps the points in the first camera frame to the corresponding points in the second camera frame, \f$ ^{2}\textrm{R}_{1} = \hspace{0.2em} ^{c_2}\textrm{R}_{o} \cdot \hspace{0.1em} ^{c_1}\textrm{R}_{o}^{T} \f$
367 is the rotation matrix that represents the rotation between the two camera frames and \f$ ^{2}\textrm{t}_{1} = \hspace{0.2em} ^{c_2}\textrm{R}_{o} \cdot \left( - \hspace{0.1em} ^{c_1}\textrm{R}_{o}^{T} \cdot \hspace{0.1em} ^{c_1}\textrm{t}_{o} \right ) + \hspace{0.1em} ^{c_2}\textrm{t}_{o} \f$
368 the translation vector between the two camera frames.
369
370 Here the normal vector `n` is the plane normal expressed in the camera frame 1 and can be computed as the cross product of 2 vectors (using 3 non collinear points that lie on the plane) or in our case directly with:
371
372 @snippet homography_from_camera_displacement.cpp compute-plane-normal-at-camera-pose-1
373
374 The distance `d` can be computed as the dot product between the plane normal and a point on the plane or by computing the [plane equation](http://mathworld.wolfram.com/Plane.html) and using the D coefficient:
375
376 @snippet homography_from_camera_displacement.cpp compute-plane-distance-to-the-camera-frame-1
377
378 The projective homography matrix \f$ \textbf{G} \f$ can be computed from the Euclidean homography \f$ \textbf{H} \f$ using the intrinsic matrix \f$ \textbf{K} \f$ (see @cite Malis), here assuming the same camera between the two plane views:
379
380 \f[
381   \textbf{G} = \gamma \textbf{K} \textbf{H} \textbf{K}^{-1}
382 \f]
383
384 @snippet homography_from_camera_displacement.cpp compute-homography
385
386 In our case, the Z-axis of the chessboard goes inside the object whereas in the homography figure it goes outside. This is just a matter of sign:
387
388 \f[
389   ^{2}\textrm{H}_{1} = \hspace{0.2em} ^{2}\textrm{R}_{1} + \hspace{0.1em} \frac{^{2}\textrm{t}_{1} \cdot n^T}{d}
390 \f]
391
392 @snippet homography_from_camera_displacement.cpp compute-homography-from-camera-displacement
393
394 We will now compare the projective homography computed from the camera displacement with the one estimated with @ref cv::findHomography
395
396 ```
397 findHomography H:
398 [0.32903393332201, -1.244138808862929, 536.4769088231476;
399  0.6969763913334046, -0.08935909072571542, -80.34068504082403;
400  0.00040511729592961, -0.001079740100565013, 0.9999999999999999]
401
402 homography from camera displacement:
403 [0.4160569997384721, -1.306889006892538, 553.7055461075881;
404  0.7917584252773352, -0.06341244158456338, -108.2770029401219;
405  0.0005926357240956578, -0.001020651672127799, 1]
406
407 ```
408
409 The homography matrices are similar. If we compare the image 1 warped using both homography matrices:
410
411 ![Left: image warped using the homography estimated. Right: using the homography computed from the camera displacement](images/homography_camera_displacement_compare.jpg)
412
413 Visually, it is hard to distinguish a difference between the result image from the homography computed from the camera displacement and the one estimated with @ref cv::findHomography function.
414
415 ### Demo 4: Decompose the homography matrix {#tutorial_homography_Demo4}
416
417 OpenCV 3 contains the function @ref cv::decomposeHomographyMat which allows to decompose the homography matrix to a set of rotations, translations and plane normals.
418 First we will decompose the homography matrix computed from the camera displacement:
419
420 @snippet decompose_homography.cpp compute-homography-from-camera-displacement
421
422 The results of @ref cv::decomposeHomographyMat are:
423
424 @snippet decompose_homography.cpp decompose-homography-from-camera-displacement
425
426 ```
427 Solution 0:
428 rvec from homography decomposition: [-0.0919829920641369, -0.5372581036567992, 1.310868863540717]
429 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
430 tvec from homography decomposition: [-0.7747961019053186, -0.02751124463434032, -0.6791980037590677] and scaled by d: [-0.1578091561210742, -0.005603443652993778, -0.1383378976078466]
431 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
432 plane normal from homography decomposition: [-0.1973513139420648, 0.6283451996579074, -0.7524857267431757]
433 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
434
435 Solution 1:
436 rvec from homography decomposition: [-0.0919829920641369, -0.5372581036567992, 1.310868863540717]
437 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
438 tvec from homography decomposition: [0.7747961019053186, 0.02751124463434032, 0.6791980037590677] and scaled by d: [0.1578091561210742, 0.005603443652993778, 0.1383378976078466]
439 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
440 plane normal from homography decomposition: [0.1973513139420648, -0.6283451996579074, 0.7524857267431757]
441 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
442
443 Solution 2:
444 rvec from homography decomposition: [0.1053487907109967, -0.1561929144786397, 1.401356552358475]
445 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
446 tvec from homography decomposition: [-0.4666552552894618, 0.1050032934770042, -0.913007654671646] and scaled by d: [-0.0950475510338766, 0.02138689274867372, -0.1859598508065552]
447 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
448 plane normal from homography decomposition: [-0.3131715472900788, 0.8421206145721947, -0.4390403768225507]
449 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
450
451 Solution 3:
452 rvec from homography decomposition: [0.1053487907109967, -0.1561929144786397, 1.401356552358475]
453 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
454 tvec from homography decomposition: [0.4666552552894618, -0.1050032934770042, 0.913007654671646] and scaled by d: [0.0950475510338766, -0.02138689274867372, 0.1859598508065552]
455 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
456 plane normal from homography decomposition: [0.3131715472900788, -0.8421206145721947, 0.4390403768225507]
457 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
458 ```
459
460 The result of the decomposition of the homography matrix can only be recovered up to a scale factor that corresponds in fact to the distance `d` as the normal is unit length.
461 As you can see, there is one solution that matches almost perfectly with the computed camera displacement. As stated in the documentation:
462
463 ```
464 At least two of the solutions may further be invalidated if point correspondences are available by applying positive depth constraint (all points must be in front of the camera).
465 ```
466
467 As the result of the decomposition is a camera displacement, if we have the initial camera pose \f$ ^{c_1}\textrm{M}_{o} \f$, we can compute the current camera pose
468 \f$ ^{c_2}\textrm{M}_{o} = \hspace{0.2em} ^{c_2}\textrm{M}_{c_1} \cdot \hspace{0.1em} ^{c_1}\textrm{M}_{o} \f$ and test if the 3D object points that belong to the plane are projected in front of the camera or not.
469 Another solution could be to retain the solution with the closest normal if we know the plane normal expressed at the camera 1 pose.
470
471 The same thing but with the homography matrix estimated with @ref cv::findHomography
472
473 ```
474 Solution 0:
475 rvec from homography decomposition: [0.1552207729599141, -0.152132696119647, 1.323678695078694]
476 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
477 tvec from homography decomposition: [-0.4482361704818117, 0.02485247635491922, -1.034409687207331] and scaled by d: [-0.09129598307571339, 0.005061910238634657, -0.2106868109173855]
478 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
479 plane normal from homography decomposition: [-0.1384902722707529, 0.9063331452766947, -0.3992250922214516]
480 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
481
482 Solution 1:
483 rvec from homography decomposition: [0.1552207729599141, -0.152132696119647, 1.323678695078694]
484 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
485 tvec from homography decomposition: [0.4482361704818117, -0.02485247635491922, 1.034409687207331] and scaled by d: [0.09129598307571339, -0.005061910238634657, 0.2106868109173855]
486 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
487 plane normal from homography decomposition: [0.1384902722707529, -0.9063331452766947, 0.3992250922214516]
488 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
489
490 Solution 2:
491 rvec from homography decomposition: [-0.2886605671759886, -0.521049903923871, 1.381242030882511]
492 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
493 tvec from homography decomposition: [-0.8705961357284295, 0.1353018038908477, -0.7037702049789747] and scaled by d: [-0.177321544550518, 0.02755804196893467, -0.1433427218822783]
494 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
495 plane normal from homography decomposition: [-0.2284582117722427, 0.6009247303964522, -0.7659610393954643]
496 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
497
498 Solution 3:
499 rvec from homography decomposition: [-0.2886605671759886, -0.521049903923871, 1.381242030882511]
500 rvec from camera displacement: [-0.09198299206413783, -0.5372581036567995, 1.310868863540717]
501 tvec from homography decomposition: [0.8705961357284295, -0.1353018038908477, 0.7037702049789747] and scaled by d: [0.177321544550518, -0.02755804196893467, 0.1433427218822783]
502 tvec from camera displacement: [0.1578091561210745, 0.005603443652993617, 0.1383378976078466]
503 plane normal from homography decomposition: [0.2284582117722427, -0.6009247303964522, 0.7659610393954643]
504 plane normal at camera 1 pose: [0.1973513139420654, -0.6283451996579068, 0.752485726743176]
505 ```
506
507 Again, there is also a solution that matches with the computed camera displacement.
508
509 ### Demo 5: Basic panorama stitching from a rotating camera {#tutorial_homography_Demo5}
510
511 \note This example is made to illustrate the concept of image stitching based on a pure rotational motion of the camera and should not be used to stitch panorama images.
512 The [stitching module](@ref stitching) provides a complete pipeline to stitch images.
513
514 The homography transformation applies only for planar structure. But in the case of a rotating camera (pure rotation around the camera axis of projection, no translation), an arbitrary world can be considered
515 ([see previously](@ref tutorial_homography_What_is_the_homography_matrix)).
516
517 The homography can then be computed using the rotation transformation and the camera intrinsic parameters as (see for instance \ref homography_course "8"):
518
519 \f[
520   s
521   \begin{bmatrix}
522   x^{'} \\
523   y^{'} \\
524   1
525   \end{bmatrix} =
526   \bf{K} \hspace{0.1em} \bf{R} \hspace{0.1em} \bf{K}^{-1}
527   \begin{bmatrix}
528   x \\
529   y \\
530   1
531   \end{bmatrix}
532 \f]
533
534 To illustrate, we used Blender, a free and open-source 3D computer graphics software, to generate two camera views with only a rotation transformation between each other.
535 More information about how to retrieve the camera intrinsic parameters and the `3x4` extrinsic matrix with respect to the world can be found in \ref answer_blender "9" (an additional transformation
536 is needed to get the transformation between the camera and the object frames) with Blender.
537
538 The figure below shows the two generated views of the Suzanne model, with only a rotation transformation:
539
540 ![](images/homography_stitch_compare.jpg)
541
542 With the known associated camera poses and the intrinsic parameters, the relative rotation between the two views can be computed:
543
544 @add_toggle_cpp
545 @snippet panorama_stitching_rotating_camera.cpp extract-rotation
546 @end_toggle
547
548 @add_toggle_python
549 @snippet samples/python/tutorial_code/features2D/Homography/panorama_stitching_rotating_camera.py extract-rotation
550 @end_toggle
551
552 @add_toggle_java
553 @snippet samples/java/tutorial_code/features2D/Homography/PanoramaStitchingRotatingCamera.java extract-rotation
554 @end_toggle
555
556 @add_toggle_cpp
557 @snippet panorama_stitching_rotating_camera.cpp compute-rotation-displacement
558 @end_toggle
559
560 @add_toggle_python
561 @snippet samples/python/tutorial_code/features2D/Homography/panorama_stitching_rotating_camera.py compute-rotation-displacement
562 @end_toggle
563
564 @add_toggle_java
565 @snippet samples/java/tutorial_code/features2D/Homography/PanoramaStitchingRotatingCamera.java compute-rotation-displacement
566 @end_toggle
567
568 Here, the second image will be stitched with respect to the first image. The homography can be calculated using the formula above:
569
570 @add_toggle_cpp
571 @snippet panorama_stitching_rotating_camera.cpp compute-homography
572 @end_toggle
573
574 @add_toggle_python
575 @snippet samples/python/tutorial_code/features2D/Homography/panorama_stitching_rotating_camera.py compute-homography
576 @end_toggle
577
578 @add_toggle_java
579 @snippet samples/java/tutorial_code/features2D/Homography/PanoramaStitchingRotatingCamera.java compute-homography
580 @end_toggle
581
582 The stitching is made simply with:
583
584 @add_toggle_cpp
585 @snippet panorama_stitching_rotating_camera.cpp stitch
586 @end_toggle
587
588 @add_toggle_python
589 @snippet samples/python/tutorial_code/features2D/Homography/panorama_stitching_rotating_camera.py stitch
590 @end_toggle
591
592 @add_toggle_java
593 @snippet samples/java/tutorial_code/features2D/Homography/PanoramaStitchingRotatingCamera.java stitch
594 @end_toggle
595
596 The resulting image is:
597
598 ![](images/homography_stitch_Suzanne.jpg)
599
600 Additional references {#tutorial_homography_Additional_references}
601 ---------------------
602
603 *   \anchor lecture_16 1. [Lecture 16: Planar Homographies](http://www.cse.psu.edu/~rtc12/CSE486/lecture16.pdf), Robert Collins
604 *   \anchor projective_transformations 2. [2D projective transformations (homographies)](https://ags.cs.uni-kl.de/fileadmin/inf_ags/3dcv-ws11-12/3DCV_WS11-12_lec04.pdf), Christiano Gava, Gabriele Bleser
605 *   \anchor szeliski 3. [Computer Vision: Algorithms and Applications](http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf), Richard Szeliski
606 *   \anchor answer_dsp 4. [Step by Step Camera Pose Estimation for Visual Tracking and Planar Markers](https://dsp.stackexchange.com/a/2737)
607 *   \anchor pose_ar 5. [Pose from homography estimation](https://team.inria.fr/lagadic/camera_localization/tutorial-pose-dlt-planar-opencv.html)
608 *   \anchor polar_decomposition 6. [Polar Decomposition (in Continuum Mechanics)](http://www.continuummechanics.org/polardecomposition.html)
609 *   \anchor polar_decomposition_svd 7. [A Personal Interview with the Singular Value Decomposition](https://web.stanford.edu/~gavish/documents/SVD_ans_you.pdf), Matan Gavish
610 *   \anchor homography_course 8. [Homography](http://people.scs.carleton.ca/~c_shu/Courses/comp4900d/notes/homography.pdf), Dr. Gerhard Roth
611 *   \anchor answer_blender 9. [3x4 camera matrix from blender camera](https://blender.stackexchange.com/a/38210)