Merge pull request #1263 from abidrahmank:pyCLAHE_24
[profile/ivi/opencv.git] / modules / video / doc / motion_analysis_and_object_tracking.rst
1 Motion Analysis and Object Tracking
2 ===================================
3
4 .. highlight:: cpp
5
6
7 calcOpticalFlowPyrLK
8 ------------------------
9 Calculates an optical flow for a sparse feature set using the iterative Lucas-Kanade method with pyramids.
10
11 .. ocv:function:: void calcOpticalFlowPyrLK( InputArray prevImg, InputArray nextImg, InputArray prevPts, InputOutputArray nextPts, OutputArray status, OutputArray err, Size winSize=Size(21,21), int maxLevel=3, TermCriteria criteria=TermCriteria(TermCriteria::COUNT+TermCriteria::EPS, 30, 0.01), int flags=0, double minEigThreshold=1e-4 )
12
13 .. ocv:pyfunction:: cv2.calcOpticalFlowPyrLK(prevImg, nextImg, prevPts[, nextPts[, status[, err[, winSize[, maxLevel[, criteria[, flags[, minEigThreshold]]]]]]]]) -> nextPts, status, err
14
15 .. ocv:cfunction:: void cvCalcOpticalFlowPyrLK( const CvArr* prev, const CvArr* curr, CvArr* prev_pyr, CvArr* curr_pyr, const CvPoint2D32f* prev_features, CvPoint2D32f* curr_features, int count, CvSize win_size, int level, char* status, float* track_error, CvTermCriteria criteria, int flags )
16 .. ocv:pyoldfunction:: cv.CalcOpticalFlowPyrLK(prev, curr, prevPyr, currPyr, prevFeatures, winSize, level, criteria, flags, guesses=None) -> (currFeatures, status, track_error)
17
18     :param prevImg: first 8-bit input image or pyramid constructed by :ocv:func:`buildOpticalFlowPyramid`.
19
20     :param nextImg: second input image or pyramid of the same size and the same type as ``prevImg``.
21
22     :param prevPts: vector of 2D points for which the flow needs to be found; point coordinates must be single-precision floating-point numbers.
23
24     :param nextPts: output vector of 2D points (with single-precision floating-point coordinates) containing the calculated new positions of input features in the second image; when ``OPTFLOW_USE_INITIAL_FLOW`` flag is passed, the vector must have the same size as in the input.
25
26     :param status: output status vector (of unsigned chars); each element of the vector is set to 1 if the flow for the corresponding features has been found, otherwise, it is set to 0.
27
28     :param err: output vector of errors; each element of the vector is set to an error for the corresponding feature, type of the error measure can be set in ``flags`` parameter; if the flow wasn't found then the error is not defined (use the ``status`` parameter to find such cases).
29
30     :param winSize: size of the search window at each pyramid level.
31
32     :param maxLevel: 0-based maximal pyramid level number; if set to 0, pyramids are not used (single level), if set to 1, two levels are used, and so on; if pyramids are passed to input then algorithm will use as many levels as pyramids have but no more than ``maxLevel``.
33
34     :param criteria: parameter, specifying the termination criteria of the iterative search algorithm (after the specified maximum number of iterations  ``criteria.maxCount``  or when the search window moves by less than  ``criteria.epsilon``.
35
36     :param flags: operation flags:
37
38         * **OPTFLOW_USE_INITIAL_FLOW** uses initial estimations, stored in ``nextPts``; if the flag is not set, then ``prevPts`` is copied to ``nextPts`` and is considered the initial estimate.
39         * **OPTFLOW_LK_GET_MIN_EIGENVALS** use minimum eigen values as an error measure (see ``minEigThreshold`` description); if the flag is not set, then L1 distance between patches around the original and a moved point, divided by number of pixels in a window, is used as a error measure.
40
41     :param minEigThreshold: the algorithm calculates the minimum eigen value of a 2x2 normal matrix of optical flow equations (this matrix is called a spatial gradient matrix in [Bouguet00]_), divided by number of pixels in a window; if this value is less than ``minEigThreshold``, then a corresponding feature is filtered out and its flow is not processed, so it allows to remove bad points and get a performance boost.
42
43 The function implements a sparse iterative version of the Lucas-Kanade optical flow in pyramids. See [Bouguet00]_. The function is parallelized with the TBB library.
44
45 .. note::
46
47    * An example using the Lucas-Kanade optical flow algorithm can be found at opencv_source_code/samples/cpp/lkdemo.cpp
48
49    * (Python) An example using the Lucas-Kanade optical flow algorithm can be found at opencv_source_code/samples/python2/lk_track.py
50    * (Python) An example using the Lucas-Kanade tracker for homography matching can be found at opencv_source_code/samples/python2/lk_homography.py
51
52 buildOpticalFlowPyramid
53 -----------------------
54 Constructs the image pyramid which can be passed to :ocv:func:`calcOpticalFlowPyrLK`.
55
56 .. ocv:function:: int buildOpticalFlowPyramid(InputArray img, OutputArrayOfArrays pyramid, Size winSize, int maxLevel, bool withDerivatives = true, int pyrBorder = BORDER_REFLECT_101, int derivBorder = BORDER_CONSTANT, bool tryReuseInputImage = true)
57
58 .. ocv:pyfunction:: cv2.buildOpticalFlowPyramid(img, winSize, maxLevel[, pyramid[, withDerivatives[, pyrBorder[, derivBorder[, tryReuseInputImage]]]]]) -> retval, pyramid
59
60     :param img: 8-bit input image.
61
62     :param pyramid: output pyramid.
63
64     :param winSize: window size of optical flow algorithm. Must be not less than ``winSize`` argument of :ocv:func:`calcOpticalFlowPyrLK`. It is needed to calculate required padding for pyramid levels.
65
66     :param maxLevel: 0-based maximal pyramid level number.
67
68     :param withDerivatives: set to precompute gradients for the every pyramid level. If pyramid is constructed without the gradients then :ocv:func:`calcOpticalFlowPyrLK` will calculate them internally.
69
70     :param pyrBorder: the border mode for pyramid layers.
71
72     :param derivBorder: the border mode for gradients.
73
74     :param tryReuseInputImage: put ROI of input image into the pyramid if possible. You can pass ``false`` to force data copying.
75
76     :return: number of levels in constructed pyramid. Can be less than ``maxLevel``.
77
78
79 calcOpticalFlowFarneback
80 ----------------------------
81 Computes a dense optical flow using the Gunnar Farneback's algorithm.
82
83 .. ocv:function:: void calcOpticalFlowFarneback( InputArray prev, InputArray next, InputOutputArray flow, double pyr_scale, int levels, int winsize, int iterations, int poly_n, double poly_sigma, int flags )
84
85 .. ocv:cfunction:: void cvCalcOpticalFlowFarneback( const CvArr* prev, const CvArr* next, CvArr* flow, double pyr_scale, int levels, int winsize, int iterations, int poly_n, double poly_sigma, int flags )
86
87 .. ocv:pyfunction:: cv2.calcOpticalFlowFarneback(prev, next, pyr_scale, levels, winsize, iterations, poly_n, poly_sigma, flags[, flow]) -> flow
88
89     :param prev: first 8-bit single-channel input image.
90
91     :param next: second input image of the same size and the same type as ``prev``.
92
93     :param flow: computed flow image that has the same size as ``prev`` and type ``CV_32FC2``.
94
95     :param pyr_scale: parameter, specifying the image scale (<1) to build pyramids for each image; ``pyr_scale=0.5`` means a classical pyramid, where each next layer is twice smaller than the previous one.
96
97     :param levels: number of pyramid layers including the initial image; ``levels=1`` means that no extra layers are created and only the original images are used.
98
99     :param winsize: averaging window size; larger values increase the algorithm robustness to image noise and give more chances for fast motion detection, but yield more blurred motion field.
100
101     :param iterations: number of iterations the algorithm does at each pyramid level.
102
103     :param poly_n: size of the pixel neighborhood used to find polynomial expansion in each pixel; larger values mean that the image will be approximated with smoother surfaces, yielding more robust algorithm and more blurred  motion field, typically ``poly_n`` =5 or 7.
104
105     :param poly_sigma: standard deviation of the Gaussian that is used to smooth derivatives used as a basis for the polynomial expansion; for  ``poly_n=5``, you can set ``poly_sigma=1.1``, for ``poly_n=7``, a good value would be ``poly_sigma=1.5``.
106
107     :param flags: operation flags that can be a combination of the following:
108
109             * **OPTFLOW_USE_INITIAL_FLOW** uses the input  ``flow``  as an initial flow approximation.
110
111             * **OPTFLOW_FARNEBACK_GAUSSIAN** uses the Gaussian :math:`\texttt{winsize}\times\texttt{winsize}` filter instead of a box filter of the same size for optical flow estimation; usually, this option gives z more accurate flow than with a box filter, at the cost of lower speed; normally, ``winsize`` for a Gaussian window should be set to a larger value to achieve the same level of robustness.
112
113 The function finds an optical flow for each ``prev`` pixel using the [Farneback2003]_ algorithm so that
114
115 .. math::
116
117     \texttt{prev} (y,x)  \sim \texttt{next} ( y + \texttt{flow} (y,x)[1],  x + \texttt{flow} (y,x)[0])
118
119 .. note::
120
121    * An example using the optical flow algorithm described by Gunnar Farneback can be found at opencv_source_code/samples/cpp/fback.cpp
122
123    * (Python) An example using the optical flow algorithm described by Gunnar Farneback can be found at opencv_source_code/samples/python2/opt_flow.py
124
125 estimateRigidTransform
126 --------------------------
127 Computes an optimal affine transformation between two 2D point sets.
128
129 .. ocv:function:: Mat estimateRigidTransform( InputArray src, InputArray dst, bool fullAffine )
130
131 .. ocv:pyfunction:: cv2.estimateRigidTransform(src, dst, fullAffine) -> retval
132
133     :param src: First input 2D point set stored in ``std::vector`` or ``Mat``, or an image stored in ``Mat``.
134
135     :param dst: Second input 2D point set of the same size and the same type as ``A``, or another image.
136
137     :param fullAffine: If true, the function finds an optimal affine transformation with no additional restrictions (6 degrees of freedom). Otherwise, the class of transformations to choose from is limited to combinations of translation, rotation, and uniform scaling (5 degrees of freedom).
138
139 The function finds an optimal affine transform *[A|b]* (a ``2 x 3`` floating-point matrix) that approximates best the affine transformation between:
140
141   *
142       Two point sets
143   *
144       Two raster images. In this case, the function first finds some features in the ``src`` image and finds the corresponding features in ``dst`` image. After that, the problem is reduced to the first case.
145
146 In case of point sets, the problem is formulated as follows: you need to find a 2x2 matrix *A* and 2x1 vector *b* so that:
147
148     .. math::
149
150         [A^*|b^*] = arg  \min _{[A|b]}  \sum _i  \| \texttt{dst}[i] - A { \texttt{src}[i]}^T - b  \| ^2
151
152     where ``src[i]`` and ``dst[i]`` are the i-th points in ``src`` and ``dst``, respectively
153
154     :math:`[A|b]` can be either arbitrary (when ``fullAffine=true`` ) or have a form of
155
156     .. math::
157
158         \begin{bmatrix} a_{11} & a_{12} & b_1  \\ -a_{12} & a_{11} & b_2  \end{bmatrix}
159
160     when ``fullAffine=false`` .
161
162 .. seealso::
163
164     :ocv:func:`getAffineTransform`,
165     :ocv:func:`getPerspectiveTransform`,
166     :ocv:func:`findHomography`
167
168
169
170 updateMotionHistory
171 -----------------------
172 Updates the motion history image by a moving silhouette.
173
174 .. ocv:function:: void updateMotionHistory( InputArray silhouette, InputOutputArray mhi, double timestamp, double duration )
175
176 .. ocv:pyfunction:: cv2.updateMotionHistory(silhouette, mhi, timestamp, duration) -> None
177
178 .. ocv:cfunction:: void cvUpdateMotionHistory( const CvArr* silhouette, CvArr* mhi, double timestamp, double duration )
179 .. ocv:pyoldfunction:: cv.UpdateMotionHistory(silhouette, mhi, timestamp, duration)-> None
180
181     :param silhouette: Silhouette mask that has non-zero pixels where the motion occurs.
182
183     :param mhi: Motion history image that is updated by the function (single-channel, 32-bit floating-point).
184
185     :param timestamp: Current time in milliseconds or other units.
186
187     :param duration: Maximal duration of the motion track in the same units as  ``timestamp`` .
188
189 The function updates the motion history image as follows:
190
191 .. math::
192
193     \texttt{mhi} (x,y)= \forkthree{\texttt{timestamp}}{if $\texttt{silhouette}(x,y) \ne 0$}{0}{if $\texttt{silhouette}(x,y) = 0$ and $\texttt{mhi} < (\texttt{timestamp} - \texttt{duration})$}{\texttt{mhi}(x,y)}{otherwise}
194
195 That is, MHI pixels where the motion occurs are set to the current ``timestamp`` , while the pixels where the motion happened last time a long time ago are cleared.
196
197 The function, together with
198 :ocv:func:`calcMotionGradient` and
199 :ocv:func:`calcGlobalOrientation` , implements a motion templates technique described in
200 [Davis97]_ and [Bradski00]_.
201 See also the OpenCV sample ``motempl.c`` that demonstrates the use of all the motion template functions.
202
203
204 calcMotionGradient
205 ----------------------
206 Calculates a gradient orientation of a motion history image.
207
208 .. ocv:function:: void calcMotionGradient( InputArray mhi, OutputArray mask, OutputArray orientation,                         double delta1, double delta2, int apertureSize=3 )
209
210 .. ocv:pyfunction:: cv2.calcMotionGradient(mhi, delta1, delta2[, mask[, orientation[, apertureSize]]]) -> mask, orientation
211
212 .. ocv:cfunction:: void cvCalcMotionGradient( const CvArr* mhi, CvArr* mask, CvArr* orientation, double delta1, double delta2, int aperture_size=3 )
213 .. ocv:pyoldfunction:: cv.CalcMotionGradient(mhi, mask, orientation, delta1, delta2, apertureSize=3)-> None
214
215     :param mhi: Motion history single-channel floating-point image.
216
217     :param mask: Output mask image that has the type  ``CV_8UC1``  and the same size as  ``mhi`` . Its non-zero elements mark pixels where the motion gradient data is correct.
218
219     :param orientation: Output motion gradient orientation image that has the same type and the same size as  ``mhi`` . Each pixel of the image is a motion orientation, from 0 to 360 degrees.
220
221     :param delta1: Minimal (or maximal) allowed difference between  ``mhi``  values within a pixel neighborhood.
222
223     :param delta2: Maximal (or minimal) allowed difference between  ``mhi``  values within a pixel neighborhood. That is, the function finds the minimum ( :math:`m(x,y)` ) and maximum ( :math:`M(x,y)` )  ``mhi``  values over  :math:`3 \times 3`  neighborhood of each pixel and marks the motion orientation at  :math:`(x, y)`  as valid only if
224
225         .. math::
226
227             \min ( \texttt{delta1}  ,  \texttt{delta2}  )  \le  M(x,y)-m(x,y)  \le   \max ( \texttt{delta1}  , \texttt{delta2} ).
228
229     :param apertureSize: Aperture size of  the :ocv:func:`Sobel`  operator.
230
231 The function calculates a gradient orientation at each pixel
232 :math:`(x, y)` as:
233
234 .. math::
235
236     \texttt{orientation} (x,y)= \arctan{\frac{d\texttt{mhi}/dy}{d\texttt{mhi}/dx}}
237
238 In fact,
239 :ocv:func:`fastAtan2` and
240 :ocv:func:`phase` are used so that the computed angle is measured in degrees and covers the full range 0..360. Also, the ``mask`` is filled to indicate pixels where the computed angle is valid.
241
242 .. note::
243
244    * (Python) An example on how to perform a motion template technique can be found at opencv_source_code/samples/python2/motempl.py
245
246 calcGlobalOrientation
247 -------------------------
248 Calculates a global motion orientation in a selected region.
249
250 .. ocv:function:: double calcGlobalOrientation( InputArray orientation, InputArray mask, InputArray mhi, double timestamp, double duration )
251
252 .. ocv:pyfunction:: cv2.calcGlobalOrientation(orientation, mask, mhi, timestamp, duration) -> retval
253
254 .. ocv:cfunction:: double cvCalcGlobalOrientation( const CvArr* orientation, const CvArr* mask, const CvArr* mhi, double timestamp, double duration )
255 .. ocv:pyoldfunction:: cv.CalcGlobalOrientation(orientation, mask, mhi, timestamp, duration)-> float
256
257     :param orientation: Motion gradient orientation image calculated by the function  :ocv:func:`calcMotionGradient` .
258
259     :param mask: Mask image. It may be a conjunction of a valid gradient mask, also calculated by  :ocv:func:`calcMotionGradient` , and the mask of a region whose direction needs to be calculated.
260
261     :param mhi: Motion history image calculated by  :ocv:func:`updateMotionHistory` .
262
263     :param timestamp: Timestamp passed to  :ocv:func:`updateMotionHistory` .
264
265     :param duration: Maximum duration of a motion track in milliseconds, passed to  :ocv:func:`updateMotionHistory` .
266
267 The function calculates an average
268 motion direction in the selected region and returns the angle between
269 0 degrees  and 360 degrees. The average direction is computed from
270 the weighted orientation histogram, where a recent motion has a larger
271 weight and the motion occurred in the past has a smaller weight, as recorded in ``mhi`` .
272
273
274
275
276 segmentMotion
277 -------------
278 Splits a motion history image into a few parts corresponding to separate independent motions (for example, left hand, right hand).
279
280 .. ocv:function:: void segmentMotion(InputArray mhi, OutputArray segmask, vector<Rect>& boundingRects, double timestamp, double segThresh)
281
282 .. ocv:pyfunction:: cv2.segmentMotion(mhi, timestamp, segThresh[, segmask]) -> segmask, boundingRects
283
284 .. ocv:cfunction:: CvSeq* cvSegmentMotion( const CvArr* mhi, CvArr* seg_mask, CvMemStorage* storage, double timestamp, double seg_thresh )
285 .. ocv:pyoldfunction:: cv.SegmentMotion(mhi, seg_mask, storage, timestamp, seg_thresh) -> boundingRects
286
287     :param mhi: Motion history image.
288
289     :param segmask: Image where the found mask should be stored, single-channel, 32-bit floating-point.
290
291     :param boundingRects: Vector containing ROIs of motion connected components.
292
293     :param timestamp: Current time in milliseconds or other units.
294
295     :param segThresh: Segmentation threshold that is recommended to be equal to the interval between motion history "steps" or greater.
296
297
298 The function finds all of the motion segments and marks them in ``segmask`` with individual values (1,2,...). It also computes a vector with ROIs of motion connected components. After that the motion direction for every component can be calculated with :ocv:func:`calcGlobalOrientation` using the extracted mask of the particular component.
299
300
301
302
303 CamShift
304 --------
305 Finds an object center, size, and orientation.
306
307 .. ocv:function:: RotatedRect CamShift( InputArray probImage, Rect& window, TermCriteria criteria )
308
309 .. ocv:pyfunction:: cv2.CamShift(probImage, window, criteria) -> retval, window
310
311 .. ocv:cfunction:: int cvCamShift( const CvArr* prob_image, CvRect window, CvTermCriteria criteria, CvConnectedComp* comp, CvBox2D* box=NULL )
312
313 .. ocv:pyoldfunction:: cv.CamShift(prob_image, window, criteria) -> (int, comp, box)
314
315     :param probImage: Back projection of the object histogram. See  :ocv:func:`calcBackProject` .
316
317     :param window: Initial search window.
318
319     :param criteria: Stop criteria for the underlying  :ocv:func:`meanShift` .
320
321     :returns: (in old interfaces) Number of iterations CAMSHIFT took to converge
322
323 The function implements the CAMSHIFT object tracking algorithm
324 [Bradski98]_.
325 First, it finds an object center using
326 :ocv:func:`meanShift` and then adjusts the window size and finds the optimal rotation. The function returns the rotated rectangle structure that includes the object position, size, and orientation. The next position of the search window can be obtained with ``RotatedRect::boundingRect()`` .
327
328 See the OpenCV sample ``camshiftdemo.c`` that tracks colored objects.
329
330 .. note::
331
332    * (Python) A sample explaining the camshift tracking algorithm can be found at opencv_source_code/samples/python2/camshift.py
333
334 meanShift
335 ---------
336 Finds an object on a back projection image.
337
338 .. ocv:function:: int meanShift( InputArray probImage, Rect& window, TermCriteria criteria )
339
340 .. ocv:pyfunction:: cv2.meanShift(probImage, window, criteria) -> retval, window
341
342 .. ocv:cfunction:: int cvMeanShift( const CvArr* prob_image, CvRect window, CvTermCriteria criteria, CvConnectedComp* comp )
343 .. ocv:pyoldfunction:: cv.MeanShift(prob_image, window, criteria) -> comp
344
345     :param probImage: Back projection of the object histogram. See  :ocv:func:`calcBackProject` for details.
346
347     :param window: Initial search window.
348
349     :param criteria: Stop criteria for the iterative search algorithm.
350
351     :returns: Number of iterations CAMSHIFT took to converge.
352
353 The function implements the iterative object search algorithm. It takes the input back projection of an object and the initial position. The mass center in ``window`` of the back projection image is computed and the search window center shifts to the mass center. The procedure is repeated until the specified number of iterations ``criteria.maxCount`` is done or until the window center shifts by less than ``criteria.epsilon`` . The algorithm is used inside
354 :ocv:func:`CamShift` and, unlike
355 :ocv:func:`CamShift` , the search window size or orientation do not change during the search. You can simply pass the output of
356 :ocv:func:`calcBackProject` to this function. But better results can be obtained if you pre-filter the back projection and remove the noise. For example, you can do this by retrieving connected components with
357 :ocv:func:`findContours` , throwing away contours with small area (
358 :ocv:func:`contourArea` ), and rendering the  remaining contours with
359 :ocv:func:`drawContours` .
360
361 .. note::
362
363    * A mean-shift tracking sample can be found at opencv_source_code/samples/cpp/camshiftdemo.cpp
364
365 KalmanFilter
366 ------------
367 .. ocv:class:: KalmanFilter
368
369     Kalman filter class.
370
371 The class implements a standard Kalman filter
372 http://en.wikipedia.org/wiki/Kalman_filter, [Welch95]_. However, you can modify ``transitionMatrix``, ``controlMatrix``, and ``measurementMatrix`` to get an extended Kalman filter functionality. See the OpenCV sample ``kalman.cpp`` .
373
374 .. note::
375
376    * An example using the standard Kalman filter can be found at opencv_source_code/samples/cpp/kalman.cpp
377
378
379 KalmanFilter::KalmanFilter
380 --------------------------
381 The constructors.
382
383 .. ocv:function:: KalmanFilter::KalmanFilter()
384
385 .. ocv:function:: KalmanFilter::KalmanFilter(int dynamParams, int measureParams, int controlParams=0, int type=CV_32F)
386
387 .. ocv:pyfunction:: cv2.KalmanFilter([dynamParams, measureParams[, controlParams[, type]]]) -> <KalmanFilter object>
388
389 .. ocv:cfunction:: CvKalman* cvCreateKalman( int dynam_params, int measure_params, int control_params=0 )
390 .. ocv:pyoldfunction:: cv.CreateKalman(dynam_params, measure_params, control_params=0) -> CvKalman
391
392     The full constructor.
393
394     :param dynamParams: Dimensionality of the state.
395
396     :param measureParams: Dimensionality of the measurement.
397
398     :param controlParams: Dimensionality of the control vector.
399
400     :param type: Type of the created matrices that should be ``CV_32F`` or ``CV_64F``.
401
402 .. note:: In C API when ``CvKalman* kalmanFilter`` structure is not needed anymore, it should be released with ``cvReleaseKalman(&kalmanFilter)``
403
404 KalmanFilter::init
405 ------------------
406 Re-initializes Kalman filter. The previous content is destroyed.
407
408 .. ocv:function:: void KalmanFilter::init(int dynamParams, int measureParams, int controlParams=0, int type=CV_32F)
409
410     :param dynamParams: Dimensionalityensionality of the state.
411
412     :param measureParams: Dimensionality of the measurement.
413
414     :param controlParams: Dimensionality of the control vector.
415
416     :param type: Type of the created matrices that should be ``CV_32F`` or ``CV_64F``.
417
418
419 KalmanFilter::predict
420 ---------------------
421 Computes a predicted state.
422
423 .. ocv:function:: const Mat& KalmanFilter::predict(const Mat& control=Mat())
424
425 .. ocv:pyfunction:: cv2.KalmanFilter.predict([control]) -> retval
426
427 .. ocv:cfunction:: const CvMat* cvKalmanPredict( CvKalman* kalman, const CvMat* control=NULL)
428 .. ocv:pyoldfunction:: cv.KalmanPredict(kalman, control=None) -> mat
429
430     :param control: The optional input control
431
432
433 KalmanFilter::correct
434 ---------------------
435 Updates the predicted state from the measurement.
436
437 .. ocv:function:: const Mat& KalmanFilter::correct(const Mat& measurement)
438
439 .. ocv:pyfunction:: cv2.KalmanFilter.correct(measurement) -> retval
440
441 .. ocv:cfunction:: const CvMat* cvKalmanCorrect( CvKalman* kalman, const CvMat* measurement )
442
443 .. ocv:pyoldfunction:: cv.KalmanCorrect(kalman, measurement) -> mat
444
445     :param measurement: The measured system parameters
446
447
448 BackgroundSubtractor
449 --------------------
450
451 .. ocv:class:: BackgroundSubtractor : public Algorithm
452
453 Base class for background/foreground segmentation. ::
454
455     class BackgroundSubtractor : public Algorithm
456     {
457     public:
458         virtual ~BackgroundSubtractor();
459         virtual void operator()(InputArray image, OutputArray fgmask, double learningRate=0);
460         virtual void getBackgroundImage(OutputArray backgroundImage) const;
461     };
462
463
464 The class is only used to define the common interface for the whole family of background/foreground segmentation algorithms.
465
466
467 BackgroundSubtractor::operator()
468 --------------------------------
469 Computes a foreground mask.
470
471 .. ocv:function:: void BackgroundSubtractor::operator()(InputArray image, OutputArray fgmask, double learningRate=0)
472
473 .. ocv:pyfunction:: cv2.BackgroundSubtractor.apply(image[, fgmask[, learningRate]]) -> fgmask
474
475     :param image: Next video frame.
476
477     :param fgmask: The output foreground mask as an 8-bit binary image.
478
479
480 BackgroundSubtractor::getBackgroundImage
481 ----------------------------------------
482 Computes a background image.
483
484 .. ocv:function:: void BackgroundSubtractor::getBackgroundImage(OutputArray backgroundImage) const
485
486     :param backgroundImage: The output background image.
487
488 .. note:: Sometimes the background image can be very blurry, as it contain the average background statistics.
489
490 BackgroundSubtractorMOG
491 -----------------------
492
493 .. ocv:class:: BackgroundSubtractorMOG : public BackgroundSubtractor
494
495 Gaussian Mixture-based Background/Foreground Segmentation Algorithm.
496
497 The class implements the algorithm described in P. KadewTraKuPong and R. Bowden, *An improved adaptive background mixture model for real-time tracking with shadow detection*, Proc. 2nd European Workshop on Advanced Video-Based Surveillance Systems, 2001: http://personal.ee.surrey.ac.uk/Personal/R.Bowden/publications/avbs01/avbs01.pdf
498
499
500
501
502 BackgroundSubtractorMOG::BackgroundSubtractorMOG
503 ------------------------------------------------
504 The constructors.
505
506 .. ocv:function:: BackgroundSubtractorMOG::BackgroundSubtractorMOG()
507
508 .. ocv:function:: BackgroundSubtractorMOG::BackgroundSubtractorMOG(int history, int nmixtures, double backgroundRatio, double noiseSigma=0)
509
510 .. ocv:pyfunction:: cv2.BackgroundSubtractorMOG([history, nmixtures, backgroundRatio[, noiseSigma]]) -> <BackgroundSubtractorMOG object>
511
512     :param history: Length of the history.
513
514     :param nmixtures: Number of Gaussian mixtures.
515
516     :param backgroundRatio: Background ratio.
517
518     :param noiseSigma: Noise strength.
519
520 Default constructor sets all parameters to default values.
521
522
523
524
525 BackgroundSubtractorMOG::operator()
526 -----------------------------------
527 Updates the background model and returns the foreground mask
528
529 .. ocv:function:: void BackgroundSubtractorMOG::operator()(InputArray image, OutputArray fgmask, double learningRate=0)
530
531 Parameters are the same as in :ocv:funcx:`BackgroundSubtractor::operator()`
532
533
534 BackgroundSubtractorMOG2
535 ------------------------
536 Gaussian Mixture-based Background/Foreground Segmentation Algorithm.
537
538 .. ocv:class:: BackgroundSubtractorMOG2 : public BackgroundSubtractor
539
540     Here are important members of the class that control the algorithm, which you can set after constructing the class instance:
541
542     .. ocv:member:: int nmixtures
543
544         Maximum allowed number of mixture components. Actual number is determined dynamically per pixel.
545
546     .. ocv:member:: float backgroundRatio
547
548         Threshold defining whether the component is significant enough to be included into the background model ( corresponds to ``TB=1-cf`` from the paper??which paper??). ``cf=0.1 => TB=0.9`` is default. For ``alpha=0.001``, it means that the mode should exist for approximately 105 frames before it is considered foreground.
549
550     .. ocv:member:: float varThresholdGen
551
552         Threshold for the squared Mahalanobis distance that helps decide when a sample is close to the existing components (corresponds to ``Tg``). If it is not close to any component, a new component is generated. ``3 sigma => Tg=3*3=9`` is default. A smaller ``Tg`` value generates more components. A higher ``Tg`` value may result in a small number of components but they can grow too large.
553
554     .. ocv:member:: float fVarInit
555
556         Initial variance for the newly generated components. It affects the speed of adaptation. The parameter value is based on your estimate of the typical standard deviation from the images. OpenCV uses 15 as a reasonable value.
557
558     .. ocv:member:: float fVarMin
559
560         Parameter used to further control the variance.
561
562     .. ocv:member:: float fVarMax
563
564         Parameter used to further control the variance.
565
566     .. ocv:member:: float fCT
567
568         Complexity reduction parameter. This parameter defines the number of samples needed to accept to prove the component exists. ``CT=0.05`` is a default value for all the samples. By setting ``CT=0`` you get an algorithm very similar to the standard Stauffer&Grimson algorithm.
569
570     .. ocv:member:: uchar nShadowDetection
571
572         The value for marking shadow pixels in the output foreground mask. Default value is 127.
573
574     .. ocv:member:: float fTau
575
576         Shadow threshold. The shadow is detected if the pixel is a darker version of the background. ``Tau`` is a threshold defining how much darker the shadow can be. ``Tau= 0.5`` means that if a pixel is more than twice darker then it is not shadow. See Prati,Mikic,Trivedi,Cucchiarra, *Detecting Moving Shadows...*, IEEE PAMI,2003.
577
578
579 The class implements the Gaussian mixture model background subtraction described in:
580
581   * Z.Zivkovic, *Improved adaptive Gausian mixture model for background subtraction*, International Conference Pattern Recognition, UK, August, 2004, http://www.zoranz.net/Publications/zivkovic2004ICPR.pdf. The code is very fast and performs also shadow detection. Number of Gausssian components is adapted per pixel.
582
583   * Z.Zivkovic, F. van der Heijden, *Efficient Adaptive Density Estimapion per Image Pixel for the Task of Background Subtraction*, Pattern Recognition Letters, vol. 27, no. 7, pages 773-780, 2006. The algorithm similar to the standard Stauffer&Grimson algorithm with additional selection of the number of the Gaussian components based on: Z.Zivkovic, F.van der Heijden, Recursive unsupervised learning of finite mixture models, IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.26, no.5, pages 651-656, 2004.
584
585
586 BackgroundSubtractorMOG2::BackgroundSubtractorMOG2
587 --------------------------------------------------
588 The constructors.
589
590 .. ocv:function:: BackgroundSubtractorMOG2::BackgroundSubtractorMOG2()
591
592 .. ocv:function:: BackgroundSubtractorMOG2::BackgroundSubtractorMOG2( int history, float varThreshold, bool bShadowDetection=true )
593
594     :param history: Length of the history.
595
596     :param varThreshold: Threshold on the squared Mahalanobis distance to decide whether it is well described by the background model (see Cthr??). This parameter does not affect the background update. A typical value could be 4 sigma, that is, ``varThreshold=4*4=16;`` (see Tb??).
597
598     :param bShadowDetection: Parameter defining whether shadow detection should be enabled (``true`` or ``false``).
599
600
601
602 BackgroundSubtractorMOG2::operator()
603 ------------------------------------
604 Updates the background model and computes the foreground mask
605
606 .. ocv:function:: void BackgroundSubtractorMOG2::operator()(InputArray image, OutputArray fgmask, double learningRate=-1)
607
608     See :ocv:funcx:`BackgroundSubtractor::operator()`.
609
610
611 BackgroundSubtractorMOG2::getBackgroundImage
612 --------------------------------------------
613 Returns background image
614
615 .. ocv:function:: void BackgroundSubtractorMOG2::getBackgroundImage(OutputArray backgroundImage)
616
617 See :ocv:func:`BackgroundSubtractor::getBackgroundImage`.
618
619
620 calcOpticalFlowSF
621 -----------------
622 Calculate an optical flow using "SimpleFlow" algorithm.
623
624 .. ocv:function:: void calcOpticalFlowSF( Mat& from, Mat& to, Mat& flow, int layers, int averaging_block_size, int max_flow )
625
626 .. ocv:function:: void calcOpticalFlowSF( Mat& from, Mat& to, Mat& flow, int layers, int averaging_block_size, int max_flow, double sigma_dist, double sigma_color, int postprocess_window, double sigma_dist_fix, double sigma_color_fix, double occ_thr, int upscale_averaging_radius, double upscale_sigma_dist, double upscale_sigma_color, double speed_up_thr )
627
628     :param prev: First 8-bit 3-channel image.
629
630     :param next: Second 8-bit 3-channel image
631
632     :param flowX: X-coordinate of estimated flow
633
634     :param flowY: Y-coordinate of estimated flow
635
636     :param layers: Number of layers
637
638     :param averaging_block_size: Size of block through which we sum up when calculate cost function for pixel
639
640     :param max_flow: maximal flow that we search at each level
641
642     :param sigma_dist: vector smooth spatial sigma parameter
643
644     :param sigma_color: vector smooth color sigma parameter
645
646     :param postprocess_window: window size for postprocess cross bilateral filter
647
648     :param sigma_dist_fix: spatial sigma for postprocess cross bilateralf filter
649
650     :param sigma_color_fix: color sigma for postprocess cross bilateral filter
651
652     :param occ_thr: threshold for detecting occlusions
653
654     :param upscale_averaging_radiud: window size for bilateral upscale operation
655
656     :param upscale_sigma_dist: spatial sigma for bilateral upscale operation
657
658     :param upscale_sigma_color: color sigma for bilateral upscale operation
659
660     :param speed_up_thr: threshold to detect point with irregular flow - where flow should be recalculated after upscale
661
662 See [Tao2012]_. And site of project - http://graphics.berkeley.edu/papers/Tao-SAN-2012-05/.
663
664 .. note::
665
666    * An example using the simpleFlow algorithm can be found at opencv_source_code/samples/cpp/simpleflow_demo.cpp
667
668 createOptFlow_DualTVL1
669 ----------------------
670 "Dual TV L1" Optical Flow Algorithm.
671
672 .. ocv:function:: Ptr<DenseOpticalFlow> createOptFlow_DualTVL1()
673
674
675   The class implements the "Dual TV L1" optical flow algorithm described in [Zach2007]_ and [Javier2012]_ .
676
677   Here are important members of the class that control the algorithm, which you can set after constructing the class instance:
678
679     .. ocv:member:: double tau
680
681         Time step of the numerical scheme.
682
683     .. ocv:member:: double lambda
684
685         Weight parameter for the data term, attachment parameter. This is the most relevant parameter, which determines the smoothness of the output. The smaller this parameter is, the smoother the solutions we obtain. It depends on the range of motions of the images, so its value should be adapted to each image sequence.
686
687     .. ocv:member:: double theta
688
689         Weight parameter for (u - v)^2, tightness parameter. It serves as a link between the attachment and the regularization terms. In theory, it should have a small value in order to maintain both parts in correspondence. The method is stable for a large range of values of this parameter.
690
691     .. ocv:member:: int nscales
692
693         Number of scales used to create the pyramid of images.
694
695     .. ocv:member:: int warps
696
697         Number of warpings per scale. Represents the number of times that I1(x+u0) and grad( I1(x+u0) ) are computed per scale. This is a parameter that assures the stability of the method. It also affects the running time, so it is a compromise between speed and accuracy.
698
699     .. ocv:member:: double epsilon
700
701         Stopping criterion threshold used in the numerical scheme, which is a trade-off between precision and running time. A small value will yield more accurate solutions at the expense of a slower convergence.
702
703     .. ocv:member:: int iterations
704
705         Stopping criterion iterations number used in the numerical scheme.
706
707
708
709
710 DenseOpticalFlow::calc
711 --------------------------
712 Calculates an optical flow.
713
714 .. ocv:function:: void DenseOpticalFlow::calc(InputArray I0, InputArray I1, InputOutputArray flow)
715
716     :param prev: first 8-bit single-channel input image.
717
718     :param next: second input image of the same size and the same type as ``prev`` .
719
720     :param flow: computed flow image that has the same size as ``prev`` and type ``CV_32FC2`` .
721
722
723
724 DenseOpticalFlow::collectGarbage
725 --------------------------------
726 Releases all inner buffers.
727
728 .. ocv:function:: void DenseOpticalFlow::collectGarbage()
729
730
731
732 .. [Bouguet00] Jean-Yves Bouguet. Pyramidal Implementation of the Lucas Kanade Feature Tracker.
733
734 .. [Bradski98] Bradski, G.R. "Computer Vision Face Tracking for Use in a Perceptual User Interface", Intel, 1998
735
736 .. [Bradski00] Davis, J.W. and Bradski, G.R. “Motion Segmentation and Pose Recognition with Motion History Gradients”, WACV00, 2000
737
738 .. [Davis97] Davis, J.W. and Bobick, A.F. “The Representation and Recognition of Action Using Temporal Templates”, CVPR97, 1997
739
740 .. [Farneback2003] Gunnar Farneback, Two-frame motion estimation based on polynomial expansion, Lecture Notes in Computer Science, 2003, (2749), , 363-370.
741
742 .. [Horn81] Berthold K.P. Horn and Brian G. Schunck. Determining Optical Flow. Artificial Intelligence, 17, pp. 185-203, 1981.
743
744 .. [Lucas81] Lucas, B., and Kanade, T. An Iterative Image Registration Technique with an Application to Stereo Vision, Proc. of 7th International Joint Conference on Artificial Intelligence (IJCAI), pp. 674-679.
745
746 .. [Welch95] Greg Welch and Gary Bishop “An Introduction to the Kalman Filter”, 1995
747
748 .. [Tao2012] Michael Tao, Jiamin Bai, Pushmeet Kohli and Sylvain Paris. SimpleFlow: A Non-iterative, Sublinear Optical Flow Algorithm. Computer Graphics Forum (Eurographics 2012)
749
750 .. [Zach2007] C. Zach, T. Pock and H. Bischof. "A Duality Based Approach for Realtime TV-L1 Optical Flow", In Proceedings of Pattern Recognition (DAGM), Heidelberg, Germany, pp. 214-223, 2007
751
752 .. [Javier2012] Javier Sanchez, Enric Meinhardt-Llopis and Gabriele Facciolo. "TV-L1 Optical Flow Estimation".