Motion annotation in complex video datasets

Autor/a

Mahmood, Muhammad Habib

Director/a

Oliver i Malagelada, Arnau

Fecha de defensa

2018-11-16

Páginas

105 p.



Departamento/Instituto

Universitat de Girona. Departament d'Arquitectura i Tecnologia de Computadors

Resumen

Motion segmentation refers to the process of separating regions and trajectories from a video sequence into coherent subsets of space and time. In this thesis, we created a new multifaceted motion segmentation dataset enclosing real-life long and short sequences, with different numbers of motions and frames per sequence, and real distortions with missing data. Trajectory- and region-based ground-truth is provided on all the frames of all the sequences. We also proposed a new semi-automatic tool for delineating the trajectories in complex videos, even in videos captured from moving cameras. With a minimal manual annotation of an object mask, the algorithm is able to propagate the label mask in all the frames. Object label correction based on static and moving occluder is performed by applying occluder mask tracking for a given depth ordering. The results show that our cascaded-naive approach provides successful results in a variety of video sequences.


La segmentació del moviment es refereix al procés de separar regions i trajectòries d'una seqüència de vídeo en subconjunts coherents d'espai i de temps. En aquesta tesi hem creat un nou i multifacètic dataset amb seqüències de la vida real que inclou diferent número de moviments i fotogrames per seqüència i distorsions amb dades incomplertes. A més, inclou ground-truth en tots els fotogrames basat en mesures de trajectòria i regió. Hem proposat també una nova eina semiautomàtica per delinear les trajectòries en vídeos complexos, fins i tot en vídeos capturats amb càmeres mòbils. Amb una mínima anotació manual dels objectes, l'algoritme és capaç de propagar-la en tots els fotogrames. Durant les oclusions, la correcció de les etiquetes es realitza aplicant el seguiment de la màscara per a cada ordre de profunditat. Els resultats obtinguts mostren que el nostre enfocament ofereix resultats reeixits en una àmplia varietat de seqüències de vídeo.

Palabras clave

Computer vision; Visió per ordinador; Visión por ordenador; Motion segmentation; Segmentació del moviment; Segmentación del movimiento; Image analysis; Anàlisi d'imatges; Análisis de imágenes; Machine learning; Aprenentatge automàtic; Aprendizaje automático; Automated tools; Eines automàtiques; Herarmientas automáticas; Motion datasets

Materias

68 - Industrias, oficios y comercio de artículos acabados. Tecnología cibernética y automática

Documentos

tmhm_20181116.pdf

2.521Mb

 

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)