Videocodierung mittels Machine Learning
Bachelorarbeit,Masterarbeit
Im Rahmen des Projekts Next Generation Video Coding

Beschreibung

Moderne Videocodierverfahren wie HEVC (auch bekannt als H.265) und dessen Nachfolger VVC (H.266) basieren auf dem Prinzip der blockbasierten hybriden Videocodierung. Dabei werden einzelne Bildblöcke wahlweise aus vergangenen und zukünftigen Einzelbildern (Interprädiktion) oder aus anderen Blöcken des selben Einzelbildes (Intraprädiktion) prädiziert. Zur Interprädiktion verwendet HEVC ein translatorisches und VVC ein affines Bewegungsmodell. Videosequenzen mit z.B. einer Fluchtpunktperspektive können durch translatorische und affine Bewegungsmodelle nur schlecht abgebildet werden und führen daher zu einer hohen Datenrate.
Diese bestehenden Videocodierungsstandards sollen mittels neuronaler Netzwerke erweitert werden, so dass die Datenrate noch weiter minimiert wird.
Mögliche Aufgabengebiete für eine Studien- oder Abschlussarbeit umfassen die Erweiterung bestehender Intercodierungsalgorithmen mittels neuronaler Netzwerke. Dies ist eine sehr interessante Aufgabe, da man einerseits die Möglichkeit hat moderne Machine learnign Frameworks wie pyTorch kennenzulernen, anderseits lernt man auch Details bekannter Videocodecs kennen, die die meisten nicht kennen. Wenn du dich für Machine-Learning und/oder Videocodierung interessierst und deine theoretischen Kenntnisse gerne in der Praxis umsetzten möchtest, dann freue ich mich über deine Nachricht.

Voraussetzungen

Sehr gute Programmierkenntnisse in Python und ggf. C++ sind Voraussetzung. Gute Kenntnisse aus den Vorlesungen Machine Learning und Quellencodierung sind wünschenswert. Erste Erfahrungen mit Tensorflow oder PyTorch sind hilfreich.
Bei Fragen oder Interesse bitte gerne melden. Details können dann persönlich besprochen werden.

Ansprechpartner: Martin Benjak