@uniwue_info3

Machine Learning for Synthetically Generated, Adaptive Streaming Data

. University of Würzburg, (March 2019)

Abstract

Ziel dieser Arbeit war es, die Einsatzmöglichkeiten maschinellen Lernens im Bereich des adaptiven Videostreamings zu analysieren und entsprechende Grundlagen zu schaffen. Insbesondere zielt die Arbeit darauf ab, im großen Stil Streaming-Daten synthetisch zu generieren, die als Eingabe für maschinelles Lernen verwendet werden können. Zu diesem Zweck beginnt die Ausarbeitung damit, Grundlagen und Verfah- ren zu erklären, sowie eine Auswahl aus verwandten Arbeiten zu treffen, um daraus wertvolle Ideen abzuleiten. Einer der wichtigsten Begriffe in diesem Zusammenhang war die Definition und Abstraktion des adaptiven Video-Streamings. Hierbei wurden verschiedene Streaming-Adapationsalgorithmen modelliert und neu implementiert, die die Bitrate für die Filmsegemente, die sogenannten Chunks, bestimmen. Ähnlich wichtig war der Begriff der Quality of Experience, die im weiteren Verlauf der Ar- beit als Bewertungsmethode für das Streaming-Erlebnis beim Benutzer diente. Es wurde zu Beginn ein Überblick über die verschiedenen bekannten Verfahren aus der Literatur gegeben. Anschließend wurden die technischen Details, die möglichen Eingabeparameter und die Auswirkungen der verschiedenen Bewertungsverfahren diskutiert. Die Arbeit nutzt lediglich vorhandene QoE-Modelle aus der Literatur. Die Erstellung und Validierung von neuen QoE-Modellen ist nicht Gegenstand der aktuellen Arbeit. Im Hinblick auf verwandte Arbeiten wurden Arbeiten von Orsolic et al. und Mao et al. herangezogen. Als Ergebnis daraus wurden, mit Blick auf das geplante Vor- haben, folgende Ziele aufgstellt: einen umfangreichen Datensatz mit dem Verhalten verschiedener Adaptionsalgorithmen in stark flukturierenden Netzwerken zu generie- ren, geeignete Kombinationen von Algorithmen zu testen und einen globalen Ansatz zur Optimierung von Video-Streaming-Vorgängen mit Hilfe von Ensemble-Learning zu finden. Das erste Ziel war folglich, einen entsprechend großen inhomogenen Streaming- Datensatz für zukünftige Forschungsarbeiten bereitzustellen. Ein möglicher Ansatz bestand darin, dies mit Hilfe von synthetisch generierten Daten zu realisieren. Dazu wurde die synthetische Erzeugung von Streaming-Daten untersucht, um eine Metho- de zur schnellen Herstellung von Streaming-Daten zu erhalten. Zu diesem Zweck wur- de eine Simulation entwickelt, die das Verhalten der Adaptionsalgorithmen BBA0, FESTIVE und PANDA für ein bestimmtes Video in einem bestimmten Netzwerk, mittels eines generalisierten Modelles, berechnet. Um die Genauigkeit dieser Simu- lation zu überprüfen, wurden für jeden Algorithmus drei Streaming-Prozesse real durchgeführt und in der Simulation nachgestellt. Der Vergleich des simulierten und realen Streaming-Prozesses zeigte eine gute Übereinstimmung zwischen Simulati- on und Realität und außerdem, dass ein Adaptionsverfahren umso besser simuliert werden kann, je mehr es die zeitliche Entwicklung der Parameter berücksichtigt. Mit dem Begriff Quality of Experience (QoE) wurde eine Möglichkeit zur Bewertung der simulierten Streamingvorgänge genutzt und anschließend wurden gängige QoE-Verfahren vorgestellt, aus denen eine begründete Auswahl getroffen wurde. Um mit der Simulation möglichst viele Streaming-Daten zu erzeugen, wurde eine Toolchain für deren automatisierte Generierung vorgestellt. Die Toolchain umfasst dabei die automatische Herstellung und Konvertierung von Videos, deren Simulation durch alle vorgegebenen Netzwerke mittels der drei eingeführten Adaptionsverfah- ren sowie die Bewertung des simulierten Streamingvorganges mit Hilfe von sieben vorgegebenen unterschiedlichen QoE-Modellen. Mit dieser Toolchain wurden fast 3 Millionen Streamingprozesse generiert, die auf die einzelnen Verfahren verteilt sind. Neben der Simulation der herkömmlichen Verfahren wurde eine neue Simulati- onsmethode trainiert, welche die herkömmlichen Vorgehensweisen der Algorithmen BBA0, FESTIVE und PANDA kombiniert. Das neue Verfahren fand heraus, dass man im Schnitt die gleiche durchschnittliche QoE erhält wie das beste herkömmliche Verfahren, wenn man immer nur die zwei höchsten Bitraten wählt. Aus diesem Ver- halten ließ sich schlussfolgern, dass die Analyse der verwendeten QoE-Modelle und deren möglichst optimale Ausprägung auf dem verwendeten Datensatz essentiell für maschinelles Lernen in diesem Bereich ist. Aus diesem Grund empfiehlt diese Arbeit, dass bevor weitere maschinelle Lernver- fahren auf adaptive Streaming-Daten angewendet werden, zuerst die exsistierenden QoE-Modelle und deren Verhalten genauer untersucht werden sollten. Für diese Un- tersuchungen stellt die im Rahmen dieser Arbeit entwickelte Toolchain ein wertvolles Hilfsmittel dar, da sie die schnelle Generierung von Streaming-Daten und deren Be- wertung anhand von sieben verschiedenen QoE-Modellen ermöglicht.

Links and resources

Tags