Mastersthesis,

Machine Learning for Classification of Streaming Data

.
Universitiy of Würzburg, (August 2018)

Abstract

Laut Vorhersagen 1 soll mobiles Video Streaming im Jahr 2021 etwa dreiviertel des gesamten Internetverkehrs ausmachen. Schon in der heutigen Zeit nimmt es bereits einen großen Teil ein. Dies führt dazu, dass Netzwerkprovider herausfinden müssen, wie sie mit der Masse an Verkehr umgehen sollen, um gleichzeitig ihre Kunden zufrieden stellen zu können. Eine Metrik, um die Nutzerzufriedenheit festzustellen, ist Quality of Experience (QoE). Mit Hilfe von QoE-Management können Provider anhand des Datenverkehrs die Zufriedenheit der Kunden beeinflussen und trotzdem die Kosteneffizienz zu wahren. Ein wichtiger Teil vom QoE-Management ist das QoE-Monitoring. Da allerdings der Netzwerkverkehr verschlüsselt ist und deshalb deep packet inspection nicht mehr verwendet werden kann, muss auf statistische Analysen zurück gegriffen werden. Das Ziel der Arbeit ist es, wichtige QoE-Einflussfaktoren für Mobile Video Stream- ing, speziell am Beispiel YouTube, zu finden mit Hilfe von Machine Learning (ML). Um die Daten zu sammeln, wurde ein Versuchsaufbau bestehend aus einer Linux- Maschine und einem Smartphone benutzt, wobei der PC als Router für das Smartphone zum Internet diente. Auf dem Smartphone lief die originale YouTube-App, welche auch im Google Play Store erhältlich ist, sowie eine Wrapper-App für das Monitoring. Diese kann autonom die YouTube-App starten und Videos abspielen. Während ein Video läuft werden Netzwerk- und Anwendungsinformationen gesam- melt und auf dem Gerät in einer separaten Datei gespeichert. Mit diesen Daten konnten drei verschiedene Datensätze gemessen werden, wobei zwei zur QoE-Vorhersage für initial delay und der dritte Datensatz zur QoE-Vorhersage for stalling events verwendet wurden. Der erste Datensatz bestand aus drei ver- schiedenen Videos und 1070 Instanzen, der zweite Datensatz aus 18 Videos und 1400 Instanzen und der letzte Datensatz aus 930 Instanzen sowie drei Videos. Des Weiteren wurden die Videos mit verschiedenen Bandbreitenbegrenzungen abgespielt, welche von 0.5 Mbits/s bis 5 Mbits/s reichten. Um die Datensätze mit ML klas- sifizieren zu können, mussten die Instanzen zuvor in vordefinierte Klassen anhand ihres initial delay oder ihrer Anzahl an stallings aufgeteilt werden. Versuche mit dem ersten Datensatz zeigten, dass QoE-Schätzungen mit drei Videos nicht aussagekräftig genug sind. Anhand der Ergebnisse mit dem zweiten Datensatz konnten aber folgende wichtige Einflussparameter festgestellt werden: der gesamte Durchsatz von Up- und Downlink, sowie der Durchsatz in den ersten 20 Sekunden. Einflussreiche Parameter sind außerdem der Durchsatz der ersten fünf Segmente, welche nicht leer sind, und deren Größe. Im Anschluss daran wurden weitere QoE-Vorhersagen mit verschiedenen Klassen- aufteilungen gemacht. Es stellte sich heraus, dass die Genauigkeit der Vorhersagen mit steigender Klassenzahl stark nachlässt. Des Weiteren wurden Schätzungen mit Klassenaufteilungen aus anderen QoE-Studien auf unsere Datensätze angewendet, welche allerdings keine weiteren Erkenntnisse lieferten. Zum Schluss wurden QoE-Schätzungen mit dem dritten Datensatz für stalling gemacht und die daraus folgenden Ergebnisse mit den Resultaten der QoE-Vorhersagen mit dem zweiten Datensatz verglichen. Die Faktoren, welche zuvor bei den QoE- Schätzungen für initial delay als wichtige QoE-Einflussfaktoren galten, erwiesen sich bei den QoE-Schätzungen für stalling als nicht einflussreich. Weitere QoE- Vorhersagen zeigten, dass die Anzahl an Qualitätsänderungen während des Videos, sowie die mittlere Ankuftszeit und die kumulative Verteilung der Ankunftszeit der Uplink Requests, großen Einfluss auf die QoE haben.

Tags

Users

  • @uniwue_info3

Comments and Reviews