MPI

Projektbezeichnung

MPIMassively Adhoc Processing in the Internet

Erforschung und Entwicklung effizienter Verarbeitungsprozesse und Softwarearchitekturen für die Adhoc-Verarbeitung von Massenereignissen im Internet am Beispiel der Nutzung musikalischer Werke.

Projektmitarbeiter

Prof. Dr. Peter Mandl
Dr. Nikolai Bauer
Alexander Döschl, M.Sc.

Projektinhalt und Projektziele

Die Nutzung musikalischer Werke nimmt im Zuge der Verbreitung durch das Internet über Online-Angebote wie iTunes Store von Apple, das Internet-Videoportal YouTube von Google und die freie Musik-Streaming-Software Spotify seit mehreren Jahren massiv zu. Die Anzahl der Einzelnutzungen wächst rasant und es ist noch nicht abzusehen, welche Online-Dienste im Umfeld der Musiknutzung in Zukunft noch hinzukommen werden. Nach Meinung vieler Experten sind wir erst am Anfang dieser Entwicklung. Charakteristisch für derartige Online-Angebote sind vor allem die sehr großen Sortimente, mit einigen sehr umfangreichen, aber überwiegend eher kleinen bis sehr kleinen Nutzungszahlen je Werk pro Zeiteinheit.

Zum Zwecke der bedarfsgerechten Abrechnung und Bezahlung (Pay-per-View) der Einzelnutzungen durch die Online-Anbieter sind Nutzungsdaten von den Online-Anbietern an die Verwertungsgesellschaften als juristische Vertreter der Künstler zu liefern, was zu einem enormen Datenvolumen führt, das verarbeitet werden muss. Die heute verfügbaren klassischen, eher Batch– und Datenbank-orientierten Abrechnungssysteme verursachen durch ihre Arbeitsweise einen sehr hohen Aufwand und benötigen meist mehr Zeit als gewünscht, denn es sind eine Vielzahl von kleinen Geschäftsvorfällen mit minimalen Abrechnungsbeträgen zu bearbeiten, wenn jeder Einzelumsatz in Rechnung gestellt wird. Gemäß der Long-Tail-Theorie nach Chris Anderson, nach der im Internet nahezu unbegrenzt viele Produkte angeboten werden können, ist auch bei der Musiknutzung mit einer weiteren Steigerung des Angebotes (praktisch alle Musikwerke) zu rechnen.

Ziel der Forschungsarbeit ist es, die speziellen Anforderungen an die Verarbeitung sehr umfangreicher elektronischer Online-Nutzungen insbesondere von Musikwerken zu analysieren und technische Ansätze in Form von automatisierbaren Geschäftsprozessen und auf Basis neuer Softwarearchitekturen zu finden und zu erproben. Damit soll eine flexiblere, schnellere und möglicherweise sofortige (Adhoc-)Verarbeitung und Abrechnung dieser riesigen Mengen an Nutzungsereignissen (Datenvolumen von 100 GByte bis zu vielen TByte pro Monat sind nicht unüblich) unterstützt und letztendlich eine Abrechnung der Verkaufsumsätze mit möglichst geringen Betriebskosten erlaubt bzw. überhaupt möglich werden. Vom Verarbeitungsprozess betroffen sind sowohl die Verbindungen der in den beteiligten Unternehmen genutzten Softwaresysteme, wie auch die technischen Aspekte der Speicherung und Verarbeitung von unternehmensübergreifenden Massentransaktionen. Die Forschungsarbeit soll dabei auch neue Ansätze etwa aus dem Umfeld von Cloud Computing, Grid-Computing, NoSQL-Datenbanken und Complex Event Processing, sowie Workflow-Management-Ansätze im Kontext der Problemstellung untersuchen.

Wenn auch die erforderlichen Verarbeitungsprozesse in anderen Branchen zum Teil anders sind, so ist die für die Musiknutzung erläuterte Problemstellung nicht nur auf diesen Bereich beschränkt, sondern kann auch auf andere Online-Angebote wie z.B. auf die elektronische Nutzung von Software, von Büchern, Texten, usw. abgebildet werden. Im Rahmen der Forschungsarbeit ist also eine Verallgemeinerung der Problemstellung und möglicher Lösungsansätze anzustreben.

Im Einzelnen sind im Rahmen des Projekts mehrere Forschungsaspekte zu vertiefen:

  • Zunächst sollen die konkreten Anforderungen an die Prozesse der Online-Musiknutzung ausgearbeitet werden. Die Problemstellung soll klar umrissen werden und die beteiligten Instanzen sowie ihre Rollen sollen untersucht werden. Die Nutzungsmodelle und die dahinterliegenden Geschäftsmodelle sollen ebenfalls kategorisiert und bewertet werden.
  • Danach soll der Stand der Technik im Bereich der Massenverarbeitung von Ereignissen durch Nutzung von Musikwerken im Internet aufbereitet werden. Dabei sollen derzeit aktuelle Online-Dienste, Verarbeitungsprozesse für die Abrechnung von Werken, beteiligte IKT-Systeme und Schnittstellen zwischen den beteiligten IKT-Systemen untersucht werden. Mengenbetrachtungen zur Modellierung des Umfangs der zu verarbeitenden Daten sollen angestellt und Prognosen für Entwicklungen in der näheren Zukunft sollen erstellt werden.
  • Auf der Basis des Stands der Technik soll eine möglichst allgemeine Beschreibung des fachlichen Verarbeitungsprozesses durchgeführt werden. Daraus sollen erste Standardisierungsansätze für das Zusammenspiel der beteiligten Stakeholder identifiziert werden.
  • Verschiedene Lösungsansätze, Architekturvarianten und in Frage kommende Technologien für die Verarbeitung von Massenereignissen im Bereich der Musiknutzung und deren schnelle Verarbeitung, insbesondere durch möglichst automatisierte Workflows sollen untersucht und anhand einer Fallstudie auf Basis eines realen Datensatzes erprobt werden. Die Durchgängigkeit und insbesondere die Leistungsfähigkeit neuer Lösungsansätze sind anhand eines Demonstrators zu zeigen. Neue Techniken und Technologien, die u.a. für diese Aufgabenstellung eine Rolle spielen könnten, sind massiv parallele verteilte Algorithmen (Grid-Computing), Complex Event Processing (CEP), NoSQL-Ansätze und P2P– und Cloud-Computing.