Audio-Datenbanken durchsuchen, Sounds intuitiv bearbeiten, Produktionstools optimieren: Die Forschungsergebnisse von Medieninformatiker Lars Engeln helfen dabei.
Audio-Datenbanken durchsuchen, Sounds intuitiv bearbeiten, Produktionstools optimieren: Die Forschungsergebnisse von Medieninformatiker Lars Engeln helfen dabei.
Den 3m5. Excellence Award für die beste Informatik-Dissertation der TU Dresden verleihen wir 2024 an Lars Engeln. Mit seiner Arbeit hat der Medieninformatiker erforscht, wie man Klänge besser nutzen und bearbeiten kann, indem man sie visuell darstellt. In vielen Audio-Programmen sind die Werkzeuge dafür schwer zu verstehen, vor allem für Anfänger. Denn sie konzentrieren sich auf technische Details und nicht auf den Klang selbst. Das will Engeln ändern, indem er Klänge visuell darstellt.
Die Dissertation trägt den Titel: „Die Verbildlichung von Klangstrukturen im Kontext der Entwicklung von Werkzeugen für die Medienproduktion“. In der Praxis und Wirtschaft sind die Forschungsergebnisse aus Engelns Arbeit in verschiedenen Audio-Bereichen nutzbar:
Audio-Produktionstools: Die Entwicklung intuitiver und visuell ansprechender Werkzeuge zur Bearbeitung von Audio hilft Musikproduzenten, Tontechnikern und Sounddesignern
Medienproduktion: In der Film- und Videospielindustrie lassensichdamit immersivere Audioerlebnisse schaffen
Bildung und Schulung: Einsteiger, aber auch Fortgeschrittenen helfen visuelle Darstellungen, Audio-Bearbeitung schneller zu erlernen
Benutzerfreundlichkeit: Durch die Integration visueller Elemente in Audio-Software könnten Benutzeroberflächen zugänglicher und benutzerfreundlicher gestaltet werden
Engeln selbst sagt dazu: „Der klassische Anwendungsfall sind große Audio-Datenbanken, die zu durchsuchen bisher sehr zeitintensiv ist. Konzepte, um Klänge visuell darzustellen, existierten bereits. Sie richten sich allerdings eher an Menschen, die sich mit Soundengineering bereits auskennen. Denn sie stellen technische Parameter in den Fokus. Diese Parameter beschreiben in der Regel weder deren Bedeutung für den Sound noch welche Qualitäten im Sound zum Ausdruck kommen. Deshalb muss immer erst eine Art Übersetzungsprozess von der künstlerischen Idee hin zu den technischen Parametern erfolgen. Mit meiner Arbeit wollte ich solche Oberflächen nachvollziehbar gestalten.“
Dazu untersuchte Engeln zunächst mit rund 150 Studienteilnehmern, was sich Menschen für Bilder vorstellen, wenn sie einen bestimmten Klang hören. Bei der Studie spielte er Klänge ab und ließ die Teilnehmer eine schnelle Skizze dessen anfertigen, was ihnen als Form oder Bildassoziation dazu einfiel. In einem Evaluationsdurchlauf zeigte er ihnen die Skizzen anderer Teilnehmer zu den Klängen und ließ sie die passendesten wählen. Die so entstehenden rund 1.000 Skizzen analysierte er webbasiert mit einem eigens entwickelten Tool.
„Interessant war, dass Menschen entweder das klangerzeugende Objekt zeichnen, oder den Klang selbst: Wenn ich etwa den Klang eines bekannten Geräuschs spielte, wie einen Motor, der aufheult, dann zeichneten die einen ein kleines Auto, die anderen eher den anschwellenden Sound selbst, zum Beispiel als Wellenlinie, die immer mehr Platz auf der Bildfläche einnimmt.“ Der Hauptanteil von Engelns Dissertation, dier er mit summa cum laude abgeschlossen hat, bestand darin, dieses mentale Modell zu analysieren.
Idealerweise könnten Nutzer künftig bei der Audioproduktion auswählen, wie ihnen ein Sound visuell dargestellt werden soll: Als Objekte, die zu dem Sound passen; als Skizzen des Sounds selbst; oder als Visualisierung seiner technischen Ausprägung. Auf dem Weg dahin kann KI helfen: „Ich habe im Rahmen der Dissertation Machine learning genutzt, um aus den Skizzen Ähnlichkeiten zu ermitteln und Sounds zu clustern. Besonders in dem Anwendungsfall, in dem eine Skizze gezeichnet wird und passende Sounds aus einer Datenbank vorgeschlagen werden, kommt die Fähigkeit der KI ins Spiel, mit großen Datenmengen umzugehen.“
Lars Engeln verknüpfte mit seiner Dissertation seine Passionen IT, Theater und Komposition: Der Medieninformatiker komponiert selbst und hat in der Vergangenheit etwa vier Preise beim Bundeswettbewerb Komposition gewonnen. Er engagiert sich ehrenamtlich beim Theater der TU Dresden und entwirft interaktive Kunst-Installationen. Beruflich bleibt Engeln zunächst der Universität verbunden: als wissenschaftlicher Mitarbeiter an der Juniorprofessur für Gestaltung immersiver Medien forscht er an der räumlichen Interaktion für transmediale künstlerische Expression in AR/VR.
Weil die Audio-Industrie sowohl im professionellen als auch im Hobbybereich ein riesiger Markt ist, will er am Potenzial seiner Soundvisualisierung dranbleiben: „Mein Datensatz war überschaubar und ließe sich noch skalieren und dabei internationaler anlegen. Denn unsere auditive Wahrnehmung wird auch stark von unserem kulturellen Umfeld geprägt.“
Ab nach Sydney: Sechs Schülerinnen und Schüler eines Dresdner MINT-Gymnasiums vertreten Deutschland beim internationalen Finale des Wettbewerbs. Wir sponsern die Reisekosten.
Plugins sind nützliche Erweiterungen, die in der Entwicklung Zeit und Geld sparen. Die beliebstesten für das Neos CMS stellen wir Ihnen hier vor.
TYPO3 ist ein Content-Management-System und seit langem ein wichtiger Teil der Open-Source-Community. Damit die immer weiß, wohin sich in Zukunft entwickeln wird, gibt es die TYPO3 Roadmap. Sie beschreibt den Entwicklungsprozess des CMS und dokumentiert zukünftige Ziele und Pläne. Welche wichtigen Aspekte die TYPO3 Roadmap aktuell enthält und was das für Unternehmen bedeutet, die TYPO3 als CMS nutzen, lesen Sie hier.