Audio: Mit KI zm 3D-Sound (Teil 2)

Aufgrund meiner nun 2-jährigen Erfahrung bei der Umsetzung von Stereo- zur Auro-3D-Mehrkanalmusik über die KI-Technik von RipX, möchte ich hier einige Tipps erläutern.

Meine optimierte Abspielumgebung

Für das Feintuning der Musikstücke ist es am Besten, direkt mit den Geräten zu arbeiten, mit denen man die Musik genießt. Ich verwende als Abspielgerät einen Intel NUC (jetzt bei ASUS) der 12-ten Generation mit i3-Prozessor und 2 HDMI-2.1-Ausgängen. Das ganze steckt in einem Passivkühlgehäuse von Akasa. Kein Ventilator stört den Musikgenuss.
Einer dieser HDMI-Ausgänge geht in den Fernseher und der andere in den AV-Receiver. Beide HDMI-Ausgänge arbeiten im Duplizier-Modus, d.h. gleiche Anzeige auf beiden Bildschirmen! Der Rechner verbraucht beim Abspielen einer 5.1-FLAC-Datei mit einer Sample-Rate von 96kHz im Schnitt nur 11 Watt.
Das Abspielen erfolgt innerhalb des exzellenten Musikverwaltungsprogramms Audirvana-Origin. Das kostenpflichtige Audirvana-Origin beeindruckt durch seine Übersicht und viel Liebe zum Detail. Das Programm bietet alles, was man zum Abspielen von hochauflösenden Musikdateien braucht. Audirvana-Origin verwendet eine SQLite-Datenbank, die sich bei guten Programmierkenntnissen, leicht ergänzen läßt. Es erfolgen regelmässig automatisierte Updates, was immer ein gutes Zeichen für ein unterstützungswertes Produkt ist.

Hinweis für Programmierer: Auch die DLL von SQLite wird auf die jeweils neuste Version aktualisiert. Wird mit unterschiedlichen Versionen gearbeitet, so zerstört man sich u.U. die Datenbankdatei AudirvanaDatabase.sqlite.

Auf dem NUC-Rechner befindet sich auch das freie Musikbearbeitungsprogramm Audacity. Damit läßt sich jede der 6 Spuren der 5.1-FLAC-Audiodatei den individuellen Musikgeschmack anpassen und sofort über die Audiomehrkanalanlage (AV-Receiver + 9 Lautsprecher + 2 Subwoofer) überprüfen.

Als Betriebssystem kommt Windows 11 Pro zum Einsatz.

Wichtiger Hinweis:
Der Betrieb mit älteren Rechnern, die nur eine 2.0-HDMI-Schnittstelle besitzen, war sehr unbefriedigend. Die Audio-Konfiguration ging nach jedem Boot-Vorgang verloren. Die notwendige Neukonfiguration der Audio-Einstellungen war manchmal recht aufwendig und nervig. Erst der NUC 12 mit 2 HDMI-2.1-Ausgängen funktioniert praktisch ohne Probleme, wenn man unteren Hinweis zur Konfiguration beachtet.

Konfigurationen unter Windows 11

Wichtiger Hinweis:
Nach dem Hochfahren des Rechners und noch vor dem Windows-Login sollte die Verbindung zum AV-Receiver sichergestellt werden. Der AV-Receiver ist einzuschalten und der entsprechende HDMI-Kanal zum PC ist freizuschalten. Bei mir gescheint dann im Display des AV-Receivers der Schriftzug PC. Macht man dies nicht, so stellt sich die Audiokonfiguration von Windows auf die Fähigkeiten des Fernsehers ein. In diesem Fall ist die untere Konfiguration neu vorzunehmen.

Für die Konfiguration der Audiowiedergabe unter Windows 11 dient das Tool mmsys.cpl. Der Aufruf erfolgt über die rechte Maustaste im Start-Icon und Auswählen des Menüpunkts Ausführen. Im nun geöffneten Ausführungsfenster ist der Befehl mmsys.cpl einzugeben.

mmsys.cpl
Es sind 3 Einstellungen vorzunehmen:

  • 1: Standardgerät -> AV-Receiver (hier marantz-AVR-2)
  • 2: Eigenschaften -> Erweitert -> Standardformat: 24 bit, 96000 Hz (Studioqualität)
  • 3: Konfigurieren -> Audiokanäle: 5.1 Surround


mmsys.cpl
Einige 5.1-FLAC-Audiodateien besitzen eine maximale Abtastrate von 96 kHz, weshalb als Standardformat 24 bit + 96000 Hz einzustellen ist.


mmsys.cpl
Da 5.1-FLAC-Audiodateien abgspielt werden sollen, ist der 5.1-Surround auszuwählen. Ist beim AV-Reiceiver der Auro3D-Modus aktiviert, wird über den Auro3D-Upmixer beim Abspielen der 5.1-FLAC-Datei der super klare Raumklang erzeugt.

Wichtiger Hinweis:
Die Windows 11 eigene Raumklangoption ist auszuschalten. Nur der AV-Receiver hat durch die Einmessung die notwendigen Informationen zu Raumklangkorrektur.


Optimierte Bass-Wiedergabe

Für die Bass-Wiedergabe verwende ich 2 Subwoofer.
Besitzt man mindestens einen guten Subwoofer, so hört sich die Bass-Spur, die RipX. erzeugt hat, nicht gut an. Die 4. Spur der 5.1-FLAC-Datei ist mit höheren Frequenzen überfrachtet. Es kommt zum Wabbeln der Subwoofer-Membran und bei Subwoofern mit einem Bassreflexrohr zu deutlichen Pumpgeräuschen. Deshalb sollte man die Bass-Spur mit einem Tiefpassfilter so bearbeiten, dass höherere Frequenzen herausgelöscht werden. Meine verwendeten Tiefpassfilter-Einstellungen in Audacity sind:

  • Frequenz: 120 Hz (Grenzfrequenz)
  • Reduzierung (dB pro Oktave): 12 dB

Audacity

Dies verhindert das Wabbeln der Subwoofer-Membran und die Membran kann wegen des längeren Hubs sowie dessen höheren Massenträgheit aufgrund der Baugröße besser arbeiten.
Zu beachten ist, dass bei der Behandlung mit den Tiefbassfilter, der Subwoofer-Bass deutlich präziser und etwas lauter klingt, sodass eine Lautstärkenreduzierung i.d.R. notwendig ist. Bei mir liegt die jeweilige Reduzierung bei 0 bis 4 dB.

Wegen der Geometrie meines Wohnzimmers verwende ich 2 aktive Subwoofer, da mit nur einem Subwoofer bei einigen Tieffrequenzen und dessen Langwelligkeit die Lautstärke auf meiner Sitzposition nahezu Null ist.
Der kleinere meiner beiden Subwoofer (100 W) bekommt nur Frequenzen von maximal 120 Hz und der größere Subwoofer (300 W) bekommt Frequenzen kleiner gleich 80 Hz zugespielt. Letzteres kann ich am Subwoofer direkt einstellen.
Hinweis: Tiefe Frequenzen benötigen mehr Leistung als hohe Frequenzen.

Auslöschungen und Additionen des Schallpegels bei einer Mehrkanalsystemen sind umso stärker wahrnehmbar, je tiefer die Frequenz des Schalls ist. Besonders kritisch wird es bei der Übergangsfrequenz zwischen 2 Subwoofern, weil hier beide Subwoofer die gleichen (tiefen) Frequenzen produzieren, aber nicht am gleichen Ort stehen. Der größere Subwoofer bietet hier die Möglichkeit einer Phasendrehung. Ich habe eine Phasendrehung von 30 Grad eingestellt. Diese Einstellung liefert in meinen Räumlichkeiten den besten Klang bei den Tieftönen.

Übrigens werden bei Filmen die Subwoofer je nach System unterschiedlich beschickt:

  • bis maximal 120 Hz bei Dolby-Tonspuren
  • bis maximal 80 Hz bei DTS-Tonspuren


Optimierte Konzert- oder Mittenwiedergabe

Einige Musikliebhaber bemängeln bei Mehrkanalwiedergaben, dass sie sich mitten in der Band befinden. Sie möchten, dass die Musik von vorne kommt. Dies läßt sich einfach durch Lautstärkenreduzierung der hinteren beiden Kanäle erreichen. Dabei bleibt der Auro3D-Raumklang erhalten. Ich reduziere die hinteren beiden Kanäle je nach Lied um 1 bis 4 dB. So kommen die Instrumente mehr von vorn und hinterlassen den Bühneneindruck eines Konzerts.

Nacharbeiten bei einer neuen RipX-Version

Lieblingslieder sollte man nochmals mit der jeweils neusten RipX-Version bearbeiten. Die Qualitäten der erzeugten Spuren werden laufend verbessert. Auch lassen sich neuerdings Gitarre und Klavier getrennt extrahieren. Wenn man z.B. die extrahierten Gitarren auf die hinteren Lautsprechern oder Center-Speaker legt, werden sie zusätzlich hervorgehoben und man erlebt sie noch mehr detailreicher.