Weniger Angst in VR: Pionierarbeit bei der Minderung von Angstauslösern in immersiven Medien

19.05.2024 MIXED / Daniel Pohl

Bild: Dall-E (prompted by Daniel Pohl)

Der Artikel kann nur mit aktiviertem JavaScript dargestellt werden. Bitte aktiviere JavaScript in deinem Browser und lade die Seite neu.

Angstfrei in der Virtual Reality: Wie Entwickler:innen und Forschende daran arbeiten, Angstauslöser in immersiven Medien zu minimieren.

von Daniel Pohl

In Zeiten von Social Media ist das Betrachten verschiedener Bilder nach dem Zufallsprinzip für viele Menschen in der 2D-Welt eine alltägliche Erfahrung. Dabei passiert es nicht selten, dass beim scheinbar endlosen Scrollen durch die Timeline auch Bilder dabei sind, die man eigentlich gar nicht sehen wollte: Sei es die Makroaufnahme einer Spinne für Arachnophobe, ein realistisches Kriegsbild mit Verwundeten oder eine Nahaufnahme des frischen Sushis neben dem Kobe-Rind für vegan lebende Menschen.

Auf dem Handy, Tablet oder Monitor kann man relativ schnell wegschauen und zum nächsten Bild übergehen. So mag das Erlebnis mit einem Angstauslöser in 2D zwar nicht schön gewesen sein, wird aber schneller vergessen. Hochimmersive 3D-Medien hingegen setzen darauf, reale Szenen in der Virtual Reality so wiederzugeben, dass sich der Betrachter in der Szene so präsent fühlt, als wäre er selbst dort. Bei 180°- und 360°-Bildern wird das Wegschauen also schwieriger.

Eine Lösung wäre, die Augen zu schließen und zu hoffen, dass das nächste Bild keinen Angstauslöser mehr hat. Diese Reaktion ist jedoch oft nicht intuitiv verankert und kann gerade bei Bildserien mit ähnlichem Inhalt wenig hilfreich sein. Gerade wegen des hohen Realismus in VR ist es daher sinnvoll, über die Minimierung von Angstauslösern in immersiven Medien nachzudenken. Dies ermöglicht eine breitere und angenehmere Nutzung für unterschiedliche Nutzergruppen.

Als Entwickler des VR Bild- und Slideshowbetrachters immerGallery haben wir genau das getan. In Zusammenarbeit mit der Universität Würzburg hat sich die Studentin Amelie Hetterich in ihrer Bachelorarbeit mit dem Thema beschäftigt. Eine Kurzfassung der Arbeit wurde im Dezember 2023 auf der wissenschaftlichen Konferenz ICAT-EGVE in Dublin vorgestellt.

Da Angstauslöser gerade bei hochimmersiven, realistischen VR-Medien sehr intensiv sein können, stellen wir in diesem Artikel Forschungsarbeiten vor, die deren Einfluss reduzieren und damit ein angenehmeres, zufälliges Betrachten immersiver Medien ermöglichen. Neben verschiedenen Strategien für unterschiedliche Ängste gehen wir auch auf mögliche automatisierte Maßnahmen und eine aktuelle Produktimplementierung ein, die diese bereits nutzt.

Inhalt

Bisherige Arbeiten zum Thema Angst in Virtual Reality

Virtual Reality wird seit geraumer Zeit im therapeutischen Bereich eingesetzt, wo Patienten unter professioneller Aufsicht abgestuften Belastungen mit Angstauslösern ausgesetzt werden. Wissenschaftliche Arbeiten beschäftigen sich mit Themen wie Flugangst oder Höhenangst (Wiederhold et al. 2002, Rotbaum et al. 1997). Im Bereich der Therapie von Höhenangst setzte Hodges et. al 1995 einen virtuellen Boden in immersiven VR-Anwendungen ein.

Im Bereich der 2D-Computerspiele haben Mods wie „Spiders Begone“ in Skyrim die virtuellen Riesenspinnen durch Bären ersetzt. Im VR-Spiel Walkabout Minigolf VR können die großen Spinnen auf dem Dachboden des gruseligen Golfplatzes „Widow’s Walkabout“ bei Arachnophobie in den Optionen deaktiviert werden.

Im Gegensatz zu diesen interaktiv gerenderten Erlebnissen sind die Aufnahmen bei immersiven Medien, also 3D-Fotos, 180-Grad-Videos usw., bereits final erzeugt. Man kann also nicht einfach in einer Rendering-Engine bestimmte 3D-Objekte weglassen, um sie neu zu rendern, oder sie in eine andere Geometrie umwandeln. In diesem immersiven Medienbereich gibt es eine Patentanmeldung von immerVR, die 13 Mitigationsstrategien zusammenfasst und speziellere Algorithmen dazu im Detail aufzeigt.

Folgende allgemeine Punkte zur Reduktion von Angstauslösern in immersiven Bildern/Videos sind dort zu finden:

Entfernen des Bildes/Videos aus der Abspielliste
Reduktion des sichtbaren Bereichs (Field-of-View)
Betrachten der Bilder durch ein kleines, bewegliches Objektiv
Betrachten der Medien auf einer kleinen, fixen Leinwand mit Optionen zum Rotieren des dargestellten Bildes
Den Angstauslöser unscharf zeichnen
Den Angstauslöser ausschneiden und mit etwas anderem in passendem Kontext ersetzen
Statt möglicher stereoskopischer Darstellung nur in 2D darstellen
Niedrigere Lautstärke bzw. Entfernen von angstauslösendem Ton
Entfernung von haptischem Feedback
Einen virtuellen Boden unter dem Nutzer anzeigen
Ändern des angenommenen Augenabstands des VR-Users zum Ändern der wahrgenommenen Größe
In 6-DoF Medien (3D-Medien mit freier Bewegung im Raum) den Benutzer weiter vom Trigger entfernt positionieren
Einblenden von Elementen der realen Welt

Grundlagen

Zuerst gehen wir darauf ein, mit welchen Arten von Bildern wir es bei Virtual Reality zu tun haben. Generell gilt vieles, was wir hier anhand von Einzelbildern beschreiben, auch für den Videobereich. Die gängigsten Bildformate für Virtual Reality sind:

Normale 2D-Fotos (z.B. klassische Kamera, Handy)
Kurzwinklige 3D-Fotos (ähnlich zu 3D-Kino oder 3D-TV)
VR180-3D Medien: eine Halbkugel wird aus zwei verschiedenen Ansichten aufgenommen, meist in der Distanz des durchschnittlichen menschlichen Augenabstands von 6,3 cm
360-2D: eine komplette Kugel der Umgebung, z.B. aus 360°-Action-Kameras oder von Drohnen aufgenommen
360-3D: die komplette Umgebung als Kugel, allerdings mit Stereoskopie
Panoramen: sehr weitwinklige Panoramen, z.B. erzeugt durch das Schwenken des Smartphones

Bildformate von links nach rechts: 180° × 180° auf einer Halbkugel, 360° × 180° auf einer ganzen Kugel, normales 2D-Bild auf einer flachen Darstellungsfläche und ein Panorama auf einer gekrümmten Leinwand. | Bild: immerVR

Einige der Bildformate machen auf klassischen 2D-Displays nur bedingt Sinn. Daher sind, wie wir später am Beispiel der KI-Objekterkennung sehen werden, auch einige gängige Algorithmen noch nicht für diese Bildformate optimiert.

Anwendung

Als Grundlage für die Forschung wurde eine aktuelle Version des immersiven VR-Bildbetrachters immerGallery verwendet. Einige Teile der Forschung sind mittlerweile in das Produkt zurückgeflossen. Um auf die individuellen Ängste eines Nutzers adäquat reagieren zu können, ist es möglich, einige der eigenen Ängste in der Anwendung zu spezifizieren. Im weiteren Sinne wäre es denkbar, ein solches Profil auch appübergreifend zu haben, z.B. vertraulich im Profil des Headset-Accounts hinterlegt.

Ängste und Lösungen

Während wir eingangs schon einige theoretische Ansätze zur prinzipiellen Lösung zur Reduktion von Angstauslösern erwähnt haben, gehen wir nun näher auf die praktische Umsetzung und die daraus gewonnenen Erkenntnisse ein.

Bildbasierte Angstauslöser

Wenn man weiß, wo sich potenzielle Angstauslöser im Bild befinden, kann man versuchen, diese zu entfernen. Im Zuge der Bachelorarbeit haben wir in einer Hilfsdatei für jedes Bild die entsprechenden Elemente manuell in Form eines Rechtecks markiert. Wenn der Bereich zu groß ist und das Bild ohne diesen Bereich ohnehin keinen nennenswerten Wert zum Betrachten hätte, kann man den Angstauslöser auch ohne Rechteck für das gesamte Bild definieren.

Als einfache Möglichkeit haben wir dann in der Forschungsarbeit die markierten Pixel des Rechtecks einfach mit der umgebenden Farbe gefüllt, wodurch der Angstauslöser zensiert wird. Je nach Hintergrund kann dies sehr gut funktionieren oder störend wirken, je nachdem, ob die Grenzen des Rechtecks erkennbar sind und der Hintergrund eine sehr unterschiedliche Farbe hat.

Die beste Lösung ist hier der Einsatz von KI-Techniken, die mit dem sogenannten KI-Inpainting Bildbereiche neu zeichnen können. Im Idealfall merkt der Betrachter nicht mehr, dass das Bild überhaupt verändert wurde. Die Ausführung solcher KI-Algorithmen kann auf aktuellen Standalone-Headsets etwas leistungsintensiver sein. Wir haben daher im Rahmen der Forschungsarbeit lediglich die zusätzliche Möglichkeit implementiert, ein KI-manipuliertes Bild bereits vorverarbeitet, als alternative Lösung für den jeweiligen Angstauslöser anzubieten.

Hier am Beispiel des Bildes eines Gartentisches, auf dem ein Käfer sitzt. Der Benutzer hat zuvor angegeben, dass er Angst vor Käfern oder Insekten im Allgemeinen hat.

Links: Originalbild eines Käfers auf einem Tisch. Mitte: Graues, gleichfarbiges Rechteck über Angsttrigger. Blaue Umrandung nur zur Verdeutlichung. Rechts: Angsttrigger wurde über KI-Inpainting entfernt. | Bild: Quelle: immerVR

Die Besonderheit bei immersiven Bildern ist, dass man bei einem 3D-Foto natürlich links und rechts den Angstauslöser entfernen muss. Dabei ist darauf zu achten, dass die wahrgenommene Tiefe des Bildes nicht leidet. Mit dem Rechteck, solange es relativ eng um den entfernten Bereich ist, funktioniert das in der Praxis relativ gut.

Beim KI-Inpainting, bei dem zufällig Pixel „erfunden“ werden, ohne dass die KI-Algorithmen die Stereoskopie berücksichtigen, kann es schneller zu falschen Tiefeneindrücken kommen. Bei VR180- und 360-Grad-Bildern im equirektangularen Format ist noch zu beachten, dass ggf. die Verzerrung des Formats zunächst ausgeglichen werden muss, worauf später noch näher eingegangen wird.

Räumlich basierte Angstauslöser

Neben den bildbasierten Auslösern gibt es auch viele Auslöser, die sich auf den wahrgenommenen Raum beziehen. So kann beispielsweise Höhenangst ausgelöst werden. In zu engen Räumen kann das Gefühl von Klaustrophobie entstehen. Bei zu geringem Abstand zu anderen Menschen oder Tieren kann Berührungsangst (Haphepobie) ausgelöst werden.

Für viele dieser Bereiche ist es sehr hilfreich, eine Tiefenkarte zu erzeugen, um die Situation besser einschätzen zu können. In diesem Bereich gibt es viele Tools, die Tiefenkarten sowohl aus mono- als auch aus stereoskopischen Bildern erzeugen. Allerdings ist die Skalierung der Tiefenpixelwerte in die reale Welt oft unklar. Wenn jedoch das genaue Modell einer 3D-Kamera mit den Eigenschaften der Linsen bekannt ist, lässt sich dies relativ gut in eine Weltskalierung in metrischen Einheiten umrechnen, so dass z.B. der Abstand zum Boden oder zu anderen Personen sinnvoll abgeschätzt werden kann.

Im Rahmen der Forschungsarbeit haben wir den Bereich der Höhenangst näher untersucht. Ein Bereich, in dem laut Studien 3-6% der Bevölkerung starke Ängste haben und man schätzt, dass ca. 30% der Bevölkerung zumindest ein leichtes Unwohlsein in großer Höhe verspüren. Mit einer so hohen Verbreitung ist dies definitiv eines der wichtigsten Themen im Bereich Angst in der Virtual Reality, für das es glücklicherweise gute Lösungen gibt.

MIXED.de ohne Werbebanner
Zugriff auf mehr als 9.000 Artikel

Kündigung jederzeit online möglich

ab 3,50 € / Monat

Jetzt unterstützen

Wie eingangs erwähnt, gab es schon früher Forschungen, die einen virtuellen Boden gegen die Angst in der Virtual Reality anzeigten. Inzwischen ist diese Mitigationsstrategie mit Erweiterungen in das Produkt immerGallery mit einem Userprofil für Höhenangst (Akrophobie) eingeflossen.

Unterschiedliche Einstellungen im User-Profil von immerGallery bezüglich Höhenangst. | Bild: immerGallery

Bei einem Angstprofil mit mittlerer Höhenangst wird für alle monoskopischen Bilder (z.B. Drohnenfotos oder Fotos einer 360°-Actioncam) und für alle Bilder, die auf einem virtuellen Bildschirm angezeigt werden, ein künstlicher Boden mit Geländer unter den Füßen des Nutzers als 3D-Umgebung gerendert. Bei der Einstellung „hoch“ geschieht dies bei allen Bildern.

Warum wird zwischen „mittel“ und „hoch“ unterschieden? Weil der künstlich gerenderte Boden in der Virtual Reality als echtes 3D-Objekt natürlich auch eine echte Tiefe hat. Ist der dargestellte Medieninhalt drumherum nur monoskopisch, gibt es hier keine relevanten Tiefenkonflikte. Anders verhält es sich jedoch bei stereoskopischen Medien: Dadurch, dass dem Nutzer für das linke und rechte Auge leicht versetzte Bilder gezeigt werden, interpretiert die menschliche Wahrnehmung die Tiefe dieser Bilder. Diese kann dann mit der Tiefe des künstlichen Bodens kollidieren, was zu einem unangenehmeren Tiefenerlebnis führt. Bei starker Höhenangst ist diese Methode jedoch wahrscheinlich vorzuziehen.

Links: künstlicher Boden gegen Höhenangst erzeugt keinen Tiefenkonflikt. Rechts: Das Geländer wird als näher empfunden als der Boden, der es blockiert. | Bild: immerVR

Wie das Beispiel in der Abbildung zeigt, kann der künstliche 3D-Boden gegen Höhenangst ohne Wahrnehmungsprobleme zusätzlich gerendert werden, wenn die Elemente wie im linken Bild weiter voneinander entfernt sind. Im rechten (stereoskopischen) Bild käme es zu einem Tiefenkonflikt zwischen der Wahrnehmung der Tiefe des Bodens und der Tiefe des Geländers. Je nach Stärke der Höhenangst kann der Boden trotz des Tiefenkonflikts die bessere Alternative sein.

Natürlich kann ein solches künstliches Objekt wie der 3D-Boden gegen Höhenangst bei der Betrachtung von hochimmersiven Bildern auch die Illusion der Präsenz in den virtuellen Medien etwas mindern. Um dies so weit wie möglich zu vermeiden, bieten wir verschiedene andere, kontextbezogene Böden gegen Höhenangst an.

Der Korb des Heißluftballons gibt Halt bei Höhenangst. | Bild: Quelle: immerVR

Schnorchelfotos anschauen mit sicherem Meeresboden unter den Füßen gegen Höhenangst. | Bild: immerVR

Wie die beiden Beispiele mit dem 3D-Heißluftballoon und der 3D-Unterwasserumgebung zeigen, kann man durchaus kontextbezogene Böden gegen Höhenangst anbieten, die die Immersion weniger beeinträchtigen.

Multisensorische Angstauslöser

In einer immersiven VR-Slideshow werden nicht nur Bilder gezeigt, sondern auch Ton und ggf. Haptik. Dementsprechend kann beispielsweise bei einem User mit Angst vor Hunden ein Bellen in der Tonspur Angst auslösen, wenn ein Foto einer Naturlandschaft ohne Tiere gezeigt wird. Deshalb haben wir im Rahmen der Bachelorarbeit vorgeschlagen, bestimmte Sequenzen eines markierten Audiotracks mit Angstauslösern auszublenden oder einen Audiotrack mit einem Angstauslöser komplett abzuschalten.

Um keine unnatürlichen Lücken entstehen zu lassen, könnte man hier auch alternative Audiotracks anbieten, etwa einen, bei dem das Hundegeräusch durch ein Katzengeräusch ersetzt wird und dann je nach Userprofil in Bezug auf Angst geladen wird. Haptik ist oft nur das Vibrieren des Controllers beim Navigieren durch Menüs oder bei Interaktionen wie dem Weiterschalten von Bildern. Aber auch diese haptischen Wahrnehmungen erhöhen insgesamt die Immersion.

Hier kann man überlegen, ob man bei Berührungsängsten in Medien, in denen Menschen gezeigt werden, jegliche Controller-Haptik abschaltet. Mit haptischen VR-Handschuhen oder haptischen Ganzkörperanzügen lassen sich sicherlich noch viel feinere und neue Abstufungen erforschen.

Angstauslösende Umgebungen

Neben Bild, Ton und Haptik bietet immerGallery zur Steigerung der Dynamik und damit der Immersion auch verschiedene virtuelle Umgebungen zum Betrachten der Medien an, wie z.B. die bereits erwähnten Heißluftballons oder die Unterwasserumgebung. Für Naturaufnahmen gibt es auch eine Meadow-Environment (Wiese) mit Blütenstaub und Schmetterlingen.

Hier kam das Feedback eines Nutzers, dass er diese Umgebung nie verwenden würde, da er panische Angst vor Schmetterlingen hat. Als Konsequenz bieten wir nun „Meadow no Butterflies“ an, bei dem der Blütenstaub immer noch eine Wiesenumgebung dynamischer macht, aber ohne Schmetterlinge, um den Angstauslöser zu vermeiden.

Angst vor dem nächsten Bild

Ebenso wurden wir durch Nutzerfeedback darauf aufmerksam gemacht, dass bereits das Weiterschalten zum nächsten Bild, ohne zu wissen, was angezeigt wird, eine gewisse Angstsituation darstellen kann. Zwar wäre es möglich, das Menü zu öffnen und dort durch Scrollen nach dem Thumbnail des nächsten Bildes zu suchen. In der Praxis ist dies jedoch zu zeitaufwändig und mindert die Immersion. Die einfache Lösung: Ein Thumbnail des nächsten Bildes wird auf dem Controller angezeigt.

Eine Vorschau am Controller zum nächsten Bild verringert die Angst vor unerwartetem Content mit möglichen Angstauslösern | Bild: immerVR

Automatisierung des Erkennens und Ersetzens von Angstauslösern

Durch das manuelle Markieren und Ersetzen verschiedener Angstauslöser kann man bereits sehr gut vorselektierte immersive Inhalte erzeugen, die auf möglichst breiter Basis angenehm konsumiert werden können. In größerem Maßstab möchte man dies natürlich automatisieren. In der Forschungsarbeit sind wir darauf näher eingegangen und werden dies hier kurz beleuchten.

Es ist wichtig zu beachten, dass die halbkugeligen 180° × 180° und die vollkugeligen 360° × 180° Medien in der Regel in einem equirektangularen Format gespeichert werden. Man kann sich das so vorstellen, als würde man einen runden Globus in ein rechteckiges Format bringen. Dies ist nur mit Verzerrungen möglich, die im folgenden Bild gut zu erkennen sind.

Verzerrungen im equirektangularen Format | Bild: Tobias Jung

Aktuelle KI-Algorithmen sind größtenteils auf normale, perspektivische Bilder trainiert, die natürlich auch die Mehrheit aller Bilder ausmachen. Entsprechend schlecht funktionieren leider verschiedene KI-Detektoren auf equirektangularen Bildern.

Im obigen Bild mit den Verzerrungen wir der Text von einer KI-Objekterkennung nicht erkannt. Erst nach Entzerren wie im unteren Bild funktioniert es. | Bild: immerVR

Daher muss das sphärische Bildformat zunächst in andere Darstellungen umgewandelt werden, um mit heutigen KI-Detektoren gute Ergebnisse zu erzielen.

Wie bereits erwähnt, wird auch beim KI-basierten Inpainting zum Ersetzen von Bildinhalten in der Regel keine Unterstützung für stereoskopische Bilder trainiert, die automatisch entsprechende tiefenkorrekte Anpassungen in den Bildern für das linke und rechte Auge vornimmt. Eine ähnliche Situation ist derzeit leider auch beim KI-basierten Upscaling von Fotos zu beobachten.

Da die meisten Fotos in dieser Welt 2D sind, sind die aktuellen Tools nicht darauf trainiert, neue Details für das Bild für das linke und rechte Auge konsistent zu „erfinden“, die zwischen den Ansichten und in Bezug auf die Tiefenwahrnehmung konsistent wären. Hier gibt es sicherlich noch viel Forschungsbedarf und wir können gespannt auf neue Produkte in diesem Bereich sein.

Zusammenfassung

Das Thema Angstauslöser in der Virtual Reality wird viele Nutzer früher oder später mit der weiteren Verbreitung des Mediums konfrontieren. Während interaktiv gerenderte Spiele 3D-Modelle mit Angstauslösern für das Rendering austauschen können, sieht die Situation bei bereits aufgenommenen 3D-Fotos und 3D-Videos anders aus. In diesem Artikel haben wir bereits viele Forschungsansätze zur Minderung von Angstauslösern in immersiven Medien aufgezeigt.

Einige davon haben auch schon ihren Weg in Produkte für Endkunden gefunden. Dennoch bleibt in diesem Bereich noch viel zu tun. Sowohl von Seiten der Forschung als auch von Seiten der App-Entwickler und Anbieter von KI-Tools, um VR noch zugänglicher zu machen. Es bleibt also ein wichtiges Feld mit sicherlich noch vielen spannenden Entwicklungen. Wir freuen uns, dass wir über diese Anfangsphase berichten konnten und sind gespannt, wie die Reise weitergeht.

Der Autor Daniel Pohl ist CEO und Gründer der Firma immerVR GmbH. Dort beschäftigt sich Daniel täglich mit den Neuerungen im Bereich immersiver Medien, meistens im Bereich der VR180 Stereofotografie. Mit seiner App immerGallery kann man hochimmersive Fotogalerien, hinterlegt mit Voice-Overs und Hintergrundmusiken in verschiedenen VR-Formaten auf den Meta Quest Geräten erleben – auch zusammen mit Freunden im Multiplayer.

Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.