Barrierefreie Videos
Auch Videos müssen grundsätzlich barrierefrei sein. Wozu Untertitel gemacht werden, wann es eine Audiodeskription braucht und weitere Aspekte von barrierefreien Videos zeigen wir in dieser Übersicht.
- Essenzielle Informationen als Teil der Audiospur: Essenzielle Informationen, die Teil der Audiospur sind, müssen für Menschen mit Hörbehinderungen auf anderem Weg vermittelt werden. Dazu werden Untertitel erstellt.
- Wann braucht es Untertitel?
- Die kurze Antwort lautet: Immer. Die rechtliche Situation (Schweizer Accessibility-Standard eCH0059, bezugnehmend auf WCAG) schreibt Untertitel unmissverständlich für sämtliche Videos mit informativem Audio vor, also für alle Videos, deren Audiospur nicht nur aus Hintergrundmusik, Untermalung, etc. besteht. An der ETH werden seit September 2023 alle neuen Videos automatisch untertitelt, sowohl im Videoportal wie auch im Webauftritt (AEM). Die Qualität dieser Untertitel variiert in Abhängigkeit von verschiedenen Merkmalen des Videos (Disziplin, Akzent etc.).
- Die lange Antwort: Im Sinne einer pragmatischen Herangehensweise fokussieren wir an der ETH Zürich darauf, diejenigen Videos mit manuell überarbeiteten Untertiteln zu versehen, die eine hohe Aussenwirkung und grosse Verbreitung erzielen. Solche Videos werden in der Regel in den Kommunikationsabteilungen erstellt, teils mithilfe von externen Partnern (Agenturen). Beispielsweise werden die Videos, die in der oder für die Hochschulkommunikation gedreht werden, bereits seit Längerem konsequent mit manuell erstellten Untertiteln versehen.
- Suchmaschinenoptimierung (SEO): Untertitel machen Videos besser durchsuchbar für Suchmaschinen, insbesondere bei nicht ins Bild eingebrannten Untertiteln. Weil sie Textelemente sind, können sie von Suchmaschinen besser verarbeitet werden. Videos mit Untertiteln profitieren davon und erzielen bessere Rankings.
- Die kurze Antwort lautet: Immer. Die rechtliche Situation (Schweizer Accessibility-Standard eCH0059, bezugnehmend auf WCAG) schreibt Untertitel unmissverständlich für sämtliche Videos mit informativem Audio vor, also für alle Videos, deren Audiospur nicht nur aus Hintergrundmusik, Untermalung, etc. besteht. An der ETH werden seit September 2023 alle neuen Videos automatisch untertitelt, sowohl im Videoportal wie auch im Webauftritt (AEM). Die Qualität dieser Untertitel variiert in Abhängigkeit von verschiedenen Merkmalen des Videos (Disziplin, Akzent etc.).
- Wann braucht es Transkripte?
- Mithilfe von Transkripten ist es auch Menschen mit Hörbehinderungen möglich, Audioinhalte wie Podcasts oder Radiointerviews zu nutzen.
- Transkripte (Textabschriften) werden eingesetzt, wenn man Audio-Inhalt ohne Bildspur hat, beispielsweise Podcasts. Unterschiede zwischen Transkripten und Untertiteln:
- Transkripte werden eingesetzt, wenn das Medienformat nur aus Audioinformation besteht,
- Untertitel werden eingestzt, wenn das Medienformation sowohl Bild- als auch Audioinformation enthält.
- Transkripte werden i.d.R. auf der Originalseite des Podcasts bereitgestellt, z.B. ETH-Podcast. Das Transkript kann direkt als Text angezeigt werden oder als Dokument zur Verfügung gestellt werden. Dabei ist es hilfreich, den Text so zu strukturieren, dass er dem Gehörten entspricht, z.B. Interviewfragen von den -antworten abzusetzen.
- Untertitel werden direkt im Video gespeichert. Teilweise sind sie im Bild «eingebrannt», teilweise sind sie zu- und abschaltbar.
- Wer für die Audioaufnahme das Audiostudio nutzt, wird von den Zuständigen auf die Notwendigkeit eines Transkripts hingewiesen.
- Mithilfe von Transkripten ist es auch Menschen mit Hörbehinderungen möglich, Audioinhalte wie Podcasts oder Radiointerviews zu nutzen.
- Essenzielle Informationen als Teil der Bildspur: Forschungsvideos, Erklärvideos, gefilmte Experimente, Interviews, Spielfilme, aber auch Vorlesungsaufzeichnungen sind Videos, die typischerweise Bild und Ton aufweisen. Essenzielle Informationen, die Teil der Bildspur sind, müssen für Menschen mit Sehbehinderungen auf anderem Weg vermittelt werden. Dazu können entweder zusätzliche Audiodeskriptionen erstellt oder die Audiospuren von Beginn weg so geplant werden, dass alle essenziellen Informationen auf der Audiospur vermittelt werden. Separate Audiodeskriptionen sind deutlich aufwändiger und teurer.
- Wann braucht es Audiodeskriptionen?
- Mit den hier präsentierten Aspekten richten wir uns an alle, die ein Grundinteresse für das Thema der Audiodeskriptionen haben und die sich ein Hintergrundwissen aufbauen möchten. Relevant sind Audiodeskriptionen primär für Hörfilme, Spielfilme, Kinofilme, Fernsehen
- Eine Audiodeskription beschreibt - zusätzlich zur normalen Audiospur - rein visuelle, für den Inhalt und das Verständnis aber essenzielle Details. So können auch Menschen mit Sehbehinderungen diese rein visuellen Informationen verarbeiten. Für das Erstellen von Audiodeskriptionen ist es ratsam, professionelle Unterstützung beizuziehen (z.B. SwissTXT, Hörfilm Schweiz).
- Eine Audiodeskription ist nicht nötig, wenn eine Stimme (als Element der normalen Audiospur) alle inhaltlich relevanten Details ansagt. Dies ist der kostengünstigere und einfachere Weg.
- Mit den hier präsentierten Aspekten richten wir uns an alle, die ein Grundinteresse für das Thema der Audiodeskriptionen haben und die sich ein Hintergrundwissen aufbauen möchten. Relevant sind Audiodeskriptionen primär für Hörfilme, Spielfilme, Kinofilme, Fernsehen
- Vorschaubild (Standbild): Videos haben in aller Regel ein Vorschaubild (Standbild). Dieses muss mit einem Alternativtext versehen sein, damit auch Menschen mit Sehbehinderungen erfahren, was es mit diesem Bild auf sich hat. Der Alternativtext kann immer gleich lauten, z.B. "Video-Vorschaubild [Titel des Videos]".
- Im digitalen Raum gibt es viele Videos und animierte Bildmaterialien, die automatisch abgespielt werden, z.B. animated GIF. Solche selbstabspielenden, daueranimierten Inhalte können zu Problemen führen.
- Automatisch abspielender Audioinhalt birgt insbesondere für Screenreadernutzende grosse Herausforderungen: Solche Vorlesesoftware setzt zwingend auf den auditiven Kanal. Spricht auf einer neu geladenen Webseite nicht nur der Screenreader, sondern zeitgleich auch ein automatisch abspielender Audioinhalt (Musik, Stimme, Audiopodcast, etc.), wird die Nutzung unverhältnismässig erschwert.
- Empfehlung: Generell auf automatisch abspielenden Audioinhalt verzichten!
- Werden Audioinhalte entgegen der Empfehlung automatisch abgespielt, muss das Abspielen entweder nach 3 Sekunden automatisch stoppen oder es muss manuell gestoppt werden können, z.B. mithilfe eines Stopp-Buttons.
- Empfehlung: Generell auf automatisch abspielenden Audioinhalt verzichten!
- Daueranimierte Elemente: Daueranimierte Objekte (z.B. Überblendungen, Kampagenensprüche, Werbebanner, Newsticker, animated GIF, selbstaktualisierende Elemente, etc.) erfordern zusätzliche Aufmerksamkeit und lenken vom eigentlichen Fokus ab. Menschen mit kognitiven Herausforderungen wie ADHS, ASS, usw. werden unter Umständen so stark abgelenkt, dass sie sich nicht auf die anderen Inhalte konzentrieren können.
- Empfehlung: Generell auf daueranimierte Inhalte verzichten!
- Dauerhaft animierte Elemente müssen pausiert, gestoppt oder ausgeblendet werden können (durch die User) oder die Animation muss nach max. 5 Sekunden automatisch aufhören.
- Ausnahmen: Die Bewegung ist eine Animation, die läuft, um anzuzeigen, dass etwas geladen wird (ein «Spinner»).
- Empfehlung: Generell auf daueranimierte Inhalte verzichten!
Für die Webseiten der ETH stehen in AEM geschützte Seite drei Optionen zur Einbettung von Videos zur Verfügung: Für YouTube und Vimeo müssen Untertitel gemäss der Vorgaben dort erstellt bzw. aktiviert werden (externe Seite YouTube, externe Seite Vimeo), für den Standardplayer ("Matterhorn") werden diese automatisch erstellt und können manuell korrigiert werden. Dieser Standardplayer "Video.js" erfüllt die nachstehenden Anforderungen, die auch bei der Nutzung eines Videoplayers mit Untertiteln ausserhalb des Webauftritts der ETH gelten:
- Tastaturbedienbarkeit: Kann man die Videokomponente mit der Tastatur (ohne Maus) bedienen?
- Fokussichtbarkeit: Sieht man beim Bedienen der Komponente immer, wo man sich aktuell befindet, z.B. Play-Button, Lautstärke, Abspielgeschwindigkeit, etc.?
- Fokusreihenfolge: Folgt der Tastaturfokus einer sinnvollen Reihenfolge, z.B. erst durch die oberen Bedienelemente des Players von links nach rechts, danach den unteren Bedienelementen?
- Korrekte Labels bei Schaltern: Stimmt die Semantik der Schalter, so dass auch ein Screenreader korrekt vermittelt, auf welcher Funktion man sich befindet?
- Kontrast: Weist der Play-Button, der typischerweise über das Start- oder Vorschaubild gelegt wird, genügend Kontrast auf im Vergleich zum Hintergrund (Bild)?
Auch der Player des Videoportals der ETH unterstützt Untertitel, die ebenfalls automatisch erstellt werden.
Im Live Streaming sind automatisch erstellte Untertitel aufgrund der Qualität der zur Verfügung stehenden Dienstlesitung nicht hilfreich. Die Barrierefreiheit wird in diesen Fällen besser über die Aufzeichnung mit nachträglicher, idealerweise manueller Untertitelung gewährleistet.
Zoom bietet live und automatisch erstellte Untertitel besserer Qualität, die auf Anfrage bei in dedizierten Meetings aktiviert werden können. Auch hier ist eine Aufzeichnung mit manueller Untertitelung sinnvoll.
Fragen zur automatischen Untertitelung von Videos und deren Korrektur sowie zur Untertitelung von Live Streaming und Zoom beantworten die Gruppe .