Norm-Hub

WCAG 2.1 AA: Web-Barrierefreiheit für Video

WCAG 2.1 AA ist die technische Bezugsbasis für die EN 301 549, das Barrierefreiheitsstärkungsgesetz und damit für jeden, der Videos in einer Web-Umgebung ausspielt.

Veröffentlicht 7 Min Lesezeit Florian Kadelbach

Norm
Web Content Accessibility Guidelines 2.1, Conformance Level AA (W3C Recommendation, 2018)
Kürzel
WCAG 2.1 AA
Stand
Leuchtendes Play-Symbol mit verzweigten Verbindungslinien, Sinnbild für barrierefreie, interaktive Videostruktur

Der internationale Standard für barrierefreie Web-Inhalte

Die Web Content Accessibility Guidelines (WCAG) sind der weltweit etablierte Referenzrahmen für barrierefreie Web-Inhalte. Veröffentlicht und gepflegt werden sie vom World Wide Web Consortium (W3C) im Rahmen der Web Accessibility Initiative (WAI). Für die europäische und deutsche Praxis ist Version 2.1 in der Konformitätsstufe AA die maßgebliche Größe. Sie ist die technische Bezugsbasis für die EN 301 549, das Barrierefreiheitsstärkungsgesetz (BFSG) und damit für jeden, der Videos in einer Web-Umgebung ausspielt.

Drei Konformitätsstufen, eine Pflichtgrenze

Die WCAG kennt drei Konformitätsstufen: A, AA und AAA. Stufe A enthält die Mindestanforderungen, ohne die Inhalte für viele Nutzer schlicht nicht zugänglich sind. AA ist die international etablierte Pflichtgrenze für öffentliche und kommerzielle Web-Auftritte. AAA enthält erweiterte Anforderungen, deren vollständige Erfüllung in der Praxis nur in Spezialfällen realistisch ist.

Das deutsche BFSG verweist über die EN 301 549 auf WCAG 2.1 AA als verbindlichen Maßstab. Beim Anwendungsbereich lohnt sich ein zweiter Blick: Das BFSG verpflichtet nicht alle Anbieter, sondern Produkte und Dienstleistungen, die in §§ 1 und 2 BFSG genannt sind. Schwerpunkt sind Verbraucher-Angebote:

  • Selbstbedienungsterminals
  • E-Books und E-Reader
  • Bankdienstleistungen für Verbraucher
  • Telekommunikationsdienste
  • Personenverkehrsdienste (Web, App, Ticketing)
  • Elemente des elektronischen Geschäftsverkehrs für Verbraucher

Reine B2B-Maschinenhersteller fallen in der Regel nicht direkt unter das BFSG. Wer aber eine Verbraucher-Website mit Service-Videos betreibt, ein Endkunden-Portal oder ein Selbstbedienungsangebot, ist in der Pflicht. Und auch ohne BFSG-Bezug kommt WCAG 2.1 AA über andere Wege ins Spiel: Die MVO 2023/1230 fordert für die Form der Anleitung Zugänglichkeit (Anhang III), öffentliche Ausschreibungen referenzieren regelmäßig die EN 301 549.

Service-Videos für autorisierte Partner und interne Schulungsmedien fallen in den meisten Konstellationen nicht in den Anwendungsbereich des BFSG, weil das Gesetz Verbraucher-Angebote adressiert. WCAG 2.1 AA bleibt für diese Videos trotzdem ein sinnvoller Qualitätsstandard. Konzern-Compliance-Vorgaben, Ausschreibungs-Anforderungen und schlicht die Tatsache, dass auch Service-Personal Untertitel, Tastaturbedienung und ausreichende Kontraste nutzt, machen das zur tragfähigen Linie.

Ein Ausblick zur Norm-Entwicklung: WCAG 2.2 ist seit dem 5. Oktober 2023 W3C Recommendation und enthält neun zusätzliche Erfolgskriterien, vor allem zu Drag-Bedienung, Fokus-Sichtbarkeit und Authentifizierung. Die EN 301 549 referenziert aktuell noch WCAG 2.1; ein Update auf 2.2 wird im nächsten Update-Zyklus erwartet. Wer Player heute neu konzipiert, sollte WCAG 2.2 vorausschauend mitprüfen.

Was die WCAG speziell für Video verlangt

Für Videoinhalte sind in WCAG 2.1 AA mehrere Erfolgskriterien zentral. Sie betreffen sowohl die mediale Ebene als auch die Bedienung des Players.

Untertitel (1.2.2 und 1.2.4). Aufzeichnungen brauchen synchrone Untertitel. Live-Übertragungen ebenso, allerdings erst auf AA-Niveau. WCAG verlangt synchrone Untertitel, schreibt aber nicht vor, dass sie zuschaltbar sind: Auch fest eingebrannte (offene) Untertitel erfüllen 1.2.2 und 1.2.4. Die Trennung als eigene, zuschaltbare Spur fordert erst die ISO 26516, und sie ist aus Lokalisierungs- und Kontrastgründen ohnehin die bessere Wahl (siehe FAQ).

Audiodeskription (1.2.5). Für vorab produzierte Videos mit handlungsrelevanten visuellen Inhalten muss eine Audiodeskription verfügbar sein. Das ist eine zusätzliche Tonspur, die beschreibt, was zu sehen ist.

Tastaturbedienung (2.1.1). Sämtliche Bedienelemente des Players müssen per Tastatur erreichbar sein. Maus oder Touch dürfen keine Voraussetzung sein.

Pause, Stop, Hide (2.2.2). Automatisch startende oder bewegte Inhalte müssen sich pausieren, stoppen oder ausblenden lassen.

Audio-Kontrolle (1.4.2). Wenn Audio länger als drei Sekunden automatisch abspielt, braucht der Nutzer eine sofort erreichbare Stop-Möglichkeit. Damit fallen Autoplay-Videos mit Sound effektiv aus.

Kontrast (1.4.3). Bedienelemente, Untertitel und alle textuellen Overlays müssen ein Kontrastverhältnis von mindestens 4,5:1 erreichen.

Ein häufig übersehener Punkt: Wer sprachneutrale Videos einsetzt, um Lokalisierungskosten zu reduzieren, kollidiert mit Erfolgskriterium 1.2.5 spätestens auf AA-Niveau. Videos mit handlungsrelevanten visuellen Inhalten brauchen eine Audiodeskription oder eine textbasierte Medien-Alternative. Sprachneutralität bedeutet also nicht „keine Sprache”. Sie verschiebt die Sprachebene auf eine zuschaltbare Spur oder eine parallele Textdarstellung. Als reines Spar-Argument trägt sie unter WCAG nicht durch.

Geltungsbereich

Die WCAG gilt für Web-Inhalte. Konkret heißt das: alles, was im Browser, in einer Webview einer App oder in einem hybriden Player ausgespielt wird. Damit fällt jedes auf einer Webseite oder in einer Web-Applikation eingebettete Video unter den Anwendungsbereich.

Reine Offline-Anwendungen, die ausschließlich auf nativen Plattformen laufen, fallen technisch nicht unter die WCAG selbst, werden aber über die EN 301 549 ebenfalls auf vergleichbare Anforderungen verpflichtet. In der Praxis ist die Trennung kaum noch relevant. Nahezu jede moderne Anleitungsanwendung nutzt Web-Technologien.

Adressaten

Die WCAG richtet sich an alle Rollen, die an der Entstehung von Web-Inhalten beteiligt sind. Im Videokontext sind das vor allem:

  • Web-Entwickler, die den Player implementieren
  • UI- und UX-Designer, die Bedienelemente und Layouts gestalten
  • Technische Redakteure, die Inhalte konzipieren und Untertitel sowie Audiodeskription planen
  • Content-Verantwortliche, die Freigaben erteilen

In jeder dieser Rollen entstehen WCAG-relevante Entscheidungen. Eine späte Korrektur in der Produktion ist deutlich teurer als eine sauber geplante Pre-Production.

Einordnung: WCAG, EN 301 549, BFSG und ISO 26516

Die WCAG steht im Zentrum eines Normen-Geflechts, das sich über die letzten Jahre eingespielt hat:

Die EN 301 549 ist die europäische Norm für barrierefreie IKT-Produkte. Sie referenziert WCAG 2.1 AA für Web-Inhalte und ergänzt Anforderungen für Hardware, Software und Telekommunikation. Das Barrierefreiheitsstärkungsgesetz ist seit dem 28. Juni 2025 verbindlich. Es verweist auf die EN 301 549 und damit indirekt auf WCAG 2.1 AA. Die ISO/IEC/IEEE 26516 behandelt die Entwicklung und Produktion von Instruktionsvideos. Sie verankert Barrierefreiheit als Architektur-Bestandteil und greift dabei inhaltlich auf die WCAG-Anforderungen zurück.

Vereinfacht gesagt: Die WCAG ist die technische Grundlage. Die ISO 26516 ist der inhaltliche Rahmen. Das BFSG ist die rechtliche Klammer, wo es greift. Wer alle drei berücksichtigt, hat einen Videoinhalt, der technisch zugänglich, fachlich sauber und im jeweils anwendbaren Rechtsrahmen vertretbar aufgestellt ist.

Konsequenzen bei Verstoß

Wo das BFSG greift, sind die Konsequenzen klar geregelt. Die Marktüberwachungsbehörden können Nachbesserung oder Marktrücknahme anordnen. § 37 BFSG sieht zwei Bußgeld-Stufen vor: bis zu 10.000 Euro für leichtere Verstöße, bis zu 100.000 Euro für schwerere Fälle (etwa Inverkehrbringen ohne Konformitätserklärung oder ohne die geforderten Pflichtinformationen). Maßnahmen werden öffentlich nachvollziehbar dokumentiert. Für Videoanleitungen wird das relevant, sobald sie in Verbraucher-Angeboten oder unter das BFSG fallenden Dienstleistungen ausgespielt werden.

Außerhalb des BFSG-Anwendungsbereichs sind die unmittelbaren Sanktionen geringer, die mittelbaren Risiken aber nicht weg: Ausschreibungen mit EN-301-549-Bezug fallen weg, Compliance-Audits melden Befunde, Großkunden setzen Barrierefreiheit als Lieferantenanforderung.

Was die WCAG nicht regelt

Die WCAG macht keine Aussagen zu didaktischer Qualität, Storytelling, Sprecherwahl oder Produktionsstandards. Sie regelt nicht, ob ein Video sinnvoll ist, sondern ob es zugänglich ist. Auch zur Auswahl konkreter Tools, zur Untertitel-Datei-Formatierung oder zu Workflow-Themen schweigt die Norm. Diese Themen sind Aufgabe ergänzender Standards und unternehmensspezifischer Vorgaben.

Praxis: Welche Erfolgskriterien für Videoanleitungen besonders wichtig sind

Bei der Produktion von Videoanleitungen sind aus unserer Erfahrung vier Punkte besonders folgenschwer, wenn sie übersehen werden:

  1. Untertitel als Pflichtspur, nicht als Add-on. Untertitel werden im Vorlauf der Produktion geplant, nicht nachträglich aufgesetzt. Das spart Zeit, Geld und Lokalisierungsaufwand und ist die Grundvoraussetzung für jede mehrsprachige Auslieferung.
  2. Audiodeskription oder Medien-Alternative. Bei Videos ohne Voiceover braucht es eine textbasierte Alternative oder eine separate Audiodeskription. Das ist ein häufiger Fallstrick bei textfreien Videos, die sonst keinerlei sprachliche Ebene haben.
  3. Player-Bedienung per Tastatur. Viele eingebettete Player erfüllen das nicht ohne Anpassung. Wer einen Drittanbieter-Player nutzt, sollte die WCAG-Konformität ausdrücklich abfragen und dokumentieren lassen.
  4. Kontrast und Skalierbarkeit der Untertitel. Helle Untertitel auf hellem Hintergrund sind ein klassischer Fehler. Eine schwarze Hinterlegung oder ein dezenter Schatten reicht meist aus, um den 4,5:1-Wert sicher zu erreichen.

Wer diese vier Punkte konsequent umsetzt, deckt den Großteil der praxisrelevanten WCAG-Anforderungen ab. Die übrigen Kriterien lassen sich in der Regel mit überschaubarem Aufwand nachziehen.

Wie sich diese WCAG-Erfolgskriterien im Player konkret abbilden lassen (Tastatursteuerung, ARIA-Rollen, schaltbare Untertitel, Multi-Audio-Tracks) und welche Punkte yntro bewusst nicht als „BFSG-konform” zusichert, beschreibt die Integration & Auslieferung mit belegbarem Konstruktionsstand statt pauschaler Werbeaussage.

Wo die WCAG zu finden ist

Anders als ISO- oder DIN-Normen ist die WCAG kostenfrei verfügbar. Drei offizielle Quellen sind im Alltag besonders nützlich:

Fragen aus der Praxis

Reichen automatisch generierte Untertitel von YouTube oder Whisper für WCAG 2.1 AA?

Als Ausgangspunkt ja, als fertiges Ergebnis nein. Automatisch generierte Untertitel sind in den letzten Jahren deutlich besser geworden. Sie scheitern aber zuverlässig an Fachvokabular, Produktnamen, Zahlen und Maßeinheiten. Also genau an den Inhalten, auf die es in einer Anleitung ankommt.

Für WCAG 2.1 AA reicht eine reine Auto-Generierung nicht. Die Untertitel müssen inhaltlich korrekt, vollständig und synchron sein. Praktisch heißt das: automatisch generierte Untertitel als Erstentwurf nutzen, dann manuell prüfen und nachbearbeiten. Wer das ohne Nachbearbeitung live schaltet, hat Untertitel, die formal vorhanden, aber inhaltlich unbrauchbar sind.

Reichen fest eingebrannte Untertitel im Bild, oder müssen sie zuschaltbar sein?

Aus reiner WCAG-2.1-AA-Sicht erfüllen beide Varianten das zentrale Untertitel-Kriterium 1.2.2. WCAG verbietet eingebrannte Untertitel nicht direkt. Andere AA-Kriterien werden in der Praxis aber problematisch: 1.4.10 (Reflow, also das saubere Umfließen des Inhalts bei kleiner Bildschirmgröße), 1.4.3 (Kontrast), wenn der Bildhintergrund stellenweise nicht trägt. Was eingebrannte Untertitel nicht abdecken, lässt sich nachträglich nur durch erneutes Exportieren des Videos korrigieren.

Die ISO/IEC/IEEE 26516 zieht die Linie klarer in Richtung Trennung: Untertitel werden als eigene Inhaltsschicht behandelt, nicht als fest verankerter Teil des Bildes. Dazu kommen wirtschaftliche Argumente: Lokalisierung ohne neue Export-Runde, Korrekturen ohne erneutes Rendern, Nutzer-Kontrolle über die Sichtbarkeit. Die saubere Antwort über beide Norm-Welten hinweg: Untertitel als zuschaltbare Datei neben dem Video, in einem etablierten Format wie WebVTT oder SRT.

Müssen bei einem mehrsprachigen Video Tonspur und Texte in allen Zielsprachen vorliegen?

Ja. Eine gesprochene Anweisung funktioniert nur in der Sprache des Hörers, ein eingeblendeter Text nur in der Sprache des Lesers. Wer ein Video in fünf Märkten ausspielt, braucht den Sprechertext in fünf Tonspuren und die eingeblendeten oder zuschaltbaren Texte in fünf Sprachfassungen.

Eine separate Audiodeskriptions-Spur, die blinden Nutzern zusätzlich beschreibt, was im Bild passiert, ist davon zu unterscheiden. Bei klassischen Videoanleitungen für sehende Zielgruppen ist sie in der Regel nicht Bestandteil der Produktion. Für blinde Zielgruppen eignen sich andere Anleitungsformen besser. Der Lokalisierungspflicht der sprachlichen Inhalte tut das aber keinen Abbruch.

Wir haben Videoanleitungen aus den letzten Jahren ohne Untertitel und ohne Barrierefreiheits-Prüfung. Wie gehen wir damit um?

Im Grundsatz: Ältere Videos, die nach dem 28. Juni 2025 weiter online sind und in den Anwendungsbereich des BFSG fallen, müssen die Anforderungen erfüllen. Einen pauschalen Bestandsschutz für „alte Videos auf der Website" gibt es nicht. Das BFSG kennt enge Übergangsregelungen in § 38, die an konkrete Vertragsverhältnisse geknüpft sind. Für die meisten Hersteller greifen sie nicht.

Praktisch lohnt sich ein priorisierter Audit der vorhandenen Videos. In den meisten Fällen reichen drei Hebel: Untertitel ergänzen, Player austauschen, Kontraste korrigieren. Eine komplette Neuproduktion ist selten nötig. Für die juristische Einordnung im Einzelfall (Vertragsklauseln, Anwendungsbereich, Übergangsregelungen) ist eine TK-spezialisierte Kanzlei die richtige Adresse.

Was bedeutet WCAG 2.2 für eine Videoanleitung, die heute produziert wird und drei bis fünf Jahre live bleiben soll?

WCAG 2.2 ist seit Oktober 2023 als Empfehlung des W3C veröffentlicht und enthält neun zusätzliche Erfolgskriterien, vor allem zur Drag-Bedienung, zur Sichtbarkeit des Tastaturfokus und zu vereinfachter Authentifizierung. Die EN 301 549 und damit das BFSG-Verweisungsziel referenziert aktuell noch WCAG 2.1. Eine Aktualisierung auf 2.2 ist im nächsten Update-Zyklus zu erwarten.

Für ein Video, das fünf Jahre live bleiben soll, lohnt es sich, die 2.2-Kriterien jetzt schon mitzuprüfen. Für den Videoplayer besonders relevant ist 2.4.11 „Focus Not Obscured": der sichtbare Tastaturfokus darf nicht von eingeblendeten Overlays oder Steuerleisten verdeckt werden. Das ist im Player-Standardverhalten oft nicht automatisch gegeben. Wer Drittanbieter neu evaluiert, sollte 2.2-Konformität explizit abfragen.

Hinweis zur juristischen Einordnung

Dieser Hub fasst öffentlich verfügbare Quellen zu WCAG 2.1 AA und ihrer Wirkung über EN 301 549 und BFSG zusammen, soweit sie für die Produktion von Videoanleitungen relevant sind. yntro ist Dienstleister für Technische Kommunikation, kein Rechtsdienstleister. Die Inhalte sind nach bestem Wissen recherchiert und überprüft, ersetzen aber keine Einzelfall-Beratung. Wer verbindliche Auskünfte zu Konformität, Haftung oder Sanktionen im Einzelfall braucht, sollte das mit einer auf Technische Dokumentation spezialisierten Kanzlei klären.