Gestaltung

Text in Videos darstellen

Text und Videobild gehören zusammen, aber wie genau? Dieser Fachbeitrag von Roland Schmeling und Florian Kadelbach, ursprünglich 2020 in der tekom-Fachzeitschrift „technische kommunikation" erschienen, zeigt in vier Schritten, wie Texteinblendungen in Instruktionsvideos verständlich, lesbar und wirksam werden.

Videostandbild einer Montage am grauen Gehäuse mit eingeblendeten Texthinweisen „Schraube M4", „Achtung: Drehmoment" und „Tiefe: 5 mm"

Erstveröffentlichung: tekom-Fachzeitschrift „technische kommunikation”, Heft 05/2020. Co-Autoren: Roland Schmeling (Schmeling + Consultants GmbH, Heidelberg) und Florian Kadelbach (yntro GmbH). Fortsetzung des Beitrags „Warum Text in Videos?” aus Heft 04/2020. Für die Web-Aufbereitung 2026 wurden Tippfehler korrigiert und ein abgesetzter Hinweis am Ende ergänzt den normativen Rahmen, der seit 2020 hinzugekommen ist.

Damit Instruktionsvideos die Qualitätsanforderungen der Technischen Kommunikation erfüllen, ist es notwendig, visuelle Informationen mit Sprache anzureichern. Auf die Notwendigkeit von Text in einem Video sind wir bereits in Ausgabe 04 eingegangen („Warum Text in Videos?”). Aber wie sieht nun die gestalterische Umsetzung aus? Dieser Beitrag gibt die Antwort darauf. Dazu lassen wir Erkenntnisse einfließen aus unseren Usability-Untersuchungen von 2019.

Der Texteinsatz in Videos muss von Anfang an gut durchdacht und geplant sein. Denn nur wenn es gelingt, dass die Information beim Nutzer ankommt und verstanden wird, können auch die ökonomischen Ziele einer Videoanleitung erreicht werden. Dafür müssen wir die Vorteile von Video, Text und Bild und ihre Kombination untereinander optimal nutzen.

Zudem müssen Technische Redakteure einen wirtschaftlichen und effizienten Prozess implementieren, damit Videos keine Insellösung bleiben. Vielmehr müssen sie ihren Platz in der Informationslandschaft bekommen, den die Kunden erwarten.

Zeitspezifische Aspekte

Im Gegensatz zu statischen Text-Bild-Anleitungen müssen wir bei einem Video zusätzlich die Zeitkomponente berücksichtigen. Ein Text im Video kann sequenziell oder parallel zur Videosequenz angezeigt oder auch von einer Anwenderaktion abhängig sein:

  • Bei der sequenziellen Darstellung folgen Text und Videosequenz aufeinander; in der Regel wird ein Text vor der Videosequenz angezeigt, auf die er sich bezieht. Der Text bekommt auf diese Weise die volle Aufmerksamkeit.
  • Die parallele Darstellung ist aus didaktischer Sicht deutlich anspruchsvoller umzusetzen; die Aufmerksamkeit des Anwenders muss gesteuert werden, damit er keine Information übersieht.
  • Bei interaktiven Videoanleitungen kann der Anwender den zeitlichen Verlauf beeinflussen. Das Video hält an, ein Text wird angezeigt und eine Schaltfläche erscheint. Das Video läuft abhängig von der Anwenderaktion weiter. Dies bietet sich etwa bei längeren oder sehr wichtigen Informationen an, die ein Anwender bestätigen soll.

Doch welcher Typ der Text-Video-Kombination ist der richtige? Die umfangreichen Erfahrungen bei der Standardisierung statischer Text-Bild-Anleitungen geben uns eine klare Antwort: Darstellung und Sequenzierung der Informationen hängen von ihrem Inhalt und ihrer kommunikativen Funktion ab.

Relevantes identifizieren

Eine eingehende Analyse des zu beschreibenden Produkts, der Zielgruppen, Anwendungssituationen, Risiken und des jeweiligen Informationsbedarfs gehört zum ersten Schritt. Dass sich zudem die Rahmenbedingungen und Ziele einer Organisation auf die Wahl der passenden Darstellungsformen für Instruktionsvideos auswirken, ist ebenso unbestritten. So wird man bei Software meist keinen Realfilm, sondern einen Screencast wählen, bei einem noch nicht vorhandenen physischen Produkt eher eine Computeranimation.

Trotz der Bedeutung dieses Schritts für die Informationsentwicklung erhalten wir aus diesen Analysen wenig Anhaltspunkte für die Entscheidung, ob und wie wir Text mit Video kombinieren müssen. Die systematischen Antworten für die Gestaltung der Informationen liegen in der Kenntnis der kommunikativen Funktion der Inhalte. Darum konzentrieren wir uns hier auf die funktionale Seite der Information.

Funktionen identifizieren

Bevor wir über geeignete Darstellungsformen und Gestaltungen der Text-Video-Kombinationen nachdenken, müssen wir die kommunikativen Funktionen der Information ermitteln und geeignete Darstellungen festlegen. Mehr über die kommunikativen Funktionen und die Herausforderungen, die sich daraus ergeben, steht in „Warum Text in Videos?”.

In der Praxis bedeutet dies für die Konzeption von Instruktionsvideos, dass wir uns bei deren Entwicklung mit Hilfe der kommunikativen Funktionen Folgendes überlegen müssen:

  • Darstellungsformen festlegen
  • Video und Text koordinieren
  • Lesbarkeit erhöhen
  • Aufmerksamkeit gewinnen

1. Darstellungsformen festlegen

Eine Information, gleich welcher Darstellungsform, ist nur verständlich, wenn ihre kommunikative Funktion eindeutig ist: zu einer Handlung auffordern, vor einer Gefahr warnen, eine Handlung begründen, eine Ersatzteilbestellung ermöglichen, ein Handlungsziel klären, ein Spezialwerkzeug identifizieren oder ein Drehmoment nennen.

Diese funktionale Differenzierung ist ein wichtiges Kriterium für die zu wählende Darstellungsform im Video. Denn nur, wenn die Funktion der Videosequenzen und der Texte dem Betrachter klar ist, ergibt sich ein positives Zusammenspiel zwischen Video und Text, und der Nutzer kann die Informationen richtig umsetzen.

Damit die Funktion einer Videosequenz oder eines Textes verstanden wird, müssen Darstellungsform, Koordination und Gestaltung der Information die Funktion unterstützen:

Beispiel 1, Warnhinweis: Eine Warnung erfordert inhaltlich Art, Quelle, Folgen und Maßnahmen sowie gestalterisch eine Hervorhebung. Die kommunikative Funktion „Warnung” legt Text nahe.

Beispiel 1: Videosequenz eines Warnhinweises

1. Darstellungsform festlegen

Ein Servicetechniker greift in Richtung einer Autobatterie, um diese auszubauen. In den Handlungsschritten zuvor hat man bereits gesehen, dass alle Sicherheitsvorkehrungen getroffen wurden. Trotzdem ist es sinnvoll, dem Betrachter weitere Informationen zu geben, um einen sicheren Ausbau zu gewährleisten. Das heißt, wir möchten den Techniker vor Gefahren warnen und ihm Möglichkeiten der Gefahrenabwendung mitteilen. Im Beitrag „Warum Text in Videos?” sind wir bereits darauf eingegangen, dass bei Warnhinweisen die Grenzen der Darstellungsform Video schnell erreichbar sind. Bewährt haben sich Warnungen in Textform.

2. Video und Text koordinieren

Damit die Warnung in Verbindung mit der Autobatterie steht, muss sie zur richtigen Zeit eingeblendet werden. Die Warnung steht daher auf keinen Fall am Anfang des Videos, auch nicht vor oder nach der entsprechenden Videosequenz. Mit Hilfe des Videoformats können wir die Warnung zeitlich genau abstimmen: Kurz bevor die gefährliche Handlung ausgeführt wird, wird die Warnung angezeigt. Sie ist dadurch in die relevante Videosequenz integriert, hat einen klaren Bezug zur visuellen Handlung und ist trotzdem zeitlich vor der ausgeführten Handlung positioniert. Bei der Videoproduktion gilt es jedoch den Einsatz von Warnhinweisen abzuwägen, damit keine Flut entsteht. Allzu unbedeutende Warnhinweise können den Betrachter nerven und verlieren damit an Wirkung.

3. Lesbarkeit erhöhen

Ein Warnhinweis darf nicht übersehen werden. Außerdem erfordert er häufig Erklärungen zum Risiko (Art und Quelle der Gefahr und mögliche Folgen bei Nichtbeachtung). Der Betrachter braucht Zeit, einen Warnhinweis vollständig aufzunehmen und zu verarbeiten. Hierfür ist die zeitunabhängige Darstellung mit einer interaktiven Bestätigung geeignet. Die Darstellung gewährleistet, dass die Warnung direkt vor der Handlung angezeigt, gelesen und verstanden wird.

4. Aufmerksamkeit gewinnen

Die Warnung überblendet zeitunabhängig das gestoppte Video mittig. Erst durch einen Klick auf eine Schaltfläche wird das Video an gleicher Stelle fortgeführt. Dadurch, dass das Video angehalten wurde, hat der Warnhinweis eine sehr starke Aufmerksamkeit bekommen. In unseren Usability-Tests stieß diese Darstellung auf eine hohe Akzeptanz. Die Probanden fühlten sich verpflichtet, die Handlungsempfehlungen umzusetzen, und waren dankbar für die wichtigen Hinweise vor der eigenen Handlung. Wichtig ist, dass die Warnung von den Nutzern als ein Teil der Videoanleitung und nicht etwa als Fehlermeldung des Systems interpretiert wird. Das heißt, dass sich Warnhinweise trotz spezifischer Elemente wie ein Signalwort-Panel, Farben und Typografie dem Design des Videos anpassen müssen.

Beispiel 2: Handlungsaufforderung

Eine Handlungsaufforderung erfordert die Darstellung aller Informationen, die zur Umsetzung erforderlich sind, einschließlich benötigter technischer Daten. Die Handlung lässt sich im Video darstellen. Bei den technischen Daten lohnt es sich abzuwägen.

Beispiel 3: Zielangabe

Eine Zielangabe erfordert, dass sie zu Beginn einer Handlung geklärt ist, und legt die textliche Darstellung nahe.

Die Kategorisierung der Informationen nach ihrer Funktion ist eine Chance für die effiziente Entwicklung von Instruktionsvideos: Die Differenzierung erleichtert die Standardisierung der Videos, weil der Technische Redakteur klare Strategien entwickeln kann, wie er bestimmte Informationen im Video darstellt und wie Texte und Video zusammenspielen.

2. Video und Text koordinieren

Texteinblendungen in Videos stehen selten für sich allein. Normalerweise haben sie einen Bezug auf den Videoinhalt und müssen koordiniert werden. Die Zusammengehörigkeit der Informationen muss dem Betrachter vermittelt werden.

In Bild-Text-Anleitungen verdeutlichen etwa Nummerierungen oder Verbindungslinien den Zusammenhang. Bei der Koordination von Text und Video hingegen sind die räumliche und zeitliche Nähe entscheidend.

Wenn die Position der Texteinblendung zu weit weg vom referenzierten Objekt gewählt wird, kann das dazu führen, dass Nutzer die Verbindung zwischen den beiden Informationen nicht erkennen.

Ist die Texteinblendung zu einem falschen Zeitpunkt, dann kann es passieren, dass der Text mit den falschen Gegenständen in Zusammenhang gebracht wird. Wird beispielsweise ein Text sequenziell vor der Videosequenz angezeigt, kann er zu diesem Zeitpunkt mit keinem Videoinhalt verknüpft werden, weil die Sequenz für den Nutzer noch nicht sichtbar ist. Daher interpretieren Nutzer sequenzielle Einblendungen eher als Videotitel oder Kapitel des nächsten Abschnitts.

Die räumliche und zeitliche Nähe spielen eine wichtige Rolle, wie Text und Video verbunden werden. Zudem liefert die Post-Produktion Möglichkeiten, den Zusammenhang zu verstärken, zum Beispiel mit Verbindungslinien, Markierungen und Callouts. Aber auch klassische Stilmittel, etwa die Helligkeitsverteilung, Abschattung und Weichzeichnung, können Text mit Video verknüpfen. Sich erst in der Post-Produktion zu überlegen, wie man Text und Bild verbinden kann, ist zu spät. Nur wenn die Technische Redaktion vorab weiß, welche Texteinblendungen im Video erforderlich sind, kann sie dies bei der Aufnahme berücksichtigen. Hier ergeben sich durch Einstellungsgröße, Tiefenunschärfe, Fokusverlagerungen und Zooms zusätzliche Möglichkeiten, mit geringer Nachbearbeitung Texteinblendungen im Video zu unterstützen.

Die Herausforderung besteht darin, einen Standard für die Videoproduktion zu entwickeln und in einem Leitfaden festzuhalten. Alle Beteiligten können damit an einem Strang ziehen: Technischer Redakteur, Kameramann, Produzent und Cutter. Im Vergleich zu statischen Text-Bild-Anleitungen sind die Erfahrungen mit einem Standard allerdings noch dünn, was auch an den multimedialen Redaktionsprozessen liegt, die vielfach ungeklärt sind.

3. Lesbarkeit erhöhen

Jetzt gilt es, Entscheidungen für die Lesbarkeit des Textes zu treffen. Die typografischen und gestalterischen Anforderungen, zum Beispiel angepasste Laufweite, optimale Schriftgröße und hoher Kontrast, müssen für Videoanleitungen nicht neu erfunden werden. Dennoch kommen neue Faktoren hinzu: die Zeit und das Videoformat.

Wenn Text direkt im Video eingebettet wird, führt eine geringe Videoqualität zu einer unscharfen, verpixelten Schrift. Eine geringe Qualität ist aber nötig, damit die Größe des Videos schlank bleibt, etwa für den mobilen Einsatz. Oder an Orten, die eine schwache Internetverbindung haben. Deswegen müssen größere Texte in ein Video eingebaut werden.

Zu bedenken ist auch die Wahl des Videoplayers. Viele Player haben ein User Interface, das sich über den Videobereich legt. Daher ist eine ausreichende Platzreserve zu den Rändern zu berücksichtigen. So wird der Text nicht vom User Interface überlagert und gestört. Besonders der untere Bildbereich benötigt Platz, da dort meist Untertitel eingeblendet werden. Das kann auch nachträglich passieren.

Für einen Text eine universelle Anzeigedauer zu finden, die alle Bedürfnisse erfüllt, ist unmöglich. Wie lange etwa benötigt ein Nutzer, um einen Text zu lesen? Der eine wird schnell ungeduldig, während der andere sich eine Sequenz mehrmals ansieht oder pausiert.

Häufig sind die Texte kurz geschrieben, was das Festlegen einer geeigneten Anzeigedauer erleichtert. Bei längeren Texten ist es unvermeidlich, alternative Lösungen zu suchen, etwa eine zeitunabhängige Darstellung des Textes im Video: Das Video stoppt automatisch und wird erst durch eine Interaktion des Nutzers fortgesetzt. In diesem Fall kann der Text nicht übersehen werden, und der Nutzer hat keinen Zeitdruck, den Text innerhalb einer bestimmten Spanne lesen zu müssen. Für diese Funktion wird das Video mit Webtechnologie erweitert, was den technischen Spielraum einschränkt.

Es gibt mehrere Stellschrauben, um die Lesbarkeit in Videos zu erhöhen. Dabei muss der Text nicht im Video integriert sein. Auch das User-Interface des Videoplayers oder interaktive Elemente bieten sich an, um Texte auszulagern und die Lesbarkeit zu verbessern.

Die Herausforderung besteht darin, einen guten Kompromiss für Anzeigedauer und Textlänge zu finden. In Videos, die wir für unsere Usability-Tests vorbereitet haben, wurden alle Texte, die aus Handbüchern stammten, für die Videoproduktion angepasst oder auch neu geschrieben. Die Texte aus den statischen Text-Bild-Anleitungen waren für die Verwendung in Videos unnötig lang und daher nicht geeignet. Wie eine sinnvolle Wiederverwendung klassischer Anleitungstexte in Videos aussehen kann, ist bislang nicht geklärt.

4. Aufmerksamkeit gewinnen

Wo schaut der Nutzer gerade hin? Ganz genau lässt sich das nicht steuern. Denn die Aufmerksamkeit des Betrachters hängt von zahlreichen externen Faktoren ab. In Grenzen kann sie aber durch die Gestaltung des Instruktionsvideos beeinflusst werden.

Informationsdichte des Videos

Videobild und eingeblendete Texte nutzen beide den visuellen Kanal des Betrachters; dessen Aufmerksamkeit kann aber nur auf einem Inhalt liegen: Video oder Text. Ein Videobild darf jedoch nicht vom eingeblendeten Text ablenken. Ansonsten ist nicht sicher, dass der Text wahrgenommen wird. Um den Blick des Nutzers zum parallelen Text zu lenken, darf das Video keine wichtigen Informationen übermitteln. Entscheidend ist das Timing, das im Drehbuch vorab festgelegt werden muss.

Blindspots

Blindspots müssen berücksichtigt werden. Darunter versteht man Bildbereiche und Darstellungen, die der Betrachter ausblendet, typischerweise weil er in diesem Bereich oder in dieser Darstellung nichts Wesentliches erwartet. So wird etwa ein Bildbereich, der eine statische Information wie einen Videotitel oder ein Signet einblendet, zum Blindspot. Für eine kontextbezogene Einblendung eignet sich der Bereich nicht mehr.

Nach den Erfahrungen aus unseren Usability-Tests empfehlen wir, ausformulierte, textliche Handlungsanforderungen nicht parallel zur visuellen Handlung einzublenden. So konnten wir beobachten, dass Nutzer diese Texte als redundant und unwichtig einstuften und daher Texte in diesem Bereich oder in der entsprechenden Darstellung nicht mehr wahrgenommen haben.

Die Gestaltung hat Einfluss auf die Sichtbarkeit. Eine Animation oder ein Eingangseffekt zieht die Aufmerksamkeit auf sich. Farben, Helligkeiten, Fokusverlagerungen sind Stilmittel, um das Auge des Betrachters zu führen. Helle Bildbereiche werden tendenziell zuerst angesehen. Eine Fokusverlagerung führt beispielsweise dazu, dass der Betrachter seine Aufmerksamkeit auf das scharf gestellte Objekt im Bild legt.

Auch die räumliche Nähe wirkt sich auf die Aufmerksamkeit aus. Eine Videoproduktion unterstützt diese räumliche Nähe durch die Wahl der Einstellungsgröße (zum Beispiel Close-up), Tiefenunschärfe und eine aufgeräumte Anmutung. Dadurch entstehen mögliche Positionierungen von Texteinblendungen. Hier zeigt sich, wie wichtig es ist, parallele Texteinblendungen systematisch und standardisiert im Drehbuch festzuhalten.

In unseren Usability-Tests erwies sich besonders die Darstellung auf einem Tablet als herausfordernd: Wir vermuten, dass die große Videodarstellung die Probanden verleitete, parallel die Handlung am realen Produkt auszuführen. Folglich standen die Nutzer weiter weg oder sahen nicht dauerhaft auf das Tablet. Dadurch wurden einzelne parallele Texteinblendungen nicht erfasst, die sich automatisch ausblenden. Diese Situation gilt es zu berücksichtigen, denn sie hat Einfluss auf die Textdarstellung und Anzeigelänge. Speziell Informationen wie Warnungen sollten daher nicht parallel angezeigt werden. Außerdem sollte sie der Anwender bestätigen.

Aus der Vergangenheit lernen

Der Ausgangspunkt unserer Beschäftigung mit der Standardisierung multimedialer Anleitungen war erstens die Einschätzung, dass der Bedarf an multimedialen Anleitungen steigen wird. Zweitens die Frage, wie die Standardisierungsmethode Funktionsdesign auf multimediale Inhalte angewandt werden kann. Und drittens waren es wichtige Forschungsergebnisse wie der Multimediaeffekt.

Der Multimediaeffekt (Mayer, 2009) beschreibt einen besseren Lernerfolg bei multimedialen Lehr-Lern-Systemen gegenüber monomedial präsentierter Information und gilt als empirisch gesichert. Die von Richard E. Mayer in der „Cognitive Theory of Multimedia Learning” beschriebenen Designprinzipien sind die Voraussetzungen, damit ein positiver Multimediaeffekt wirkt und beispielsweise eine kombinierte Darstellung aus Bild und Text das Verstehen und Lernen fördert und erleichtert. Darunter sind das Prinzip der räumlichen und zeitlichen Kontiguität (Abgrenzung) und das Prinzip der Hervorhebung zu nennen. Nur wenn geeignete Designprinzipien beachtet und umgesetzt werden, können wir mit hoher Wahrscheinlichkeit einen positiven Multimediaeffekt erzielen.

Eine kombinierte Darstellung von Videobild und Text bedeutet dabei nicht, dass wir bestehende Teile aus Text-Bild-Anleitungen einfach in ein Video einfügen. Es bedeutet vielmehr, dass wir die Stärken und Schwächen der visuellen und sprachlichen Information kennen und so verknüpfen, dass sie insgesamt einen positiven Lerneffekt auslösen. Das heißt auch, dass wir in die funktionale Tiefenstruktur multimedialer Anleitungen eindringen müssen. Ähnlich wie es bereits vor Jahren passiert ist, als man Methoden wie Funktionsdesign oder auch Datenmodelle wie DITA auf Technische Dokumentation angewandt hat.

Lernen wir aus der Vergangenheit: „Gut schreiben können” ist zwar hilfreich, aber nicht ausreichend für das Erstellen Technischer Dokumentation. Ohne Methodik hätte es kaum zur Entwicklung der verbreiteten Component-Content-Management-Systeme geführt. Darum sind wir überzeugt, dass auch multimediale Instruktionen ein geeignetes methodisches Grundgerüst benötigen, um dauerhaft erfolgreich und wirtschaftlich produzierbar zu sein. Bis heute stehen jedoch weder ausreichend Methoden noch Prozesse oder Tools zur Verfügung. Hier gibt es in den nächsten Jahren also viel zu tun.

Was sich seit 2020 verändert hat

Redaktionelle Ergänzung der Web-Version 2026. Der Originalartikel bleibt argumentativ unverändert, dieser Block ordnet die seither erschienenen normativen Anker ein.

Der Artikel schließt mit der Beobachtung, dass für multimediale Instruktionen 2020 weder ausreichend Methoden noch Prozesse oder Tools zur Verfügung standen. Sechs Jahre später ist diese Lücke teilweise geschlossen:

  • ISO/IEC/IEEE 26516:2026: Die erste internationale Norm für Entwicklung und Produktion von Instruktionsvideos ist am 17.02.2026 erschienen. Sie liefert genau das methodische Grundgerüst, das im Originalbeitrag eingefordert wurde: Content-Elemente, Strukturlogik, Medienzusammenspiel, Storyboard-Anforderungen, Producer-Rolle, Barrierefreiheits-Architektur.
  • BFSG / EAA seit Juni 2025: Das Barrierefreiheitsstärkungsgesetz macht Untertitel und Audiodeskription für viele Anbieter verpflichtend, primär bei Verbraucher-Angeboten; für reine B2B-Maschinenhersteller bleibt WCAG 2.1 AA der fachliche Maßstab. Damit wird die Lesbarkeits-Frage des dritten Schritts um eine rechtliche Dimension erweitert.
  • WCAG 2.1 Level AA: Untertitel für aufgezeichnete Videos sind Pflichtkriterium, was die Platzreserve am unteren Bildrand zur Voraussetzung statt zur Option macht.

Die vier Schritte des Artikels (Darstellungsform, Koordination, Lesbarkeit, Aufmerksamkeit) bleiben gültig. Sie sind heute durch die ISO 26516 in einen verbindlichen Rahmen eingebettet.

Literatur

  • Schmeling, Roland; Kadelbach, Florian (2020): Warum Text in Videos? In: technische kommunikation, H. 4, S. 44–48. Web-Version: „Warum Text in Videos?”
  • Villiger, Claudia (2019): Anwendung von Designprinzipien im digitalen Nutzungskontext. In: Hennig, Jörg; Tjarks-Sobhani, Marita (Hrsg.): Verständlichkeit als Problem der Technischen Kommunikation. tekom-Schriften zur Technischen Kommunikation, Band 24, S. 174–186.
  • Mayer, Richard E. (2009): Multimedia Learning. 2nd Edition. Cambridge University Press.

Häufige Fragen zur Text-Gestaltung im Video

Wo soll ein Text im Video platziert werden, damit der Bezug zum Bild erkennbar bleibt?

Entscheidend sind räumliche und zeitliche Nähe. Räumlich: Der Text gehört in die Nähe des referenzierten Objekts. Zeitlich: Er erscheint synchron zur Videosequenz, auf die er sich bezieht. Sequenziell vor der Sequenz eingeblendete Texte werden von Nutzern eher als Kapitelüberschrift oder Videotitel interpretiert.

Wer Texteinblendungen erst in der Post-Produktion plant, kommt zu spät. Einstellungsgröße, Tiefenunschärfe und Fokusverlagerung müssen schon beim Dreh berücksichtigt werden, damit später Platz und Bezugspunkte für den Text bleiben.

Wie lange muss ein Text im Video sichtbar sein?

Eine universelle Anzeigedauer gibt es nicht. Der eine Nutzer wird schnell ungeduldig, der andere pausiert oder sieht die Sequenz mehrfach. Daher ist die einfachste Regel: Texte so kurz wie möglich halten. Dann lässt sich eine knappe parallele Anzeigedauer realistisch festlegen.

Bei längeren Texten ist die zeitunabhängige Darstellung die bessere Wahl. Das Video stoppt, der Text steht ohne Zeitdruck, der Nutzer setzt das Video per Klick fort. Diese Lösung erfordert Webtechnologie und schränkt damit den technischen Spielraum ein, eignet sich aber für alle Inhalte, die nicht überlesen werden dürfen.

Wann ist eine zeitunabhängige, interaktive Textdarstellung sinnvoll?

Immer dann, wenn der Text nicht übersehen werden darf oder zu lang für eine parallele Einblendung ist. Klassischer Anwendungsfall: Warnhinweise. Das Video pausiert, der Warnhinweis erscheint mittig, der Nutzer bestätigt per Klick. In den Usability-Tests von 2019 stieß diese Darstellung auf hohe Akzeptanz; die Probanden fühlten sich verpflichtet, die Hinweise umzusetzen, und waren dankbar für die Vorabinformation.

Weitere Anwendungsfälle: Zielangaben am Anfang einer Handlungssequenz, sicherheitsrelevante Voraussetzungen, Compliance-Bestätigungen. Faustregel: Wenn der Inhalt aktiv wahrgenommen werden muss, ist die zeitunabhängige Darstellung der parallelen überlegen.

Welche Stilmittel lenken die Aufmerksamkeit im Video gezielt zum Text?

Mehrere Hebel wirken zusammen. Eingangs-Animationen ziehen den Blick auf den neu erscheinenden Text. Farbe und Helligkeit lenken die Aufmerksamkeit; helle Bildbereiche werden tendenziell zuerst angesehen. Fokusverlagerungen führen das Auge auf das scharf gestellte Objekt. Räumliche Nähe zwischen Text und referenziertem Gegenstand wirkt ebenfalls stark.

Wichtig ist die Vermeidung von Blindspots. Bereiche, in denen statisch Videotitel oder Signets stehen, werden vom Betrachter ausgeblendet und sind für kontextbezogene Einblendungen ungeeignet. Wer dort Information platziert, verliert sie unbemerkt.

Wie unterscheiden sich Warnhinweise, Handlungsaufforderungen und Zielangaben gestalterisch?

Jede kommunikative Funktion verlangt eine eigene Gestaltung. Warnhinweise brauchen Art, Quelle, Folgen und Maßnahmen sowie eine starke Hervorhebung; die zeitunabhängige Modal-Darstellung mit aktiver Bestätigung hat sich bewährt. Handlungsaufforderungen brauchen alle Daten zur Umsetzung; technische Werte können oft besser textlich als visuell angezeigt werden. Zielangaben gehören an den Anfang einer Sequenz, idealerweise als textlich klare Eröffnung.

Die saubere Differenzierung nach Funktion ist die Voraussetzung für jede Standardisierung. Sie erlaubt Technischen Redakteuren, klare Strategien für wiederkehrende Informationsmuster festzulegen, statt jede Sequenz neu zu erfinden.