Durch gesetzliche Vorgaben steigt auch das Interesse an der Erstellung sogenannter Captions. Diese Untertitel bei Videos sind dafür gedacht ein Video für jene zugänglich zu machen, die beispielsweise ein Höreinschränkung haben.

Barrierefreie Videos mit Untertiteln
Um Videos barrierearm bzw. barrierefrei (der Begriff an und für sich ist etwas zu absolut) zu machen, ist es beispielsweise nötig sogenannte "Captions" anzufertigen. Es handelt sich dabei um eine Text-Datei die mit Zeitstempeln versehen wird um dem Video-Player die Anweisung zu geben, wann der Text erscheinen soll bzw. auf welchen Zeitraum im Video sich dieser Text in gesprochener Form bezieht. Es ist auch erlaubt in die sogenannten "Closed Captions" andere Dinge einzubauen, diese werden meistens in Klammer gesetzt, wenn es sich nicht um tatsächlichen gesprochenen Text handelt, sondern um beispielsweise um ein Geräusch, das das Verständnis dessen, was im Video passiert, unterstützt.
Wie erstellen Sie eine VTT-Datei für Ihr Video?
Es gibt zahlreiche Systeme, die mit Hilfe von Spracherkennung und künstlicher Intelligenz solche Untertitel erstellen können, aber - die gute Nachricht für Sie ist - sie können das auch selbst tun ohne Software zusätzlich zu installieren, es reicht im Grunde genommen alles, was Sie auf einem normalen Computer bereits mit dem Betriebssystem ausgeliefert bekommen.
Erstellung einer Untertitel-Datei in 5 Schritten
- Öffnen Sie auf dem Computer ein Text-Programm, am besten keine "Textverarbeitung" wie "MS Word" oder "Open Office", sondern ein reines Textprogramm (Notepad bei Windows oder TextEdit bei MacOS).
- Schreiben Sie in die erste Zeile der Datei WEBVTT hinein und drücken Sie 2 x die Enter-Taste um eine zusätzliche Leerzeile zu erzwingen.
- Schreiben Sie nun Zeit-Stempel für den Beginn und für das Ende der Caption mit einem Pfeil dazwischen. Der Pfeil besteht aus 2 Bindestrichen und einer spitzen Klammer und sieht so aus: -->
Die beiden Zeitstempel müssen das Format Stunde : Minute : Sekunde.Millisekunde haben. - Schreiben Sie in die nächste Zeile (oder 2 Zeilen) den Text, der im Video gesprochen wird. Wir empfehlen pro Caption die Länge des Textes auf ca. 30 - 35 Zeichen zu beschränken und dann die nächste Caption einzubauen.
- Speichern Sie das Dokument nun mit dem Texteditor mit einem Dateinamen und der Endung ".vtt", auch wenn das Textprogramm eventuell ".txt" vorschlägt.
Die Schritte 3 und 4 wiederholen Sie jeweils mit einer Leerzeile, bis Sie das ganze Video durch gegangen sind. Die Zeilenumbrüche in den Captions werden vom Videoplayer auch an der stelle gesetzt. Mehr als 2 Textzeilen sollte eine Caption aber für ein barrierefreies Video nicht haben.
Die Datei sieht dann etwa so aus:
WEBVTT
00:00:00.000 --> 00:00:05.000
Willkommen bei echonet
in unserem neuen TV-Studio.
00:00:07.500 --> 00:00:11.300
Heute zeigen wir Ihnen das
CMS contentlife Version 4.
00:00:12.000 --> 00:00:15.400
♪ ("SIMPLY THE BEST" VON TINA TURNER) ♪
00:00:15.800 --> 00:00:17.200
(APPLAUS) Ja, es ist einfach
das beste, was wir bisher haben.
00:00:18.500 --> 00:00:22.650
Sie sehen gerade, wie einfach
die Erstellung von neuen Inhalten ist.
Was ist der Unterschied zwischen "Subtitle" und "Caption"?
Der Unterschied zwischen "Closed Captions" (daher ist der Button bei YouTube beispielsweise auch mit "CC" versehen und Subtitles ist die Bedeutung. Die Closed Captions informieren über den Inhalt des Videos auch mit dem, was zusätzlich wichtig ist um den Tongehalt zu verstehen. Beispielsweise, das wird dann immer in Klammer gesetzt und in Großbuchstaben geschrieben, wenn ein Lied eingespielt wird oder wenn es einen Geräuscheffekt gibt, wie beispielsweise einen Applaus oder etwa eine Polizeisirene im Hintergrund, wenn das für das Verständnis des Inhaltes im Video wichtig ist.
Demo-Video auf meteotube über meteolingo
Damit Sie eine Vorstellung davon haben, wie das funktioniert und aussieht, haben wir bei echonet natürlich ein Beispiel für Sie erstellt. Das Video-Caption-File zeigen wir Ihnen hier auch. Es ist im Programm "TextEdit" auf einem Mac OS geschrieben und einfach als "meteolingo-de.vtt" gespeichert. Hier geht es zum Video mit barrierefreien Untertiteln, drücken Sie die [CC]-Taste im Player, um die "Closed Caption" zu sehen. Abgespielt wird es über unseren Video-Service meteotube und es behandelt die Webseiten-Übersetzungssystematik mit künstlicher Intelligenz namens meteolingo.
Barrierefreie Videos im Web mit meteotube - Das VTT-File
Hier der gesamte Inhalt der Datei, die wir dafür erstellt haben - so können Sie jederzeit auch eine VTT-Datei erstellen und auf Ihrem Video dafür sorgen, dass es barrierefreies Videovergnügen wird:
WEBVTT
00:00:00.000 --> 00:00:02.000
Die Weltherrschaft können wir dir
nicht versprechen.00:00:02.100 --> 00:00:05.000
Aber wenn wir ehrlich sind,
der Pinky und der Brain00:00:05.000 --> 00:00:07.500
haben das auch nicht hingekriegt.
Was wir für dich tun können?00:00:07.700 --> 00:00:09.500
Wir können deinen Webauftritt so machen00:00:09.600 --> 00:00:12.500
dass du in mehreren Sprachen und
Ländern Präsenz gewinnst.00:00:12.700 --> 00:00:20.500
♪ (UPBEAT MUSIC) ♪00:00:21.000 --> 00:00:24.500
Wenn dir Unabhängigkeit wichtig ist,
dann haben wir ein Produkt für dich.00:00:25.000 --> 00:00:23.500
Unser Job ist es, dir die
Werkzeuge zu geben00:00:27.500 --> 00:00:31.200
mit denen du die Ketten sprengen
und die Macht in deine Hände00:00:31.300 --> 00:00:32.400
zurückbekommen kannst.00:00:32.600 --> 00:00:33.800
Willkommen bei echonet!
Mein Name ist Roland und00:00:33.900 --> 00:00:36.000
ich bin einer der Mitgründer
der Agentur.00:00:36.500 --> 00:00:40.000
Los geht's, denn jetzt darf
ich an meine virtuelle Assistentin00:00:40.200 --> 00:00:41.800
Claudia Content übergeben.00:00:42.000 --> 00:00:44.000
Claudia, zeige uns doch,
was ihr gemacht habt.00:00:44.500 --> 00:00:46.000
(Claudia) Gerne, Roland!00:00:47.500 --> 00:00:49.000
Ich logge mich einmal ins
System ein.00:00:49.500 --> 00:00:53.000
Dafür brauche ich ja nur meinen
Namen und mein Passwort.00:00:54.000 --> 00:00:57.000
Wo wir uns einig sind, ist, dass
es manchmal nicht sinnvoll ist00:00:57.000 --> 00:01:00.000
eine Übersetzung zu machen, wie
etwa bei einem Namen.00:01:00.500 --> 00:01:02.500
Da benutzt man im System einfach
die Kopierfunktion.00:01:02.600 --> 00:01:05.500
Es hätte ja auch keinen Sinn
meinen Namen als Claudia Inhalt00:01:05.500 --> 00:01:07.000
ins Deutsche zu übersetzen.00:01:08.000 --> 00:01:11.000
Damit man das Problem versteht,
zeige ich jetzt einfach mal00:01:11.500 --> 00:01:14.500
wie du bisher gearbeitet hast.
Für die Webseite hast du dir00:01:14.500 --> 00:01:17.000
einen Lebenslauf ins System kopiert.00:01:17.500 --> 00:01:19.500
Dann hast du dir einen 2. Tab
mit einer Onlineübersetzung00:01:20.000 --> 00:01:24.500
aufgemacht. Und so bist du dann
hin und her und hin und her00:01:24.600 --> 00:01:27.200
und hin und her gesprungen um dir
die Übersetzungen zu holen.00:01:27.800 --> 00:01:30.200
So hast du versucht die Webseite
mehrsprachig zu machen.00:01:30.500 --> 00:01:34.000
Es geht mir jetzt gar nicht so
sehr um die Qualität der00:01:34.000 --> 00:01:35.500
Übersetzungen, die du da gemacht
hast.00:01:36.000 --> 00:01:38.000
Was man hier aber sehr wohl sieht
ist, dass du jedes Mal die00:01:38.000 --> 00:01:41.000
Formatierungen nachziehen musstest.
Ehrlich gesagt ist das nicht00:01:41.000 --> 00:01:43.000
Effizient, wie du das gemacht hast.00:01:45.000 --> 00:01:47.500
(Roland) Das war mühsam und da
hilft auch ein Cookie nicht.00:01:47.500 --> 00:01:49.000
(Bekommt ein Keks in die Hand)00:01:50.000 --> 00:01:52.000
(Claudia) Sicher, die Cookies haben
dir nicht geholfen.00:01:52.500 --> 00:01:56.000
Aber wie du gearbeitet hast,
erklärt zumindest warum die00:01:56.000 --> 00:01:59.000
Süßigkeitenlade in der Agentur
immer so schnell leer wurde.00:01:59.500 --> 00:02:02.500
Wir haben uns im Team zusammen
gesetzt und eine Lösung00:02:02.500 --> 00:02:06.000
dafür gebaut. Ich zeige dir das
einfach. Dazu habe ich jetzt00:02:06.000 --> 00:02:09.000
mal die Übersetzungen in den
anderen Sprachen gelöscht.00:02:06.000 --> 00:02:09.000
mal die Übersetzungen in den
anderen Sprachen gelöscht.00:02:10.000 --> 00:02:12.000
Neu im System ist dieser
kleine Roboter hier.00:02:12.000 --> 00:02:16.000
Den nennen wir meteolingo. Wie
du das in Zukunft machen kannst00:02:16.000 --> 00:02:19.000
ist ganz einfach. Es ist
nur ein Klick.00:02:20.000 --> 00:02:23.000
Schau! Das sieht doch schon
ziemlich gut aus in allen Sprachen00:02:23.000 --> 00:02:24.500
mit nur einem Klick.00:02:26.000 --> 00:02:29.000
(Roland) So wie ich euch kenne,
habt ihr euch für den Schluss00:02:29.000 --> 00:02:32.500
von unserem Video noch ein
Highlight aufbewahrt, richtig?00:02:33.000 --> 00:02:37.000
(Claudia) Ja, ich habe noch eine
kleine Überraschung für dich, Roland!00:02:37.000 --> 00:02:40.000
Schau mal hier, ich habe hier das
Wort Matura markiert.00:02:40.700 --> 00:02:44.000
Wenn das System aber verstanden
hat, das ich zwar in Tirol00:02:44.000 --> 00:02:46.000
geboren bin, aber meinen Schul-
Abschluss in Hamburg gemacht00:02:46.000 --> 00:02:49.000
habe, dann schreibt das System
den Text um.00:02:50.000 --> 00:02:52.000
Denn ein Abschluss vor dem Studium
heißt in Österreich Matura00:02:52.500 --> 00:02:55.000
aber in Deutschland nennt
man das Abitur.00:02:56.000 --> 00:02:59.000
Das ist künstliche Intelligenz
in einer Übersetzung für Webseiten.00:03:00.000 --> 00:03:04.000
Das ist meteolingo.
♪ (MUSIC) ♪