Aby utrzymać uwagę widza, programy szybko przechodzą od sceny do sceny, od komentatora do komentatora i od osoby do osoby, z dialogami przelatującymi w sekundę. Cud, że ktoś jest w stanie nadążyć i zrozumieć wszystko, co się mówi.
A teraz wyobraź sobie tłumaczenie tego dźwięku na tekst w czasie rzeczywistym dla publiczności liczącej miliony ze społeczności niesłyszących i niedosłyszących, a także tych, którzy oglądają treści bez dźwięku. Ludzie, którzy polegają na tym tekście, jeśli chodzi o wiadomości, rozrywkę i inne krytyczne informacje, aby być w kontakcie i informować o otaczającym ich świecie.
Jest to praca wysoko wykwalifikowanych specjalistów — osób tworzących napisy w czasie rzeczywistym. Dlatego jest to bardzo droga usługa.
Ze 100% dokładnością można wygenerować napisy TYLKO poprzez pisanie ich w trakcie lub poprzez tzw. respeaking (słucha i wyraźnie powtarza do mikrofonu).
To bardzo ciężka praca. Takie tworzenie napisów wymaga kilku osób przy dłuższej transmisji internetowej. A to generuje koszty.
Dlatego umożliwiamy wyświetlanie napisów generowanych automatycznie.
Nie są one dokładne w 100%, ..jeszcze nie są. Ale ich dokładność to 85-95%. Dokładność uzależniona jest od kilku czynników.
Najważniejsze, co ma wpływ na jakość generowanych napisów:
1. szum; zwróć uwagę np. w trakcie reklam z podkładem muzycznym generowanie jest utrudnione lub wręcz niemożliwe
2. głośność i wyrazistość głosu mówcy; np. mówca telefoniczny jest mało wyrazisty, słyszalny
3. jak biegle mówca zna język w którym wypowiada się;
4. Leksykony i dialekty specyficzne dla geografii lub społeczności
Wygenerowane napisy mogą pojawić się zasadzie wszędzie, gdyż napisy są "otwarte", czyli zintegrowane z Twoim strumieniem. Nierozłączne.
Na nasze serwery, na youtube.com czy facebook.com etc.
Obsługiwane języki.. sprawdź.
Więcej informacji znajdziesz tutaj.