Beey funguje skvěle i v norštině díky Fondům EHP a Norska

30 září, 2022 in AktualityBeey funguje skvěle i v norštině díky Fondům EHP a Norska

Zajímalo by vás, jak u nás probíhá vývoj a přidání nového jazyka do Beey? Dne 20.9. jsme se s NEWTON Technologies účastnili setkání k průběhu implementace Fondů EHP a Norska. Prezentovali projekt NORDTRANS, ve kterém spolu s Technickou univerzitou v Liberci připravujeme technologii pro automatický přepis řeči na text pro norštinu (a výhledově i švédštinu).

Proč zrovna norština?

Rozvoj germánských jazyků

Jsme česká firma, a proto jsme se primárně zabývali češtinou a dalšími slovanskými jazyky. Germánské byly další logický krok v rámci vývoje rozpoznávačů pro evropský trh.

Spolupráce s univerzitou

Technická univerzita v Liberci, kde probíhá technologický vývoj samotného rozpoznávače, již dříve spolupracovala s norskou univerzitou v Trondheimu (NTNU) na jiných projektech, zůstaly jim tedy kontakty a dobré vztahy potřebné k získávání dat a orientaci v nich.

Rozhovor díky TA ČR

Technologická agentura ČR, která zprostředkovává finance z Norských fondů pro konkrétní projekty, nás již dříve oslovila a zorganizovala rozhovor s naší lingvistkou Lenkou Weingartovou v rámci fóra Meltingpot na Colours of Ostrava.

Zástupkyně z TA ČR na Setkání k iimplementaci norských fondů

O rozpoznávači

Pro norštinu jsme použili novou generaci systémů rozpoznávaní řeči, tzv. end-to-end rozpoznávač, který se skládá z jediné mohutné neuronové sítě. Tato umělá inteligence se pomocí algoritmů strojového učení natrénuje na požadovaný jazyk, k čemuž je potřeba primárně obrovské množství dat - zvukové nahrávky a jejich doslovný přepis. Při dostatečném množství kvalitních dat je pak tato verze rozpoznávače velmi přesná, běžně dosáhne u kvalitních nahrávek přesnosti nad 90 %, a vyžaduje podstatně menší množství manuální údržby a aktualizací. Nevýhodou může být právě shánění dat v požadované kvalitě a poměrně malá možnost ovlivnit výstup či výsledek z již hotového rozpoznávače.

Kde se to dá využít?

Rozpoznávač takto vysoké kvality má mnoho způsobů dalšího využití, především skrze naši aplikaci Beey. Automatický speech-to-text přepis lze dále opravovat k dosažení 100% přesnosti, dělit dle jednotlivých mluvčích, strukturovat podle témat a mnoho dalšího. V Beey navíc u každého slova zůstane uložena časová značka napojená na audio stopu, lze tedy přehrávat zvuk i podle umístění kurzoru v textu. Hlavní využití to ale má při tvorbě titulků, které si buďto můžete vygenerovat automaticky jedním klikem, nebo využít nástroje Titulkový mód. Ten umožňuje úpravu titulků na profesionální úrovni, včetně vizualizace audia a titulku ve zvukové vlně.

Další možné okruhy aplikování přepisu řeči na text zahrnují:
  • online monitoring televizního, rozhlasového a internetového vysílání
  • přepis jednání v parlamentu a podobných veřejných institucích
  • zápis ze zasedání místních zastupitelstev, přednášek, konferencí a jiných jednání
  • vyhledávání v audio archivech
  • zlepšení SEO při zveřejnění transkriptu videa či podcastu
  • tvorbu skrytých titulků k videím pro neslyšící či ke zlepšení srozumitelnosti
  • bleskové titulkování cizojazyčných videí pomocí funkce automatického překladu Beey Translate
Alternative Text

Prezentace projektu NORDTRANS

Jsme hrdí, že jsme byli vybráni z dvaceti dalších projektů z kategorie Výzkum pro prezentaci rozpoznávače norštiny jako příklad dobré praxe použití Norských fondů. Navíc nás i potěšilo, že se setkání účastnil také velvyslanec Norského království a další zástupci Norské ambasády v Praze, kteří mohli osobně potvrdit kvalitu přepisu norštiny při živé ukázce v Beey.


Vyzkoušejte si beey zdarma

Program KAPPA financovaný norskými fondy

V rámci spolupráce s TUL je NEWTON Technologies zapojeno do Programu na podporu aplikovaného výzkumu, experimentálního vývoje a inovací KAPPA zprostředkované Technologickou agenturou ČR. Náš společný projekt byl podpořen jako jeden z 25 projektů z celkem 163 přihlášených návrhů.


více o programu kappa
Alternative Text