Landscape ACC

Realisatie van een zelf-lerend Vlaams taalmodel

De vraag

Een zelf-lerend Vlaams taalmodel

VRT, DPG Media en Play Media zijn drie mediabedrijven met een gemeenschappelijke functie in het publieke en maatschappelijke domein: De Vlaamse bevolking informeren, inspireren en entertainen(en daarmee verbinden) door middel van verschillende soorten media.De groeiende vraag naar ondertiteling in het snel veranderende mediaconsumptielandschap stelt Vlaamse mediabedrijven voor grote uitdagingen. Huidige ondertitelingsprocessen, die steunen op tijdsintensieve manuele arbeid, schieten tekort en zijn moeilijk op te schalen. Kwalitatieve liveondertiteling verschilt naargelang de toepassing, met sociale media die snellere processen vereisen dan televisie of digitale kanalen.

De vraag was om een platform samen te gaan ontwikkelen dat de kwalitatieve ondertiteling van zoveel mogelijk live streaming en short form content automatiseert gebasseerd op een Vlaams taalmodel. 

ACC 2

Proces

Proces

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

image

Oplossing

Architectuur op basis van Triple8

Qua oplossing hebben we ervoor gekozen om voort te bouwen op de architectuur van Triple8

Het platform neemt de taak op zich om de audio uit de video te extraheren. Vervolgens converteert het platform, met behulp van OpenAI Whisper gecombineerd met een op maat gemaakt Vlaams taalmodel, de audio naar tekst. Daarna volgt de postprocessing: het aanpassen van de transcriptie in de editor, en mogelijk het renderen van de video of het downloaden van de ondertitelbestanden.