Taaltechnologie voorziet digitale snelweg van op- en afritten

Enschede - Taaltechnologie gaat de digitale snelweg van op- en afritten voorzien, zodat elk huishouden, bedrijf en instelling eenvoudig toegang tot die ‘Global Information Highway’ kan krijgen. Dat valt met name in de Verenigde Staten te beluisteren waar een hevige digitale snelwegkoorts woedt.

Aan de Universiteit Twente wordt bij de faculteit Informatica onderzoek op het gebied van taaltechnologie gedaan; ook hier voorziet men een grote toekomst. De mogelijkheden van taaltechnologie stonden centraal in een dubbele oratie van prof. dr.ir. A. Nijholt en prof.dr. F.M.G. de Jong, ter gelegenheid van de aanvaarding van hun ambt als hoogleraar in de vakgroep Software Engineering en Theoretische Informatica.

Taal, zo betoogt Nijholt, is hét communicatiemiddel tussen mensen. In onze samenleving worden de communicatiemogelijkheden steeds complexer. Internationalisering vraagt om kennis van vreemde talen, automatisering vereist gebruik van computertaal. Dit doet de behoefte ontstaan aan computers die natuurlijke taal kunnen verwerken. En dan niet voor het simpele tekstverwerken, maar voor zaken als vertaling van teksten, zinsontleding, controle van spelling en grammatica, spraakherkenning, eenvoudige database-bevraging enz.

Een belangrijke toepassing van natuurlijke-taalverwerking ligt volgens Nijholt in het veeltalige Europa. De Europese Unie geeft jaarlijks meer dan 20 miljard gulden uit aan vertaalwerk. Als machinaal vertalen goedkoper wordt, zijn grote besparingen mogelijk.

Ingenieursbenadering

Onderzoek aan taal was tot voor kort vooral zuiver wetenschappelijk, gericht op een beter begrip. Aan de Universiteit Twente heeft men onder leiding van Nijholt daarentegen voor een ingenieursbenadering gekozen: doel van het onderzoek is niet zozeer volledig theoretisch onderbouwde, als wel werkende produkten af te leveren. Het begrip taaltechnologie typeert deze benadering. Verder beperkt men zich bij het ontwerpen van een taalverwerkend systeem tot één bepaald domein, en probeert men niet kennis van de hele wereld in het systeem te stoppen.

Deze pragmatische benadering is volgens Nijholt uniek binnen de Nederlandse informatica-wereld. Het betekent niet dat men geen aandacht heeft voor taalkundige onderbouwing van natuurlijke-taalverwerking. Daar ligt het werkterrein van De Jong. Zij wordt door haar collega Nijholt wel het linguïstisch geweten van de vakgroep genoemd. De Jong houdt zich bezig met computerlinguïstiek: Taalkunde met behulp van de computer en gericht op toepassing in de informatica.

Een voorbeeld van de Twentse ingenieursbenadering van natuurlijke-taalverwerking is SCHISMA (Schouwburg Information System Access), een samenwerkingsproject met PTT Research. Schisma is een dialoogsysteem voor schouwburginformatie en -boekingen. De communicatie tussen gebruiker en computer komt via toetsenbord en beeldscherm tot stand met behulp van getypte tekst. Het systeem kan een aantal specifieke vragen, gesteld in de Nederlandse taal, beantwoorden. Welke vragen het systeem kan beantwoorden, hangt niet af van de structuur van die vragen (of ze ‘volgens de regels’ zijn gesteld), maar van de inhoud (het systeem heeft alleen ‘verstand’ van schouwburgzaken).

Nijholt en De Jong voorzien dus een grote toekomst voor taaltechnologie, maar relativeren tegelijk overspannen verwachtingen. Natuurlijke taal zal slechts één van de toegangsmogelijkheden tot de digitale snelweg zijn, en bovendien zal deze toch vooral bedrijven bedienen. Individuele burgers worden hooguit op een digitale B-weg aangesloten.

Elektronica 28/10/94