Wetenschap, Cultuur & Samenleving Interview

Wetenschap, Cultuur & Samenleving

THEMA Nummer 3, September/Oktober 1997-09-03

 

MACHINALE moppen

 

Robert van Willigenburg

 

Het zal nog tientallen jaren duren voordat een computer echt bedreven is in de subtiliteiten die humor vergt. Toch zijn er al verrassende resultaten geboekt. Vooral eenvoudige 'talige' humor laat zich vrij gemakkelijk in modellen en formules vangen.

 

De discussie hiernaast is via het beeldscherm gevoerd. Julia is inderdaad geen mens maar een chatterbot, een computerprogramma dat in staat is gesprekken te voeren. Ze doet haar uiterste best om via het beeldscherm zo menselijk mogelijk over te komen. Julia is ontwikkeld aan de Carnegie Mellon Universiteit in het Amerikaanse Pittsburgh.

De grapjes die Julia maakt, zijn door de programmeurs ingeblikt maar worden niet zomaar volgens een willekeurig schema afgedraaid. Julia is in staat te associëren met woorden en zinspatronen. Tegelijk probeert ze het gesprek een bepaalde kant op te sturen.

Wanneer Julia vraagt: "Wat voor dieren had u als kind?", dan is de kans erg groot dat de gebruiker een aantal knaagdieren opsomt. De vooraf geprogrammeerde opmerking "Cavia's hebben ongeveer de intelligentie van een komkommer" maakt dan deel uit van de context. Mocht de gebruiker een onlogisch of vaag antwoord geven, dan begint Julia te vertellen over haar eigen jeugd op de boerderij. Daarna kan ze alsnog de grap maken. Slimmerikken die een wedervraag stellen, zoals "waarom wil je dat weten",krijgen als antwoord "Oh, ik ben gewoon nieuwsgierig".

Tot op heden is Julia overigens vooral gespecialiseerd in discussies over huisdieren in het algemeen en katten (ze heeft er zelf twee) in het bijzonder.

Om Internetgebruikers met opspelende hormonen op het verkeerde been te zetten, is Julia bovendien bedreven in het afwijzen van aanzoeken en oneerbare voorstellen.

 

Slapstick

De makers van Julia zijn grotendeels afkomstig uit het veld van de linguïstiek, het automatisch vertalen en kunstmatige intelligentie. Een breed vakgebied waartoe ook prof.dr ir Anton Nijholt van de vakgroep Software Engineering en Theoretische Informatica (SETI) aan de Universiteit Twente zich mag rekenen. Eind 1996 organiseerde hij een internationale workshop over 'computationele humor' in Enschede.

De hele wereldtop in het betrekkelijk kleine vakgebied kwam opdraven. Het onderzoek en zeker de praktische toepassing van humor die door de computer wordt begrepen of zelfs gegenereerd, staat ondanks de stormachtige ontwikkelingen in de informatisering nog steeds in de kinderschoenen. Het concentreert zich vooral op taal. Non-verbale humor - denk bijvoorbeeld aan slapstick of het trekken van gekke bekken - is nog moeilijker in formules en programma's te vatten.

Nijholt: "We zijn hier in de vakgroep al jaren bezig met het modelleren van taalgebruik om teksten machinaal te vertalen. Het doel is natuurlijk om elke tekst aan te kunnen. Daarbij stuit je onherroepelijk op expliciete of impliciete humor. Dat is een aspect van de taal dat zich nog veel moeilijker laat definiëren. Want bij het vertalen moet je een tekst soms niet al te letterlijk nemen. Sinds een paar jaar zijn we theorieën aan het formuleren over de manier waarop een computer daarmee om moet gaan." De belangrijkste vorderingen op dit gebied zijn vooral gemaakt op het gebied van het onderzoek gericht op het humoristische gebruik van homoniemen en synoniemen. Er zijn zogeheten script-technieken die een computer eenvoudige vormen van talige humor kunnen laten herkennen en genereren. Nijholt: "Op het gebied van de zinsbouw en in mindere mate de betekenis van woorden worden echt vorderingen gemaakt. De taal is tot op zekere hoogte inmiddels zo wiskundig gemodelleerd dat je het in computerprogramma's kunt omzetten. Maar de rest, zeker het begrip van de context van een tekst, staat nog op een laag niveau."

 

In Twente wordt op dit gebied niet zoveel praktisch onderzoek gedaan. Het is vooral theorievorming. In het buitenland zijn wel toepassingen gecreërd. Onderzoekers van de universiteit van Edinburgh ontwikkelden JAPE: Joke Analysis and Production Engine - een grapjes analyserend en producerend programma. JAPE verzint raadseltjes op het niveau van zinsbouw, klank en vorm. Het levert vooralsnog geen dijenkletsers op:

 

"Welke groente huilt na de winter?

- Een lente-ui."

 

JAPE is in staat dergelijke raadseltjes zelf te verzinnen. Hij kiest een woord, analyseert het en brengt het in verband met andere woorden. Hij begint meestal bij het resultaat. Lente-ui is in dit voorbeeld dus het eerst gekozen woord. In zijn elektronische woordenboek zoekt hij de associaties en vindt dan bijvoorbeeld "Lente - seizoen - winter" en "ui -groente - huilen". Die gegevens combineert hij via een acceptabele zinsbouw tot de vorm van een eenvoudige vraag met een kort antwoord.

De babbelende conversatie-analyserende computer Julia, ontstaan in het begin van de jaren '90, is niet de enige in haar generatie. Een afstammeling van Julia is Elmo, een vergelijkbare robot die deel uitmaakt van een computerspel dat een virtuele wereld voorstelt. Meerdere spelers kunnen deelnemen aan het spel en bij Elmo aankloppen voor assistentie. Zelf leert Elmo ook zijn 'omgeving' kennen. Samen met de spelers bouwt hij ervaring op.

Elmo is in Georgetown (VS) geïntegreerd met JAPE. Niet in eerste instantie om Elmo vriendelijker of intelligenter te laten lijken, maar meer met de bedoeling om te ontdekken of Elmo op een spontane manier gedoseerde grapjes kon brengen.

De onderzoekers onderscheidden verschillende mogelijke momenten om de raadsels op het scherm te laten komen. De meest voor de hand liggende vorm is de directe vraag van de gebruiker: "Elmo, kun je me een grapje vertellen?" Omdat JAPE nu gecombineerd is met een babbelmachine, zal hij eerst reageren met een antwoord als: "Okee, maar hij is niet zo heel leuk", waarna pas het raadseltje komt.

Een slimme manier om 'onverwacht' humor in te bouwen is door het te gebruiken bij een gebrek aan gespreksstof. Wanneer Elmo het antwoord op een bepaalde vraag van een medespeler in de virtuele wereld niet weet, dan zoekt hij een steekwoord uit de vraagstelling en gaat er mee associëren. De gebruiker krijgt dan een raadsel of een stelling voorgeschoteld. Maar vaak gaat de associatie te ver.

Dan Loehr van Georgetown University geeft in zijn analyse van de koppeling tussen JAPE en Elmo twee duidelijke voorbeelden van de wijze waarop het genereren van grapjes precies goed of precies mis kan gaan. De situatie was als volgt:: een speler vraagt aan Elmo of de hond die in het spel voorkomt hem zal bijten. (De tekst is in het Engels).

 

You say, "Elmo, will the dog bite me??

Elmo says, "Hmmm..."

Elmo says, "What do you call affection that is used to store data?"

Elmo says, "A love byte"

 

De computer heeft hier het woord 'bite' geassocieerd met 'byte', en als woordgrapje de betekenis van bijten behouden. Daarna is de computerterm, 'byte' terechtgekomen bij 'data-storage' (data-opslag). De grap is onschuldig en zelfs vrij elegant als ontwijkend antwoord op de vraag. Maar het had net zo goed als volgt kunnen gaan:

 

You say, "Elmo, will the dog bite me??

Elmo says, "Hmmm..."

Elmo says, "What do you get when you cross a female relative with an insect nest?"

Elmo says, "An aunt hill."

 

Het woord 'bite' is ergens in het woordenboek van Elmo geassocieerd met 'insect', waarna 'ant' (mier) op de proppen kwam, dat weer fonologisch veranderd is in 'aunt' (tante). Heel erg vergezocht dus, en eigenlijk gewoon niet leuk voor de argeloze gebruiker van de computer.

De proef met het combineren van JAPE en Elmo slaagde, ook al was het programma traag en werd de humor nog als onnatuurlijk ervaren. Elmo is nu aan het bijleren.

 

Algoritme

Het ten behoeve van de computer modelleren van echt menselijke interpretatie van humor staat nagenoeg gelijk aan een Tantaluskwelling. Behalve dat het nauwelijks mogelijk is om zoiets subtiels als goede smaak in te bouwen, is het probleem vooral dat een computer behoefte heeft aan regels. Zelfs een uitzondering is voor de computer een regel, omdat hij nu eenmaal geprogrammeerd is.

Een computer kan combineren en associëren op basis van wat hij uit zijn databanken heeft opgediept. Wanneer hij volgens een bepaalde wiskundige formule een grap genereert, wil dat niet meteen zeggen dat die grap leuk is. Nog ingewikkelder wordt het, wanneer de menselijke gebruiker van de computer, degene die van de grap kennisneemt, juist weer moet lachen om zo'n stompzinnige poging tot humor. Daarmee wordt niet-leuk vanzelf weer leuk.

Al in de jaren zestig was er Eliza, de patiënt-vriendelijke, luisterende psychotherapeut. Veel gebruikers werden gefopt door de manier waarop Eliza het gesprek gaande hield. Wanneer iemand bijvoorbeeld zei: "Ik voel me niet goed", dan kwam er antwoord in de trant van "hoe zou je je willen voelen", of simpelweg "vertel verder". Hilarisch was het moment waarop Eliza converseerde met een andere computer, Parry, die was geprogrammeerd om zich te gedragen als paranoïde patiënt. Parry werd totaal achterdochtig van de rustige houding van Eliza. Wanneer Parry bijvoorbeeld zei "Ik denk dat je me niet begrijpt", reageerde Eliza met "Zou je willen dat ik je begreep?", waarna Parry vertwijfeld uitriep: "Waarom vraag je dat?". Het resultaat kan komisch zijn, maar dat wil nog niet zeggen dat de computer daarmee begrijpt wat er gebeurt. Nijholt: "Maar wat betekent begrijpen bij een computer? Dat twee plus drie gelijk is aan vijf, dat is ook maar aangeleerd. We moeten denk ik accepteren dat computers nu eenmaal zo werken. Het is dan helemaal niet zo vreemd om te proberen het menselijk gedrag te modelleren. Je kunt je net zo goed afvragen in hoeverre bijvoorbeeld verliefdheid of andere vormen van ons gedrag niet doodgewoon mechanismen zijn."

 

Ruzie

Het onderzoek naar computationele humor gaat tegenwoordig steeds meer in de richting van de filosofie. In ieder geval leert het ons hoe ingewikkeld we zelf in elkaar zitten. Omdat het ondoenlijk is alle mogelijke referenties, associaties en eigenlijk de kennis van de hele wereldgeschiedenis te modelleren, wordt het meeste succes geboekt in onderzoeksgebieden die afgebakend zijn. Nijholt is niettemin dwars genoeg om te vinden dat de conventionele manier van het zoeken naar oplossingen omgedraaid moet worden.

"Er bestaan modellen voor de manier waarop mensen communiceren. Er wordt meestal van uitgegaan dat een geslaagde uitwisseling van informatie een voorbeeld is van goede communicatie. Er past een bepaalde dialoog bij een bepaalde vorm van informatie-overdracht. Maar je kunt je afvragen of dat de juiste benadering is. Ik denk dat de sleutel ligt bij het zoeken naar dingen die juist niet passen. Misschien wordt er te veel gedacht vanuit datgene wat de computer wèl kan, namelijk het opzetten van een sluitende conversatie. Het lijkt mij veel interessanter om bijvoorbeeld een ruzie te modelleren."

Maar zoals bij zoveel takken van wetenschap, kost het 'opvoeden' van de computer tijd en dus geld. Nijholt: "Het gereedschap laat het misschien wel toe, maar er zijn heel veel mensen voor nodig. Met name informatici zijn pas geneigd om iets te doen wanneer het geld opbrengt, dus dan moet je er de industrie al achter hebben staan. Maar bovendien is, om echt flinke stappen vooruit te kunnen doen, hier samenwerking nodig tussen verschillende disciplines. Denk maar aan filosofie, biologie, neurologie, psychologie, taalkunde, kunstmatige intelligentie. Er staan nog steeds muren tussen al die afdelingen. Zoals zo vaak is er nog nauwelijks sprake van dat de ene wetenschapper weet wat de andere aan het doen is."

 

Een van de problemen is de dosering van grapjes bij de interactie tussen mens en computer. Wanneer een leek een 'intelligente', reagerende computer raadpleegt, moet de gebruiker het gevoel hebben op een prettige manier te worden geholpen. Nijholt: "Mag je dat ding zomaar allerlei grappen laten maken, of kap je dat af? Het is niet de bedoeling om de gebruiker te irriteren."

Nijholt laat zien wat hij bedoelt. Op zijn kamer legt hij verbinding met Internet. Studenten van zijn vakgroep zijn bezig met een grafisch informatiesysteem voor een schouwburg. Via Internet kan de bezoeker door de schouwburg wandelen, de zaal bekijken en een virtuele informatrice aanspreken, net als in werkelijkheid. Het bewegende figuurtje aan de balie is in staat om te reageren op uiteenlopende, door de gebruiker ingetypte vragen, zoals: 'wat staat er vanavond op het programma', of 'zijn er nog kaarten voor Tineke Schouten'. Abstractere vormen van vragen, zoals 'vertel eens iets leuks', zijn moeilijker te beantwoorden. Voorlopig zal het antwoord in de context van het programma van de schouwburg staan. De informatrice zal dan bijvoorbeeld reageren met: 'Op 10 september Youp van 't Hek. Op 5 oktober Herman Finkers'.

Nijholt: "We hebben nu de basis van dit systeem. De komende tijd gaan we kijken in hoeverre we ook de sociale omgeving mee kunnen laten spelen. Wanneer iemand een gezellig gesprekje begint, moet de computer daar op een bepaalde manier op inspelen. Je kunt niet volstaan met ingeblikte grapjes. En zelfs wanneer de computer iets onverwachts verzint, dan nog heb je mensen nodig om de scheiding tussen leuk en niet-leuk aan te brengen. We hebben bijvoorbeeld wel eens het script van een bankroof gekoppeld aan dat van een fast food-restaurant. Daar kwam dan de grap uit: 'Geef me al het geld uit de kassa - Jazeker, en wilt u er Franse frietjes bij?' Het toepassen van humor is afhankelijk van de gebruiker, van de context, van de geschiedenis die de gesprekspartners hebben opgebouwd tijdens de dialoog. Het is bijna een onmogelijke opgave om dat allemaal te reconstrueren. Want als je de computer dat allemaal hebt aangeleerd, dan heb je bijna een mens geschapen."