Godverdomme lastig die wetenschap

Door Hanne van Uden

Hoe reageer jij als iemand vloekt? Misschien krijg je er een onprettig gevoel van en wil je de vloeker hierop aanspreken, of misschien ben jij juist zelf de grote vloeker op het feestje van tante Bep. Persoonlijk krullen mijn mondhoeken omhoog bij het horen van vloekwoorden. Op feestjes en partijen zit ik graag naast de hevige vloeker. Extra leuk vind ik het als de vloeker ook nog eens woorden gebruikt die ik nog niet gehoord heb. Tijdens mijn stage kan ik mijn vloekhartje ophalen: ik doe namelijk onderzoek naar vloeken.

Wat doe ik?

Voor mijn stage bekijk ik het gebruik van vloek- en scheldwoorden in recente Nederlandse literatuur. Daarvoor gebruik ik een dataset die bestaat uit 125 boeken. Deze boeken zijn de romans van Nederlandse auteurs die in 2013 in aanmerking kwamen voor de Libris Literatuurprijs. Er is al eerder onderzoek gedaan op basis van deze dataset en dat leverde een prijswinnend artikel op. Ik bekijk welke krachttermen in de dataset voorkomen en hoe ze zich gedragen. Wat voor soort krachtterm is het bijvoorbeeld, een ziekte of een godslastering? Komt de krachtterm het vaakst achteraan of juist vooraan in de zin voor? Daarnaast bekijk ik hoe vaak en op wat voor manier de scheldwoorden gebruikt worden. Dit soort corpusonderzoek wordt naar vloeken bijna niet gedaan, en al helemaal niet in het Nederlands. Heel interessant dus!

Antconc

Om mijn onderzoek uit te voeren gebruik ik een programmaatje dat AntConc heet. AntConc is een concordantieprogramma, maar eigenlijk is AntConc gewoon een supergeavanceerde ctrl+F. Je voert namelijk een woord in en het programma zoekt in je gehele dataset naar dit woord. In ongeveer tien seconden heeft AntConc alle voorkomens van ‘kutzooi’ in alle 125 romans gevonden. Tenminste, als alles goed gaat. Op mijn eerste stagedag opende ik het programma en laadde ik de boeken. Ik wachtte en ik wachtte en toen gebeurde er… niks. De boeken stonden in het verkeerde formaat, dus alle 125 bestanden moesten omgezet worden naar het juiste formaat voordat AntConc ze überhaupt kon lezen. Je zou denken dat dit zo gepiept zou zijn, maar niets bleek minder waar.

Problemen oplossen

Het heeft een hele stagedag geduurd voordat alle bestanden leesbaar waren voor AntConc. Nu moet ik toegeven dat ik graag meer zou willen leren over programmeren en het formaatprobleem leende zich hier uiteraard voor. Ik schreef dus een eenvoudig script dat alle bestanden inlas en omzette naar het juiste formaat. Uiteindelijk zagen de resultaten voor ‘kutzooi’ er zo uit:

Ik heb zelfs zo vroeg in de wetenschap al een belangrijke les geleerd: je denkt misschien dat je gewoon kunt beginnen als je de data hebt, maar er komt altijd nog veel meer bij komt kijken dan je vooraf had verwacht. Het tweede wat ik geleerd heb is het scheldwoord ‘Bijenkorfpunk’. Een bijenkorfpunk is een onechte punk. Het leren van dit soort leuke scheldwoorden geeft me motivatie om door te gaan als het programma AntConc me in de steek laat. Hopelijk zitten er nog meer mooie scheldwoorden in mijn dataset!