Aanvraag pilot automatische analyse goedgekeurd

Vorige week werd bekend dat de aanvraag voor een pilotproject over de automatische analyse van causale connectieven in het kader van Clariah is goedgekeurd. De aanvraag is een samenwerking van Erwin Komen en Henk van den Heuvel (Humanities Lab, Radboud Universiteit), Ted Sanders (Universiteit Utrecht), Marc Kemps-Snijders (Meertens Instituut) en Wilbert Spooren.

Doel van het project is om een omgeving te maken waarin tekstwetenschappers zonder programmeerervaring een automatische analyse van causale voegwoorden kunnen uitvoeren. Binnen het project ontwikkelen we daartoe een interface, die ook voor andere corpusonderzoeksvragen geschikt is. Met de opbrengst van het project wordt het mogelijk om onderzoeksvragen die traditioneel met handmatige kleinschalige analyses worden beantwoord (zoals “hoe verschilt de subjectiviteit van verschillende causale voegwoorden in het Nederlands in verschillende genres?”) op veel grotere schaal te beantwoorden. Daarvoor maken we gebruik van verschillende Clariahcomponenten, zoals het SoNaR-corpus (500 miljoen woorden hedendaags geschreven Nederlands) en het VU-DNC corpus (2 miljoen woorden krantentaal uit 1950 en 2002). De interface maakt gebruik van de onderzoeksomgeving CorpusStudio, die door Erwin Komen is ontwikkeld.