Tagarchief: vreemdetalenonderijs

Grammatica of Lexicon 8

Over de vraag op wat voor kennis we onze correctheid van vorm baseren

Aflevering 8: De verwerving van waarschijnlijkheidskennis

In het voorafgaande bleek het cognitieve voordelen te hebben om gebruik te maken van kennis over de statistical tendency to co-occur van woorden en vormen. Ik heb dat waarschijnlijkheidskennis genoemd. De vraag was hoe zulke kennis tot stand komt. Om dat uit te leggen moet ik even uitweiden over de werking van ons geheugen. Met name over de vraag hoe de daarin aanwezige kenniselementen ‘in elkaar zitten’. Over dit soort processen heb ik uitvoeriger geschreven in Westhoff (2009) https://www.stedelijkonderwijs.be/sites/default/files/bestand/het%20geheim%20van%20de%20flipperkast.pdf

Heel in het kort gezegd komt dat op het volgende neer:

Anders dan lang is aangenomen, bestaan de dingen die wij weten niet uit afzonderlijke min of meer afgeronde gehelen. Wij hebben niet een plaatje in ons hoofd van het concept ‘roos’ of ‘slag bij Waterloo’. Wat we weten hebben we opgeslagen in de vorm van een soort netwerken van aan elkaar verbonden eigenschappen of kenmerken. Zulke kenmerken zijn nogal ongelijksoortig. Ze kunnen iets zeggen over de betekenis van zo’n kenniselement (semantische kenmerken). Zo weten we dat een roos een plant is, lekker ruikt, doorns heeft, etc., maar ook dat hij als symbool voor de arbeidersstrijd wordt gebruikt (roos in de vuist) en in de poëzie vaak staat voor schoonheid en liefde. Maar van het concept ‘roos’ kennen we ook morfologische eigenschappen. Bv dat het een meervoud heeft op –en ( “één roos, een bos rozen”) en dat die –s- dan een –z- wordt. We kennen er syntactische eigenschappen van, zoals dat het in zinsverband als onderwerp en als lijdend voorwerp kan voorkomen maar niet als gezegde of als bijvoeglijk naamwoord. En zo zijn er nog een aantal categorieën van eigenschappen die samen het netwerk ‘roos’ vormen. Een in dit verband zeer relevante  categorie is onze kennis dat je ‘roos’ goed kunt combineren met het woord ‘rood’ en slecht met ‘vloeibaar’, enz. (collocatie-kennis) Wat algemener geformuleerd: van de woorden die we kennen weten we ook iets over de waarschijnlijkheid van mogelijke combinaties met andere woorden (en vormen).

In een netwerk zijn de verschillende kenmerken met elkaar verbonden. Daardoor kan een concept vanuit elk kenmerk geactiveerd worden. Om het concept ‘roos’ op het beeldscherm te krijgen kun je dus beginnen met het wakker maken van het kenmerk ‘heeft doorns’, maar je kunt ook beginnen bij het kenmerk ‘geur en maneschijn’ of bij ‘1 mei’. Maar wat uiteindelijk opdoemt wordt niet alleen bepaald door de samenstellende onderdelen. Met name de dikte ertussen is bepalend voor het uiteindelijk resultaat. Wat kort door de bocht: hoe dikker de verbinding, des te pregnanter wordt dat kenmerk in de betekenis die we aan dat netwerk hechten en des te sneller wordt het kenmerk opgeroepen. Dat maakt de vraag interessant hoe die dikte ontstaat.

Een verbinding tussen verschillende kenmerken ontstaat doordat er in het werkgeheugen aan die kenmerken in combinatie met elkaar wordt gewerkt. Die bewerking laat een spoor na in de vorm van een verbinding. Elke keer als een bepaalde combinatie in zo’n netwerk in het werkgeheugen wordt bewerkt, wordt de verbinding van die combinatie met het netwerk dikker.

Kort en simpel gezegd: kennis over de waarschijnlijkheid van combinaties van woorden  met woorden en van woorden met vormen, ontstaat doordat ons brein bijhoudt hoe vaak een bepaalde combinatie in het werkgeheugen is bewerkt. Dwz. dat een combinatie makkelijker correct geproduceerd zal worden, naarmate hij in de input vaker is voorgekomen. Omgekeerd, als we hem weinig zijn tegengekomen, dan is de combinatie moeilijk terug te vinden. We moeten dan terugvallen op creative speech en dat levert vaak weinig op.

Een voorbeeld van dat fenomeen is, dat een vorm als “Gib mal her!” door Nederlanders bijna altijd zonder nadenken goed wordt gezegd, terwijl je aarzeling ziet in de zeer zeldzame gevallen waarin er van die gebiedende wijs de meervoudsvorm gevraagd wordt. (Is het nu “Gibt –  of Gebt mal her”?). Met behulp van de netwerktheorie is dat als volgt te verklaren: Je hebt voor e/i-Wechsel bij sterke werkwoorden in de gebiedende wijs enkelvoud en meervoud ooit een regel gehad. Maar die ben je al lang vergeten, want die heb je na die ene invuloefening nooit meer gebruikt.  “Gib mal” construeer je op grond van waarschijnlijkheidskennis die je hebt opgebouwd doordat die vorm vaak in de input aanwezig is geweest en daardoor een dikke verbinding heeft veroorzaakt. Maar die gebiedende wijs meervoud komt in gangbare input nauwelijks voor. Voor die spreekintentie wordt in het Duitse taalgebruik bijna altijd de beleefdheidsvorm gebruikt. Dus is er voor de vorm van het meervoud geen of nauwelijks een verbinding gevormd. Bij gevolg maakt die vorm niet of nauwelijks deel uit van het netwerk ‘geben’.

Zo kun je ook verklaren waarom Nederlanders moeiteloos “Verstehst du?” zeggen en desgevraagd vaak pas na enig aarzelen, wat onzeker “Stiehlst du?” weten te produceren (als al). Als je denkt dat we zulke vormen via creative speech construeren is dat onlogisch. “Verstehst du?” is immers een ingewikkelde uitzondering (wél sterk werkwoord, toch geen e/i-Wechsel), terwijl “Stiehlst du?”  volkomen regelmatig is (sterk, dus e/i-Wechsel).  Als je er van uitgaat van we taal construeren via het toepassen van grammaticaregels zou dat laatste dus makkelijker moeten zijn. In de praktijk blijkt het omgekeerde. Het is in cognitieve zin veel voordeliger om de regels maar de regels te laten en je vanwege de cognitieve economie te beperken tot ‘kennis’ over de waarschijnlijkheid van combinaties.

Dat geldt niet alleen in zulke specifieke gevallen. Het kan ook in wat algemenere vorm. Zo ´leren´ we bv. door de verwerking van veel input dat de kans dat in het Duits “zu ” met “der”, “dem” of “den” wordt gecombineerd oneindig veel groter is dan met “die”, of “das”. Bij dit laatste type, op grond van veel inputverwerking opgebouwde waarschijnlijkheidskennis begin je al aardig in de buurt te komen van wat we grammaticaregels plegen te noemen, al zijn dat nog steeds niet de systematische overzichten van verschijnselen zoals wij die achtereenvolgens in onze schoolboeken plegen te behandelen.

Er is kortom tussen chunks aan de ene kant en aan de andere kant het toepassen van ingewikkelde regels zoals die over het gebruik van de Engelse werkwoordstijden of het kiezen tussen ser en estar een heel groot gebied van tussenvormen die door ons brein deels als chunk, deels als quasi-chunk, op basis van waarschijnlijkheidskennis, deels als creative speech worden behandeld. Voor één en dezelfde vorm kan dat ook nog per persoon verschillen. Als een bepaalde constructie bij iemand telkens weer voorkomt wordt het voordeliger om die als chunk in het lexicon op te slaan, terwijl dat bij iemand anders niet lonend is, omdat hij bij die persoon zo weinig voorkomt dat het efficiënter is om hem in die zelden voorkomende gevallen maar even langs de ingewikkelde weg in elkaar te zetten.

Dat brengt ons bij de vraag of er ook iets te zeggen valt over wanneer je beter voor het één dan wel voor het ander kunt kiezen. Daarover in de volgende aflevering.

Literatuur

Westhoff, G. (2009). Leren overdragen of het geheim van de flipperkast. Elementaire leerpsychologie voor de onderwijspraktijk. Biezenmortel: MesoConsult.

 

Advertenties

Grammatica of Lexicon 7

Over de vraag op wat voor kennis we onze correctheid van vorm baseren

Aflevering 7: De rol van waarschijnlijkheidskennis

Wat voor kennis gebruiken we bij het produceren van formeel ‘correcte’ taaluitingen? Dat was de vraag. In veel gevallen bleken we dat te doen zonder toepassing van regels. Uit efficiency-overwegingen bleek ons brein telkens te proberen of het niet langs een directere weg, zonder die regels kan. Regels alleen voor zover het echt niet anders kan. Het Needs Only Analysis (NOA) principe.

Het duidelijkst lukt dat bij ‘echte’ chunks van het type ‘Je vous en prie’, ‘How do you do’ of ‘Herzlichen Dank’. Combinaties die één geheel vormen, als zodanig zijn te begrijpen en niet variabel zijn. Maar zulke Morpheme Equivalent Units bleken ook een soort open einde te kunnen hebben waar je dingen aan vast kon plakken. Type ‘Sauriez-vous me dire …’, of  ‘Ich wüsste gern …. ‘ Voor de aanvulling tot een hele zin moet je misschien wel nog een regel gebruiken, maar de eerste helft kan zonder.

Maar ook voor de combinatie zelf bleek ‘niet variabel’ een rekbaar begrip. In op zich variabele gevallen kunnen bepaalde combinaties veel frequenter zijn dan overige mogelijkheden. Zo veel frequenter dat het interessant begint te worden zo’n combinatie, hoewel geen ‘echte’ chunk, toch als zodanig te behandelen. Quasi-chunks als Zell am See of ‘Können Sie mir helfen’.

In dit soort gevallen gaat het om bundles of words that show a statistical tendency to co-occur  (Jones & Haywood, 2004, p. 274f.). Oftewel: kennis over de waarschijnlijkheid van te verwachten combinaties. In veel gevallen gaat het er dan om met hoeveel waarschijnlijkheid een bepaald woord zal volgen.  Concreet: we weten dat na “May I ask you a …” met aan zekerheid grenzende waarschijnlijkheid het woord “question” of het woord “favour” zal volgen. Dat na “Darf ich Sie etwas …” weinig anders kan komen dan “fragen”. Dat hoeft niet zo veel implicaties voor de vorm te hebben.

Maar soms is dat wél het geval. Na “Mit freundlich…” komt onder een brief met zeer grote waarschijnlijkheid “…en Grüssen”. Hoe groot die waarschijnlijkheid is kan iedereen makkelijk nagaan door te kijken wat er op Google verschijnt als je die eerste woorden intypt. Ook hier is het voor ons werkgeheugen minder belastend om  “Mit freundlichen Grüssen” kant en klaar uit de opgeslagen kennis over de waarschijnlijkheid van combinaties op te diepen, dan om alle regels rond de voorzetsels met de derde naamval te raadplegen en toe te passen.

Maar onze kennis van de genoemde tendency to co-occur heeft niet alleen betrekking op het met-elkaar-voorkomen van een woord met een ander woord in een bepaalde vorm. We hebben ook kennis van de waarschijnlijkheid van de co-occurance van woordcombinaties met de vorm van elk woord dat er op volgt. Gries (2008) noemt als voorbeelden o.a. onze kennis dat na de frase “Would you mind…” een werkwoord in de –ingvorm staat (bv. “closing the window”).  Je kunt voor het Nederlands ook denken aan “Ik ben aan het …” waarop altijd een infinitief zal volgen. Kennis over dit soort waarschijnlijkheid is een vorm van kennis óver taal. In feite gaat het daarbij dus om regels. Volgens sommigen dus gewoon “just another grammar”.

Tussen die regels en die uit onze schoolgrammatica’s zijn overeenkomsten en verschillen. Enerzijds voorspellen ze, net als in de schoolgrammatica wel wat er in een onbepaald aantal voorkomende gevallen met de vorm moet gebeuren. Maar, anders dan bij de taalkundige grammatica bieden ze geen absolute zekerheid en vormen ze geen logisch systeem. Ze staan op zich en zijn gebaseerd op ervaren waarschijnlijkheid, niet door taalkundige logica.

Er is nog een wezenlijk verschil. Bij grammaticaregels gaat het om (algoritmische) kennis over wetmatigheden. Regels van het type: “In geval zus, doe zo.” Bij kennis over co-occurance gaat het om (heuristische) kennis over de waarschijnlijkheid waarmee je iets kunt verwachten. Doordat we combinaties als “Zell am See” vaak zijn tegen gekomen, ontwikkelen we bv. de verwachting dat “Frankfurt am Main”, maar ook “ein Haus am Markt”  waarschijnlijker is dan bv. “Frankfurt ans Main” resp. “Haus ans Markt”. Dat weten we minder zeker dan in het geval “Darf ich Sie etwas…” plus fragen of bitten. Hoe groot de rol van dit soort waarschijnlijkheidskennis is bij lezen, is al heel lang bekend (Zie bv Westhoff, 1981). Maar het lijkt dus erg waarschijnlijk dat het bij het produceren van taal niet veel anders is.

Maar met dit soort toepassing van kennis over de waarschijnlijkheid van te verwachten vormen beginnen we toch aardig in de buurt van kennis en toepassing van gangbare schoolgrammaticaregels te komen. Gegeven het regelkarakter, zou je je kunnen afvragen in hoeverre dit soort kennis in het lexicon zit of in het grammatica-compartiment is opgeslagen. Misschien valt de grens tussen lexicaal en grammaticaal wel niet zo scherp te trekken. Misschien zijn de hierboven achtereenvolgens beschreven stations op Wray’s continuum van formulaic naar creative speech (Wray, 2008) ook te zien als stadia op een schaal van lexicaal naar regelkennis.

Maar eerst even terug naar de beschreven kennis over de waarschijnlijkheid van combinaties. Als dit soort kennis zo’n belangrijke rol speelt wordt het interessant na te gaan hoe we die verwerven. Het lijkt geen expliciet onderwezen kennis van het type: ‘Pas op: Na het woord x is de kans 83% dat woord y zal volgen met als vorm z. Maar hoe dan wel? Daarover in de volgende aflevering meer.

Literatuur

Gries, S. T. (2008). Phraseology and linguistic theory: A brief survey. In S. Granger & F. Meunier (Eds.), Phraseology  An interdisciplinary perspective (pp. 3-25). Amsterdam: John Benjamins.

Jones, M., & Haywood, S. (2004). Facilitating the acquisition of formulaic sequences: An exploratory study in EAP context. In N. Schmitt (Ed.), Formulaic Sequences. Acquisition, processing and use (pp. 269-292). Amsterdam Benjamins.

Westhoff, G. J. (1981). Voorspellend lezen. Een didactische benadering van de leesvaardigheidstraining in het moderne-vreemdetalenonderwijs. Groningen: Wolters Noordhoff.

Wray, A. (2008). Formulaic Language: Pushing the Boundaries. Oxford: Oxord University Press.

 

 

Grammatica of Lexicon 3

Over de vraag op wat voor kennis we onze correctheid van vorm baseren

 

Aflevering 3: Stuurt de grammatica spraakgebruik of  bepaalt taalervaring wat we als correct ervaren?

De vraag was: produceert iemand die ‘he can’ zegt, gewoon een als zodanig gekende woordcombinatie (uit het lexicon dus)? Of construeert hij een vorm van de grammaticale structuur ‘de modale hulpwerkwoorden’? In dat laatste geval moeten we elke in de correcte  vorm geproduceerde taaluiting altijd zien als exponent van een grammaticale structuur. Uit de vorige aflevering bleek dat je daar nogal wat kanttekeningen bij kunt plaatsen. In allerlei gevallen bleken ‘grammaticaal correcte’ vormen geproduceerd te kunnen worden zonder kennis van het betreffende ‘verschijnsel’. Komt alles dus gewoon uit het lexicon?

Ook daar kun je kanttekeningen bij maken. Driejarigen blijken morfologisch correcte zinnen te kunnen maken die ze nog nooit eerder zijn tegengekomen. Die vormen kunnen ze dus niet kant en klaar uit het lexicon hebben gehaald. Gebruiken ze dus toch een soort algemene regels? Regels van een ‘hogere orde’ dan het lexicale niveau? Maar hoe komen ze daar dan aan en gebruik je die regels in alle gevallen van morfologische variatie? (Zoals het construeren van de vorm ‘hoorde’ terwijl je alleen de vorm ‘horen’ kent.) En vormen zulke regels een samenhangend systeem, grammatica genaamd, dat onze taalproductie ‘regeert’? Een systeem, dat als het ware ‘boven’ de taalgebruiker staat in de vorm van een min of meer autonoom geheel van ‘wetten’ die de taal regeren zoals de natuurwetten de natuur. Er zijn verschillende redenen om je af te vragen of dat wel zo in zijn werk gaat.

Als zo’n regel deel uitmaakt van een min of meer autonoom systeem dat we niet zelf maken maar dat onafhankelijk is van onze luimen en grillen en dat we ons eigen moeten maken ‘zoals het is’, hoe kan het dan dat zo’n regel verandert in de loop van de tijd? Hoe moet je in dat geval bv. verklaren dat Van Lennep in de 19e eeuw “U” in de 1e naamval nog fout vond. (“U”, dat was volgens de schoolmeesters van toen de vorm voor de accusatief. De taaluiting ‘U maakt een fout.’ vond hij net zo verwerpelijk als velen van u de zin ‘Hun maken een fout’. De nominatief moest “Gij” zijn. Dus volgens Van Lennep:  ‘Gij maakt een fout.’ En ‘Ik berisp u daarom.’)

Hoe komt het dat in onze tijd nog maar weinig mensen de ‘fout’ horen in de zin “Als kinderen allemaal van elkaar verschillen, moet je ze niet allemaal gelijk aanpakken.” Terwijl mijn vader, een hoofdonderwijzer van de oude stempel, onder dat “ze” nog een dikke, rode streep zou hebben gezet. (“Kinderen zijn personen en geen zaken!!!”)  Wij zijn er kennelijk zo ‘aan gewend geraakt’ om “ze” ook voor personen in de 4e naamval te gebruiken, dat nog maar weinigen dat als fout waarnemen. Sterker nog: naar mijn ervaring bestaat zelfs onder diegenen die dat desgevraagd nog wel doen, de neiging om het ‘correcte’ “hen” te reserveren voor schriftelijk taalgebruik. Uitgesproken klinkt het niet lekker. Überhaupt kom ik in mondeling taalgebruik nog maar heel zelden “hen” tegen. Als het al voor komt klinkt het stijf en formeel. “Hun” daarentegen als 1e naamval meervoud voor personen (bij zaken wordt nog altijd uitzonderingsloos keurig ‘ze’ gezegd) is duidelijk aan een inburgeringstraject bezig. Over enkele decennia zal men niet eens meer begrijpen waar de schoolmeesters van nu het over hadden.

Dat regels door het gebruik zo moeiteloos blijken te kunnen veranderen rijmt slecht met de idee van grammatica als min of meer autonoom, productiesturend systeem, dat de basis of het geraamte van een taal vormt. We kunnen de regels voor de breking van het licht door een prisma toch ook niet veranderen “omdat de kleuren van regenboog niet meer zo goed in het modebeeld passen”?

Die schijnbaar autonoom functionerende  grammaticaregels blijken niet zo autonoom. Ze zijn kennelijk nogal afhankelijk van wat de gebruikers doen. In plaats van een samenhangend systeem lijkt die zogenoemde grammatica eerder een betrekkelijk arbitrair geheel van, soms nogal willekeurige afspraken, die je in principe naar believen kunt aanpassen. Afspraken van het type: “Hoe zeg je dat? Nou ja, gewoon: zo en zo …” Die afspraken hebben vaak een lange geschiedenis en hun functionaliteit verandert. Door ontwikkelingen of invloeden van buiten duiken nieuwe, wellicht handiger of efficiënter mogelijkheden op. En die raken dan snel ingeburgerd.

Het lijkt er verder op dat die afspraken nogal ongelijksoortig kunnen zijn. Soms hebben ze betrekking op een klasse van gevallen (Bv. dat we afspreken dat ‘hij’ als lijdend voorwerp altijd ‘hem’ wordt). Maar er zijn ook nogal wat afspraken zijn die maar voor één enkel geval gelden. (Waarom zeggen we wel “mijns inziens” en niet “mijns begrips”?

Soms lijken ze ook nogal willekeurig en weinig consequent. Waarom zeggen we in het Engels bv. als we iets absoluut niet willen: “That is out of the question”. Maar als we iets wél willen zeggen we niet: “That is into the question”? En trouwens, waarom schrijven we “out of” in twee woorden en “into” als één woord.? Nou gewoon: dat zeggen cq. schrijven we zo. En hoe weten we dat? Nou, gewoon, dat hebben we altijd zo gehoord of gelezen. Niet onze kennis van het systeem stuurt het gebruik, maar de frequentie van het door ons waargenomen gebruik bepaalt het systeem.

Je zou je zelfs kunnen afvragen of de grammatica als min of meer autonoom, samenhangend systeem van regels, zoals wij dat in ons onderwijs aanbieden, in die vorm überhaupt wel bestaat in het brein van de taalgebruiker. Of dat het een artefact is, geconstrueerd door taalkundigen, bedacht om de taal makkelijker te kunnen bestuderen en over de resultaten daarvan met elkaar te communiceren? Terwijl ons oordeel over de correctheid van taaluitingen gewoon het product is van nogal gevarieerde en ongelijksoortige ervaringskennis?

De veronderstelling dat kennis van wat correct taalgebruik is, minstens in een flink aantal gevallen is gebaseerd op ‘wat je vaak hebt gehoord of gelezen’ is speculatief. Maar in uitkomsten van allerlei onderzoek over de werking van ons brein zijn aanknopingspunten te vinden die deze aanname ondersteunen en in een aantal opzichten verklaren. Daarover meer in de volgende afleveringen.