Waarom Talen En Dialecten - Dit Zijn Totaal Verschillende Dingen - Alternatieve Mening

Waarom Talen En Dialecten - Dit Zijn Totaal Verschillende Dingen - Alternatieve Mening
Waarom Talen En Dialecten - Dit Zijn Totaal Verschillende Dingen - Alternatieve Mening

Video: Waarom Talen En Dialecten - Dit Zijn Totaal Verschillende Dingen - Alternatieve Mening

Video: Waarom Talen En Dialecten - Dit Zijn Totaal Verschillende Dingen - Alternatieve Mening
Video: Waarom is Twents een dialect en het Nederlands een taal? (2/5) 2024, Mei
Anonim

Vaak hebben eenvoudige vragen complexe antwoorden. Bijvoorbeeld: wat is het verschil tussen taal en dialect? Als u besluit hierover een taalkundige te vragen, leun dan achterover. Hoewel er op het eerste gezicht niets moeilijks aan deze vraag is, kan deze op verschillende manieren worden beantwoord.

Het onderscheid tussen taal en dialect kan afhangen van een of ander standpunt. Vanuit politiek oogpunt is taal wat de mensen gewoonlijk als natie spreken. Zo bestond van 1850 tot 1992 de zogenaamde Servo-Kroatische taal, die verschillende dialecten omvatte, waaronder Servisch, Kroatisch en Bosnisch. Maar nadat Joegoslavië halverwege de jaren negentig in verschillende onafhankelijke staten was gesplitst, werden deze dialecten als afzonderlijke talen erkend. Deze politieke definitie werkt gedeeltelijk, al brengt het meer problemen dan oplossingen met zich mee: er zijn talen die in verschillende landen worden gesproken, een treffend voorbeeld hiervan is Spaans in Latijns-Amerika. Niemand zou beweren dat Mexicaans Spaans en Colombiaans Spaans verschillende talen zijn. Mogelijk Spaans, gesproken in delen van Spanje,zo verschillend van zijn Latijns-Amerikaanse variëteiten dat het een aparte taal verdient te worden genoemd, maar dit is niet helemaal duidelijk.

Wat als we de grens trekken tussen taal en dialect, geleid door het criterium van wederzijds begrip? Helaas is deze aanpak ook niet ideaal. Een Deen zal Zweeds iets beter verstaan dan een Zweed - Deens. Evenzo zal iemand die het specifieke boerendialect Brits-Engels spreekt, een Amerikaan uit Los Angeles veel beter begrijpen dan een Amerikaan. Wederzijds begrip hangt vaak af van externe factoren - ze zijn een nogal oncontroleerbare variabele - en niet van inherente eigenschappen van de taal zelf.

Dus misschien moeten we een puur linguïstische benadering kiezen. Stel je voor dat we het verschil (D) tussen twee spraakvarianten systematisch kunnen meten. De specifieke betekenis van D zou ons dan in staat stellen de grens tussen twee dialecten en twee talen te definiëren. Het vinden van een dergelijke waarde zou niet erg moeilijk moeten zijn, aangezien de twee talen kunnen worden vergeleken op basis van veel criteria, zoals een degelijke inventaris, grammaticale kenmerken of woordenschat.

Maar wat als de verschillen tussen spraakvariaties geleidelijk zijn en de kans om een bepaalde waarde van D te vinden even groot is als de kans om een andere waarde te vinden? Dan zouden we een willekeurige waarde van D als uitgangspunt moeten kiezen, en een willekeurige waarde zou ons terugbrengen naar overwegingen van politieke of praktische aard die we niet van plan waren te overwegen. Willen we dat onze breuklijn op het niveau ligt waarop Servisch en Kroatisch verschillende talen of één zijn? Als we de talen van de wereld catalogiseren, hoeveel duizenden talen willen we in de vergetelheid laten: vijf? Of zeven? Misschien tienduizend?

In de afgelopen jaren zijn twee belangrijke obstakels bij het onderscheiden van taal en dialect overwonnen. De eerste is hoe je de verschillen tussen spraakvarianten kunt meten - dat wil zeggen: vind een waarde voor D. In 2008 creëerde een groep linguïsten het Automated Similarity Judgement Program (ASJP), waarvan een dagelijkse curator en oprichter echt van jou is. De ASJP heeft nauwgezet een systematische taalvergelijkingsdataset opgesteld die momenteel 7655 woordenlijsten bevat. Ze zijn relevant voor twee derde van de talen in de wereld, ervan uitgaande dat talen voor onze doeleinden worden gedefinieerd door de ISO 639-3-standaardcode. Omdat elke woordenlijst een vaste set van 40 concepten bevat die consistent worden geïnterpreteerd, is het gemakkelijk om ze te vergelijken en zo een maat te krijgen voor het verschil. De meest gebruikte maatstaf voor het verschil tussen twee woorden is de Levenshtein-afstand, een term die genoemd is naar Vladimir Levenshtein, een Sovjetwetenschapper die in 1965 een algoritme ontwikkelde voor het vergelijken van twee tekenreeksen. Hij definieerde "spacing" als het minimum aantal vervangingen, invoegingen en verwijderingen dat nodig is om de ene regel in de andere te veranderen. De Levenshteinafstand kan zinvol worden gedeeld door de lengte van de langste van de twee lijnen, en dus alle afstanden op een schaal van 0 tot 1 zetten. Dit fenomeen staat bekend als de genormaliseerde Levenshteinafstand, of LDN. Hij definieerde "afstand" als het minimum aantal vervangingen, invoegingen en verwijderingen dat nodig is om de ene regel in de andere te veranderen. De Levenshteinafstand kan zinvol worden gedeeld door de lengte van de langste van de twee lijnen, en dus alle afstanden op een schaal van 0 tot 1 zetten. Dit fenomeen staat bekend als de genormaliseerde Levenshteinafstand, of LDN. Hij definieerde "afstand" als het minimum aantal vervangingen, invoegingen en verwijderingen dat nodig is om de ene regel in de andere te veranderen. De Levenshteinafstand kan zinvol worden gedeeld door de lengte van de langste van de twee lijnen, en dus alle afstanden op een schaal van 0 tot 1 zetten. Dit fenomeen staat bekend als de genormaliseerde Levenshteinafstand, of LDN.

Het tweede obstakel is dat "taal" en "dialect" misschien begrippen zijn die alleen in willekeurige volgorde kunnen worden gedefinieerd. Hier hebben we heel bemoedigend nieuws voor je. Als we kijken naar alle taalfamilies in de ASJP-database, waar de projectdeelnemers een aanzienlijk deel van nauw verwante variëteiten hebben opgenomen, kunnen we beginnen te zoeken naar verschillende soorten gedrag van talen en dialecten. Een intrigerend beeld doet zich voor: de afstanden fluctueren in de regel ofwel rond een relatief kleine waarde, ofwel rond een relatief grote waarde, en daartussen vormt zich een depressie. Het blijkt dat deze trog meestal in een smal bereik ligt, gemiddeld ongeveer 0,48 LDN. We zullen geen ongelijk hebben als we zeggen dat spraakvarianten in hun basisvocabulaire meestal niet gedeeltelijk op elkaar lijken. Ofwel is er een tendens naar meer gelijkenis, in welk geval de spraakvarianten kunnen worden gedefinieerd als verschillende dialecten, ofwel naar minder gelijkenis - in welk geval ze kunnen worden toegeschreven aan verschillende talen. Hier ligt de grens tussen taal en dialect.

Dit fenomeen is waarschijnlijk het gevolg van sociale omstandigheden. Dialecten lopen uiteen naarmate mensen zich vestigen in nieuwe gebieden en nieuwe identiteiten vormen, maar als er nog steeds enig contact tussen hen is, kan convergentie plaatsvinden zodat spraakvarianten voor meer dan 50 procent vergelijkbaar blijven (en dus spraak is ongeveer één taal). Een lichte duw in de richting van divergentie kan er echter voor zorgen dat taalvarianten relatief snel divergeren, waardoor de Levenshtein-afstand toeneemt, in welk geval we ze als afzonderlijke talen kunnen kwalificeren. Er kan een verband bestaan tussen de grens voor de afstanden tussen woorden in de standaardlijst die door ASJP wordt gebruikt en de overeenkomstige afstanden in andere delen van de taalstructuur, wat kan leiden tot ernstig verlies van begrip. Met andere woorden,de drempel van begrip kan correleren met de drempel tussen talen en dialecten. We hebben deze kwestie nog niet bestudeerd, maar als object voor onderzoek is het buitengewoon interessant.

Promotie video:

Als we tot een objectief in plaats van willekeurig criterium zijn gekomen om talen van dialecten te scheiden, kunnen we het toepassen op de talen van de wereld. Sommige paren van spraakvariëteiten die als nationale talen worden beschouwd, zoals Bosnisch en Kroatisch, liggen ver onder de LDN-drempel van 0,48 (wat betekent dat ze dezelfde taal zijn, ongeacht het bestaan van Joegoslavië). Niet ver van deze drempel liggen talen als Hindi en Urdu (ze kunnen nauwelijks twee verschillende talen worden genoemd). En varianten van Arabisch en Chinees, die vaak als dezelfde talen worden beschouwd, stijgen boven LDN = 0,48 (deze varianten zijn afzonderlijke talen). In feite zijn er verschillende paren variëteiten die gewoonlijk als verschillende talen worden beschouwd, maar fluctueren op de grens: bijvoorbeeld Deens en Zweeds, die een LDN van 0,4921 hebben.

Ten slotte kan een techniek die is afgeleid van datasets, ASJP-chronologie genaamd, worden toegepast om de hoeveelheid tijd vast te stellen die dialecten nodig hebben om ver genoeg van elkaar verwijderd te zijn om als afzonderlijke talen te worden beschouwd. Het resultaat dat we vonden is 1059 jaar, als we geen rekening houden met een fout. Deze bevindingen worden ondersteund door hoe lang het gewoonlijk duurt voordat de generieke taal van een taalfamilie uiteenvalt in dochtertalen, die later de voorouders van subfamilies worden. Hiervoor hebben we andere analysemethoden nodig, maar de resultaten zijn vergelijkbaar: het duurt ongeveer een millennium om dialecten in talen om te zetten. We weten dit omdat we nu het ene van het andere kunnen onderscheiden.

Søren Wichmann is een Deense taalkundige die samenwerkt met de Universiteit Leiden (Nederland), de Kazan Federale Universiteit (Rusland) en de Peking Linguistic University (China). Zijn laatste boek, Temporal Stability of Linguistic Typological Features (2009), is geschreven in samenwerking met Eric W. Holman.

Aanbevolen: