A nyelvkódok, mint közös nyelv

A szabványok segítenek abban, hogy az élet számos területén megtaláljuk a közös nyelvet, legyen ez akár a bolti pénztár, egy műtéti eszköz pontos azonosítása vagy egy nemzetközi szállítmány útjának nyomon követése. De hogyan találjuk meg a közös nyelvet a világban beszélt nyelvek elképesztően szerteágazó dzsungelében? Ezt járjuk körbe az anyanyelv nemzetközi napján.

Az egyik nehézséget az okozza, hogy még egy tapasztalt nyelvész is nehezen tudna határvonalat szabni a számtalan nyelv és nyelvváltozat között. Milyen ismérvek alapján lehet eldönteni egy adott nyelvről, hogy az csupán egy nyelvváltozat vagy önmagában is tekinthető külön nyelvnek? 

Egyes nyelvek megértik egymás szókincsét és mondatszerkezeteit, mégis külön nyelvnek tekintjük őket, mint például a dánt és a norvégot. Ugyanakkor vannak olyan nyelvek, amelyek egyes variánsai már olyan mértékben módosultak, hogy nehézséget okoz annak értelmezése egy ugyanazon nyelvcsalád másik variánsát beszélő személy számára. Erre jó példa lehet akár a német, akár az angol nyelv.

Ennek következtében ugyan egyszerű kérdésnek tűnhet, hogy hány nyelv van a világon, mégis számos tényező figyelembevételével sem lehet egzakt választ adni rá. Egy dolog azonban bizonyos: komoly feladat előtt álltak azok, akik először megkísérelték valamilyen szabványba foglalni a világon létező nyelveket.

De miért volt szükség a nyelvek szabványosítására?

Már a digitális korszak hajnalán megjelent az igény egy olyan általánosan elfogadott rendszerre, melynek segítségével adatbázisokban, könyvtárakban, majd később különböző lokális alkalmazásokban lehetőség van az egyes nyelvek szerinti variánsok, tartalmak megjelenítésére, megőrzésére. Ez az igény a technológia fejlődésével, az internet és az azt támogató számítógépes nyelvek terjedésével csak egyre növekedett. Hétköznapi életünkbe is számtalan módon épülnek be a nyelvkódok, elég csupán egy olyan oldalt meglátogatni, melynek külön nyelvváltozatai elérhetők.

Az eredeti ISO 639-es szabványt 1967-ben fogadták el és 2002-ig volt érvényben, amikor is az ISO 639-1 vette át a helyét. Az ISO 639-1 szabvány szerinti nyelvkódok 2 betűből állnak, és 184 nyelvet különböztetnek meg. Idővel azonban kiderült, hogy a két karakteres kódok tartománya nem kínál elég variációt az összes szükséges nyelv kódolásához, így 1989-ben elkezdtek dolgozni az ISO 639-2 szabványon, mely már három karakterrel kódolta a nyelveket és melyet először 1998-ban publikáltak.

Két fontos folyamat indult el ezután: egyrészt tovább folytatódott az ISO 639 fejlesztése, illetve az 1990-es évek közepétől egy másik vonalon is elindult a fejlesztés, ez pedig az IETF. Előbbi eredményeként az ISO 639-3 szabvány változat már nem csupán 3 karakteren volt képes azonosítani a nyelveket és a különböző kiterjesztései által a célja az volt, hogy lehető legtöbb élő vagy holt, ókori vagy mesterséges, többségi vagy kisebbségi, illetve írott vagy íratlan nyelvet lefedjen. Az IEFT az addig elért szabványokból sok címkét (taget) és alcímkét (subtaget) átemelve és azok kombinálásával képes megkülönböztetni az egyes nyelvi változatokat számtalan attribútum mentén, mint például az ország, régió, írásrendszer, stb.

A szabványok fejlődése azóta sem állt meg, a mai napig folyik. Mára ezek a szabványrendszerek egymást kiegészítve adnak biztos alapot minden digitális vagy akár papír alapú rendszer fejlesztőjének, hogy a számára optimális módon tudja kialakítani lokális és globális adatbázisait.