Deze lijst is onvolledig; u kunt helpen door hem aan te vullen.

Dit is een lijst van talen die een schrijfsysteem gebruiken om te sorteren.

 

Dit artikel geeft een overzicht van veelvoorkomende schriftsystemen (alfabetten, abjads, abugida's, syllabaries en logografische systemen) en voorbeelden van talen die deze systemen gebruiken. Het behandelt ook belangrijke eigenschappen die van invloed zijn op ordening (collatie), zoals speciale letters, diakritica, richting van lezen en combinaties van meerdere schriftsystemen binnen één taal.

Wat is een schrijfsysteem?

Schrijfsysteem verwijst naar de manier waarop een taal in geschreven tekens wordt weergegeven. Enkele belangrijke typen:

  • Alfabet: elk grafem komt ongeveer overeen met een medeklinker of klinker (bijv. Latijns, Grieks, Cyrillisch).
  • Abjad: voornamelijk medeklinkers worden geschreven; klinkers kunnen aangeduid worden met diakritica (bijv. Arabisch, Hebreeuws).
  • Abugida: basistekens voor medeklinkers met aangehechte diakritische vormen voor klinkers (bijv. Devanagari, Ethiopisch).
  • Syllabarium: tekens vertegenwoordigen lettergrepen (bijv. Japans kana, Cherokee).
  • Logografisch: tekens representeren woorden of morfemen (bijv. Chinese karakters, Hanzi).

Belangrijke schriftsystemen en voorbeeldtalen

  • Latijns alfabet – gebruikt door de meeste West-Europese talen (Nederlands, Engels, Frans, Duits, Spaans, Portugees), veel talen in Afrika en Amerika, en als internationale schrift voor wetenschappelijke en technische termen. Let op taalvarianten: diakritische tekens en speciale letterparen (bijv. ñ in Spaans, å in Noordse talen).
  • Cyrillisch – gebruikt door Russisch, Bulgaars, Servisch (ook Latijn mogelijk), Oekraïens, Wit-Russisch, Kazachs (transitie naar Latijn), en andere Slavische en niet-Slavische talen.
  • Arabisch schrift – gebruikt voor Arabisch, Perzisch (Farsi), Urdu, Pasjto, Kurdisch (sommige varianten), en andere talen in West-, Centraal- en Zuid-Azië; wordt van rechts naar links geschreven en kent contextafhankelijke lettervormen.
  • Devanagari en andere Brahmi-afstammelingen – Devanagari voor Hindi, Marathi, Nepali; vergelijkbare scripts voor Bengali (Bengali-Assamees), Gujarati, Gurmukhi (Punjabi), Tamil, Telugu, Kannada, Malayalam. Deze scripts zijn abugida's met vele gemeenschappelijke eigenschappen.
  • Chinese karakters (Han) – gebruikt voor Mandarijn, Kantonees (traditionele/kantonees-specifieke tekens), en als historisch schrift voor Japans (kanji) en Koreaans (voordien). Combineert met kana in Japans.
  • Japans – combinatie van logografische kanji met syllabaries hiragana en katakana; Latijns schrift (rōmaji) wordt ook gebruikt voor transliteratie en moderne termen.
  • Koreans (Hangul) – een alfabetisch syllabisch schrift gebruikt voor het Koreaans; historisch gebruikt men ook Hanja (Chinese karakters).
  • Hebreeuws – abjad gebruikt voor Hebreeuws en sommige Joodse talen; ook van rechts naar links, met diakritische aanduiding voor klinkers mogelijk.
  • Thai en Lao – abugida's met conjuncties en uitgebreide diakritische systemen; worden in Zuidoost-Azië gebruikt.
  • Khmer – het oudste moderne alfabet, gebruikt voor Khmer (Cambodja); heeft veel letters en complexe combinaties.
  • Birmaans (Myanmar) – gebruikt voor Birmees en andere talen in Myanmar; ronde vormen en diakritica.
  • Georgisch, Armeens – unieke alfabetten gebruikt voor respectievelijk Georgisch en Armeens.
  • Etiopisch (Ge'ez) – abugida voor Amhaars, Tigrinya en andere talen in Ethiopië en Eritrea.
  • Bengali – gebruikt voor Bengali, Assamese; afgeleid van Brahmi (abugida).
  • Tamil – abugida met eigen kenmerken, gebruikt voor Tamil en sommige Dravidische talen.
  • Khmer, Burmese, Sinhala, Khmer – andere Zuid- en Zuidoost-Aziatische scripts met hun eigen regels.
  • Syllabaries en bijzondere systemen – Japans kana, Cherokee-syllabarium, Canadian Aboriginal Syllabics; ieder heeft een specifieke kolomvolgorde.
  • Mongools – traditioneel verticaal Mongools schrift en Cyrillisch (tijdens en na Sovjetperiode); schrijftrichting en orde kunnen afwijken.

Talen met meerdere schriftsystemen

  • Serbisch – zowel Cyrillisch als Latijn mogelijk, met officiële tolerantie voor beide.
  • Japan – combinatie van kanji en kana; Latijns schrift in rōmaji.
  • Hindustani – Hindi (Devanagari) en Urdu (Perzisch-Arabisch) zijn linguïstisch nauw verwant maar gebruiken verschillende schriftsystemen.
  • Kazachstan, Azerbeijan, Turkmenistan – voorbeelden van talen die overgang maken tussen Cyrillisch, Latijn en lokaal schrift.

Ordening (sortering, collatie) en praktische aandachtspunten

Sortering van woorden hangt af van het gebruikte schrift en van taalregels. Enkele belangrijke punten:

  • Diakritica kunnen de sorteerorde veranderen of genegeerd worden, afhankelijk van de taal en instelling. Bijvoorbeeld in sommige contexten wordt "é" behandeld als "e", in andere als aparte letter.
  • Sommige talen kennen samengestelde letters of digraphen die als één sorteereenheid tellen (historisch Spaans "ch", Tsjechisch "ch").
  • Rechts-naar-links (RTL) scripts zoals Arabisch en Hebreeuws vereisen speciale verwerking bij interfaces en bij het mengen met links-naar-rechts tekst.
  • Unicode en de Unicode Collation Algorithm (UCA) bieden een gestandaardiseerde basis, maar taalspecifieke collation tables (zoals CLDR) zijn nodig voor juiste taalafhankelijke sortering.
  • Normalisatie (NFC/NFD) is belangrijk: tekens met diakritica kunnen als enkele samengestelde codepoint of als basis + combining mark voorkomen, wat gevolgen heeft voor zoeken en sorteren.

Technische en praktische kwesties

  • Toegankelijkheid: braille en alternatieve notaties bestaan voor veel schriftsystemen; digitale weergave vereist fonts die de benodigde tekens ondersteunen.
  • Transliteratie: systemen zoals ISO-standaarden en ad-hoc romanisaties worden gebruikt om tussen schriftsystemen te converteren, maar kunnen inconsistenties veroorzaken bij sortering en naamgeving.
  • Historische en regionale varianten: dezelfde taal kan in de loop van de tijd of per regio van schrift veranderen; dat heeft invloed op archieven en digitale data.

Bijdragen en verdere uitbreiding

Dit overzicht is niet volledig. U kunt bijdragen door voorbeelden van talen en schriftsystemen aan te vullen, details over taalspecifieke sorteervolgordes toe te voegen, of bijzondere gevallen (bijv. kleinschalige en bedreigde schriftsystemen) te beschrijven. Bij technische toepassingen is het nuttig om voorbeelden van collatieregels en Unicode-implementatie toe te voegen.

Opmerking: als u concrete informatie zoekt over sorteerregels voor een specifieke taal of script (bijvoorbeeld hoe woorden in het Servisch of Arabisch precies geordend worden, of welke Unicode-collation-tailorings nodig zijn), vraag dan welke taal of toepassing u bedoelt — dan geef ik gedetailleerdere instructies en voorbeelden.