Mojibake

Mojibake (文字化け, uitgesproken als /modʑibake/) is de naam voor onjuiste, onleesbare tekens die getoond worden wanneer computersoftware tekst niet correct weergeeft. Bij het gebruik van computers wordt tekst gecodeerd met behulp van een tekencodering. Bij de overdracht wordt elk teken vervangen door zijn positie (of nummer) in de codering. Om het teken opnieuw weer te geven, wordt de positie opnieuw vervangen door het teken. Wanneer de oorspronkelijke codering niet is gespecificeerd, kan een ander teken worden gebruikt wanneer het nummer opnieuw wordt vervangen door het teken voor weergave. Unicode werd ingevoerd om dit probleem op te lossen: UTF-8 is in staat de meest voorkomende tekens in 2 bytes te coderen.

Voordat Unicode werd ingevoerd, werden andere tekencoderingen gebruikt. ISO-8859 bevat bijvoorbeeld 15 verschillende coderingen. Deze zijn hetzelfde voor de karakters die gewoonlijk in het Engels worden gebruikt. Zij hebben verschillende "blokken" van "speciale tekens", die voor elke codering anders zijn gearchiveerd.



Zo kan een website eruit zien als de verkeerde font-codering wordt gebruikt.Zoom
Zo kan een website eruit zien als de verkeerde font-codering wordt gebruikt.

Het Japanse Wikipedia artikel voor Mojibake gebruikt UTF-8 codering. Deze schermafbeelding laat zien hoe het er uit ziet, wanneer het gedecodeerd wordt met de standaard Windows CP1252 encodering.Zoom
Het Japanse Wikipedia artikel voor Mojibake gebruikt UTF-8 codering. Deze schermafbeelding laat zien hoe het er uit ziet, wanneer het gedecodeerd wordt met de standaard Windows CP1252 encodering.

Oorsprong van het woord

Mojibake is een Japans woord. Het woord 文字化け ([moʥibake]) bestaat uit twee delen. 文字 (moji) betekent letter, teken. 化け (bake), van het werkwoord 化ける (bakeru), betekent in vermomming verschijnen, de vorm aannemen van, ten kwade veranderen. Letterlijk betekent het "karakter mutatie".



Vragen en antwoorden

V: Wat is "mojibake"?


A: Mojibake is de term voor onjuiste en onleesbare karakters die verschijnen wanneer computersoftware er niet in slaagt om tekst correct weer te geven.

V: Hoe wordt tekst gecodeerd bij het gebruik van computers?


A: Tekst wordt gecodeerd met een tekencodering, waarbij elk teken vervangen wordt door zijn positie of nummer in de codering.

V: Wat gebeurt er als de originele codering niet gespecificeerd is bij het overzetten van tekst?


A: Als de originele codering niet gespecificeerd is, kan een ander teken gebruikt worden wanneer het nummer vervangen wordt door het teken voor weergave.

V: Wat is Unicode en hoe lost het dit probleem op?


A: Unicode is een tekencoderingsstandaard die de meeste tekens in twee bytes kan weergeven. Het lost het probleem op van het gebruik van verschillende tekencoderingen en zorgt ervoor dat tekens correct worden weergegeven.

V: Wat zijn enkele voorbeelden van andere tekencoderingen die vóór Unicode gebruikt werden?


A: ISO-8859 is een voorbeeld van een andere tekencodering die vóór Unicode gebruikt werd.

V: Hoeveel verschillende coderingen bevat ISO-8859?


A: ISO-8859 bevat 15 verschillende coderingen.

V: Zijn de speciale tekens in ISO-8859 hetzelfde voor al haar coderingen?


A: Nee, de speciale tekens in ISO-8859 zijn voor elke codering anders gearchiveerd.

AlegsaOnline.com - 2020 / 2023 - License CC3