De term Unicode verwijst naar een standaardsysteem van tekens dat is gemaakt om eenvoudige verwerking van computergebruik, visualisatie en verzending van geschriften van verschillende talen en technische disciplines mogelijk te maken, maar het omvat ook klassieke teksten uit reeds dode talen. Met andere woorden, en op een meer specifieke manier, is Unicode een veelgebruikt tekenformaat dat elk van de toetsenbordtekens op een computer bevat. Volgens wat wordt gezegd, is de term afgeleid van de drie nagestreefde doelstellingen, namelijk universaliteit, uniciteit en uniformiteit.
Unicode levert vooral een uniek nummer voor elk teken, zonder de implicatie van het platform, de taal, het programma, wat de overdracht tussen verschillende coderingssystemen en platforms vergemakkelijkt. Zoals u kunt zien , omvat Unicode niet alleen letters, maar er zijn ook symbolen, cijfers en andere.
Een tekencodering definieert een tabel die tekens als getallen vertegenwoordigt. Elk teken is gekoppeld aan een nummer. In Unicode wordt dit nummer een codepunt genoemd. De voorganger van Unicode staat bekend als "ASCII", met het verschil dat de laatste alleen de tekens bevatte die in de Engelse taal werden gebruikt.
Deze standaard wordt ondersteund door het UTC-acroniem voor de Unicode Technical Committee, geïntegreerd in het Unicode Consortium, een non-profitorganisatie, waarin grote en bekende bedrijven zoals Apple, Microsoft, Google, Yahoo en Adobe deel uitmaken met verschillende mate van implicaties. , IBM, SAP, Oracle of entiteiten zoals de prestigieuze University of Berkeley en individuele professionals en academici. Het Unicode Consortium onderhoudt een zeer nauwe relatie met ISO / IEC, waarmee het sinds 1991 een overeenkomst heeft gesloten om zijn standaarden met dezelfde karakters en codepunten te synchroniseren.