UTF-8

De Viquipèdia
Dreceres ràpides: navegació, cerca

UTF-8 (8-bit Unicode Transformation Format) és una normativa de transmissió de longitud variable per a caràcters codificats fent servir Unicode, creada per Rob Pike i Ken Thompson.

UTF-8 fa servir grups de bytes per a representar l'estàndard d'Unicode per als alfabets de moltes de les llengües del món. És molt útil especialment per a la transmissió dels sistemes de correu electrònic de 8 bits. Fa servir d'1 a 4 bytes per caràcter, depenent del símbol d'Unicode. Per exemple, es necessita només un byte en UTF-8 per a codificar els 128 caràcters US-ASCII al rang de U+0000 a U+007F d'Unicode.

Història[modifica | modifica el codi]

Ken Thompson i Rob Pikel van implantar l'UTF-8 el 3 de setembre de 1992 al seu sistema operatiu Plan 9. El gener de 1993 es va presentar oficialment a la conferència USENIX a San Diego (Califòrnia).

Enllaços externs[modifica | modifica el codi]

  • [1] UTF-8 (anglès)
  • [2] Rob Pike comenta la història de com va crear UTF-8 (anglès)
  • [3] Article original de l'UTF-8 (anglès)
  • [4] L'estàndard UTF-8 (anglès)