Alfabet llatí

De Viquipèdia
(S'ha redirigit des de: Història de l'alfabet llatí)
Dreceres ràpides: navegació, cerca
Alfabet Llatí
Caslon-schriftmusterblatt.jpeg
Tipus
Llengües Al principi s'utilitzava per escriure el llatí. Actualment s'utilitza per escriure llengües d'Europa de l'oest, del centre, i del nord, algunes llengües d'Àsia, moltes llengües d'Àfrica, Amèrica, Austràlia i Oceania.
Període
~700 aC i fins avui
Sistema Pare
Sistemes germans
Alfabet ciríl·lic
Alfabet copte
Alfabet armeni
Alfabet rúnic
ISO 15924 [[|Latn, Plantilla:ISO 15924 Nombre - Plantilla:ISO 15924 Alias]], Plantilla:ISO 15924 nombre
Direcció Plantilla:ISO 15924 direcció
Unicode
Plantilla:ISO 15924 alias
Mapa Unicode
[1]
Distribució mundial de l'alfabet llatí.
* En verd fosc, les àrees on és l'única forma d'escriptura.
* En verd clar, els països on coexisteix amb altres formes d'escriptura.

L'alfabet llatí (o alfabet romà) és el sistema d'escriptura alfabètic més utilitzat en el món avui dia. Està format per 26 lletres i es fa servir, amb algunes modificacions, en la majoria de les llengües de la Unió Europea, Amèrica, l'Àfrica subsahariana i les illes de l'Oceà Pacífic. En l'ús modern, l'expressió alfabet llatí és usada per qualsevol derivació directa de l'alfabet utilitzat pels romans. Aquestes variacions poden perdre lletres (com el cas del hawaià) o afegir-ne (en el cas de l'esperanto) i, per descomptat, moltes lletres han canviat al llarg dels segles (com les minúscules, que els romans no haurien reconegut). L'alfabet llatí fou introduït pels antics romans que el van importar dels grecs de Sicília i el van modificar. S'escrivia amb una tatxa de bronze (scribere), de canya (càlam) o es pintava (linere) sobre fulles vegetals (folium), sobre escorces (liber) o fustes (tabula, àlbum), més tard sobre coure i sobre llenços. La paraula escriptura procedeix d'scriptura, que era la marca per reconèixer l'amo del bestiar que s'enviava a pasturar amb un ramat.

L'alfabet llatí clàssic tenia 23 lletres, ja que els romans no tenien les lletres U, W i J. Aquestes tres lletres van ser creades a l'edat mitjana i han estat incorporades en força llengües. A causa que els romans escamparen la seva cultura per tot Europa, ja que durant mil·lennis van ser una gran potència colonitzadora, l'alfabet llatí és un dels més estesos arreu del món, i és utilitzat per bona part de les llengües que no disposaven d'alfabet propi fins a l'arribada dels europeus. Algunes d'aquestes llengües són el català, gallec, portuguès, castellà, anglès, francès, italià, alemany, polonès, indonesi, islandès, turc, javanès, vietnamita, quítxua, haussa, suajili, kazakh, àzeri, tagal, uzbek, turcman, somali, etc.

Les lletres[modifica | modifica el codi]

A B C D E F G H I J K L M
N O P Q R S T U V W X Y Z

L'alfabet llatí per defecte és el romà, afegint les lletres J, U, W, Z i les seves corresponents minúscules: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, amb un total de 26 lletres.[1]

Com la majoria d'alfabets derivats del grec, el llatí té dos sistemes, el de la lletra majúscula i el de la minúscula. El nom de cada lletra està lligat a la pronúncia originària. També es poden formar lletres addicionals:

  • Per lligadura:
    • W originalment era VV
    • Æ (ash) ve d'AE
    • eðel (Œ) d'OE
    • eszett (ß) ve de ſ (s llarga) i s
    • ŋ d'NG
    • Ȣ d'OU
    • Ñ d'NN
    • ä d'ae (vegeu Sütterlin)
    • Ç de CZ
  • Per signes diacrítics: com A, C, U;
  • Per modificació: com la J que era I, com Ø, eth Ð, yogh Ȝ de G, o schwa (ə) d'A o E
  • Poden ser prestades d'un altre alfabet: com thorn Þ i wynn Ƿ que eren de l'escriptura rúnica.

De totes maneres, aquests glifs no són sempre considerats lletres independents a l'alfabet. Per exemple, en anglès modern æ es considera una variant gràfica de ae en comptes d'una lletra per separat, mentre que en els alfabets danès i noruec és una lletra per si mateixa i està situada al final de l'alfabet conjuntament amb ø i aa/å. Antigament en castellà es considerava que els dígrafs Ll i Ch eren lletres, fins que van perdre aquesta consideració l'any 1994.

Amb el pas del temps, l'alfabet llatí ha estat adoptat per a l'ús de noves llengües, algunes de les quals tenen fonemes que no havien estat usats en les llengües que tenien aquest alfabet com a mitjà d'escriptura. Per tant, quan es necessitaven, es van crear extensions d'aquest alfabet. Aquestes prenen la forma de símbols modificats canviant la forma o afegint diacrítics, ajuntant diverses lletres amb lligadura o creant noves formes. A aquestes noves formes se'ls dóna un lloc en l'alfabet.

Altres lletres i lligadures[modifica | modifica el codi]

Hi ha diferents exemples de noves lletres:

  • Per poc temps durant el període històric de Roma, es van afegir tres lletres (lletres clàudies) a l'alfabet, però no van tenir bona acollida i es van eliminar.
  • En anglès antic van ser afegides eth ð i les lletres rúniques thorn þ i wynn ƿ. Eth i Thorn van ser reemplaçades per th i wynn per la nova lletra 'w'. En islandès modern, thorn i eth es continuen fent servir. En castellà es fa servir la ñ.
  • La llengua africana hausa usa tres consonants addicionals: ɓ, ɗ i ƙ, que són variants de b, d i g, i s'usen per lingüistes per representar certs sons que els són similars.

Un altre element és la lligadura, que és la fusió de dos o més lletres ordinàries en un nou glif. Exemples de lligadures són Æ d'AE, Œ d'OE, ß d'ſs, la ij holandesa de ii j. El parell ſs és simplement la doble s arcaica. La primera part (ſ) és la forma medieval arcaica i la segona és la seva forma final (s). Noti's que ij en majúscules és IJ (i no IJ). El francès utilitza els dígrafs Œ, com a sœur, bœuf o cœur.

Diacrítics[modifica | modifica el codi]

Els signes diacrítics són marques que s'afegeixen a lletres específiques per a modificar la seva pronunciació. L'efecte que realitzen depèn de cada llengua.

  • La ce trencada en ç, originalment una z petita escrita per sota de la c: en altre temps simbolitzava /ts/ en les llengües romàniques, però actualment representa a la c un so suau quan va abans d'una a, o i u; per exemple, en francès façade, en portuguès caçar i en català "caçar". En albanès i turc la "ç" canvia la qualitat del so "c" i es pronuncia com una "tx". En llengua turca la essa trencada "ş" canvia el so de "s" pel so "sh", i no s'ha de confondre amb la ş amb una coma a sota que existeix al romanès.
  • El háček en č š ž: usat en llengües bàltiques i eslaves per marcar la versió postalveolar del fonema base. S'usa també en txec sobre R i E
  • L'accent (~) en portuguès ã i O, estonià o. En portuguès, era originalment una petita n escrita sobre de la lletra; havia marcat l'elisió d'una antiga n i ara marca la nasalització de la lletra base. En estonià, o es considera una lletra de l'alfabet per separat. En espanyol ñ es considera una lletra diferent i té el valor de so de /ɲ/.
  • L'accent agut en "á é í ó ú", en francès, irlandès, italià, portuguès, espanyol, català i altres llengües. Addicionalment, i també s'usa en feroès (però no é), islandès, txec i eslovac. En hongarès i txec "á é í ó ú" no s'usen com accent sinó que representen vocals llargues que s'oposen a les "a e i o u" curtes. En polonès s'utilitza en C N S Z que representen lletres independents: Ć és [tɕ] (una variant de la ch, que en polonès s'escriu cz); és idèntica a la ñ espanyola; Ś és [ɕ] (una variant de la sh anglesa, que en polonès s'escriu sz); i Ź és [ʑ] que és una variant de la j francesa (que en polonès s'escriu Z). En basc s'utilitzava antigament la lletra R per substituir gràficament a la doble R (normalment només d'aplicació per majúscules), observat en cartells i toponímia antiga.
  • L'accent greu a "à è ì ò ù" en francès (menys la ì i la ò), italià, portuguès, català (menys la ì i la ù) i altres llengües.
  • L'accent circumflex en les vocals "â ê î ô û" en francès, portuguès, romanès (funcionen com lletres totalment diferents i tenen el seu lloc a l'alfabet), i en altres llengües; en les semivocals W i en gal·lès i en les consonants "ĉ ĝ ĥ ĵ ŝ" en esperanto.
  • L'umlaut a "ä ö ü" en alemany i altres llengües, ë en albanès i en ladí, que li canvia la qualitat (so) de la vocal. En alemany, aquesta marca s'escrivia antigament amb una petita i per sobre de la vocal afectada. L'ortografia alemanya moderna accepta "ae oe i ue" com variants quan l'umlaut és inviable.
  • La dièresi (que és una marca idèntica a l'umlaut) a "ä ë ï ö ü" en diverses llengües, indica que la vocal es pronuncia per separat de la qual la lletra que la precedeix quan aquesta hagués estat interpretada com un diftong. En castellà, la ü després gi abans de EOI marca que no és muda i s'oposa a "gueix gui", per exemple ahogar - desguace. En català també s'usa la dièresi (a part en la u amb la mateixa funció que en espanyol) també s'usa en la i. En aquest cas, s'usa per trencar un diftong i es posaria accent, però si no compleix les normes adequades d'accentuació, es posa dièresi.
  • El punt per sobre en c g Z en maltès, Z en polonès, i en lituà i B C D F G m p t en ortografia tradicional irlandesa denota lenició.
  • El punt per sota a "A A a E i I o o o u u" en vietnamita.
  • El ogonek a "ą ę į ų" en polonès i lituà.
  • El macron a a i I o U en letó, maori, hawaià, samogitiano (dialecte del lituà), rōmaji (japonès romanitzat) i llatí (quan s'indica durada de la vocal).
  • El doble accent agut en o U en hongarès, representa versions llargues de les vocals amb umlaut ö i ü.
  • El breu en a en romanès, G en turc i en U en esperanto i en l'alfabet łacinka del bielorús.
  • La coma per sota, utilitzada com a s i t en romanès (sovint presentada com una Cedillo en fonts tipogràfiques). També s'usa per K L N R en letó. En l'alfabet fonètic internacional també s'usa.
  • La i sense punt (un "diacrític negatiu") ı s'usa en turc.
  • El ganxo com a a a a e i I o o o u u i en vietnamita.
  • La barra com en đ, en vietnamita, i la versió amb l'alfabet llatí en llengua sèrbia. Utilitzada també en t del sami septentrional.
  • El punt volat emprat en català (l·l) i en occità (n·h), que distingeix lletres que s'han de pronunciar per seperat dels dígrafs ll i nh.

Hi ha més signes diacrítics i altres usos dels que s'han descrit aquí, que es poden observar en altres alfabets derivats del llatí.

Lletres especials i amb diacrítics dels alfabets derivats[modifica | modifica el codi]

  • Diacrítics - ' ` ^ ˆ ˇ ˉ ˘ ˙ ˚ ˛ ˜ ˝ ̃ ̉
  • Alemany - äöü ß ÄÖÜ
  • Albanès - çë ÇË
  • Aragonès
  • Asturià - áéíóú ü ñ ḷḷ ḥ ÁÉÍÓÚ Ü Ñ Ḷḷ Ḥ
  • Basc - ŕ Ŕ. Actualment aquesta lletra està totalment en desús, i en el seu lloc s'usa el dígraf rr.
  • Català - àèò ïü éíóú ç l·l ÀÈÒ ÏÜ ÉÍÓÚ Ç L·L
  • Castellà - áéíóú ü ñ ÁÉÍÓÚ Ü Ñ
  • Croat -
  • Danès - æøå ÆØÅ
  • Eslovac -
  • Esperanto - ĉĝĥĵŝŭ ĈĜĤĴŜŬ
  • Estoni - äöü õ ÄÖÜ Õ
  • Finès - äö ÄÖ
  • Francès - é àèù âêîôû ëï ç œ É ÀÈÙ ÂÊÎÔÛ ËÏ Ç Œ
  • Gaèlic escocès - àèìòù ÀÈÌÒÙ
  • Gaèlic irlandès - áéíóú ÁÉÍÓÚ
  • Gallec - áéíóú ïü ñ ÁÉÍÓÚ ÏÜ Ñ
  • Hongarès - áéíóú öü őű ÁÉÍÓÚ ÖÜ ŐŰ
  • Islandès - áéíóú ð þ æ ö ÁÉÍÓÚÝ Ð Þ Æ Ö
  • Italià - àèìòù ÀÈÌÒÙ
  • Letó - āīūž ĀĪŪŽ
  • Lituà - ąėšųž ĄŲŽ
  • Maltès - ċġħż ĊĠĦŻ
  • Neerlandès - éó ë ij ÉÓ Ë IJ
  • Noruec - æøå ÆØÅ
  • Occità - àèò ïü áéíóú ç n·h s·h ÀÈÒ ÏÜ ÁÉÍÓÚ Ç N·H S·H
  • Pīnyīn (Xinès romanitzat) - áàāǎ éèēě íìīǐ óòōǒ úùūǔ üǘǜǖǚ ÁÀĀĂ ÉÈĒĔ ÍÌĪĬ ÓÒŌŎ ÚÙŪŬ ÜǗǛǕǙ
  • Polonès - ąćęłńóśźż ĄĆĘŁŃÓŚŹŻ
  • Portuguès - áéíóú âêô ãõ à ü ç ÁÉÍÓÚ ÂÊÔ ÃÕ À Ü Ç
  • Romanès - âăî şţ ÂĂÎ ŞŢ
  • Suec - äåö ÄÅÖ
  • Turc - öü ı çğş ÖÜ İ ÇĞŞ
  • Txec - áéíóúý ů čďřšťž ÁÉÍÓÚÝ Ů ČĎŘŠŤŽ
  • Vietnamita - aáàảãạ ăắằẳẵặ âấầẩẫậ eéèẻẽẹ êếềểễệ iíìỉĩị oóòỏõọ ôốồổỗộ ơớờởỡợ uúùủũụ ưứừửữự yýỳỷỹỵ đ AÁÀẢÃẠ ÂẤẦẨẪẬ ĂẮẰẲẴẶ EÉÈẺẼẸ ÊẾỂỂỄỆ IÍÌỈĨỊ OÓÒỎÕỌ ÔỐỒỔỖỘ ƠỚỜỞỠỢ UÚÙỦŨỤ ƯỨỪỬỮỰ YÝỲỶỸỴ Ð

Evolució[modifica | modifica el codi]

Es manté, generalment, que els llatins van adoptar la variant occidental de l'alfabet grec al segle VII aC de la colònia grega de Cumas (sud d'Itàlia). L'antic alfabet etrusc va ser derivat de l'alfabet de Cumas, i els llatins finalment van adoptar 21 de les 26 lletres etrusques originals.

En l'alfabet original llatí:

  • C representava g i k.
  • I representava i i j.
  • V representava u i v.

Més endavant la Z es va perdre i una nova lletra G es va adoptar en la seva posició, inventada per Sp Servilius Ruga. Un intent per l'emperador Claudi d'introduir tres noves lletres (lletres claudies) va durar poc temps però, després de la conquesta de Grècia en el segle I aC, les lletres Y i Z van ser adoptada i readoptada, respectivament, i situades al final. El nou alfabet llatí contenia 23 caràcters:

Lletra A B C D E F G H I K L M N O P Q R S T V X Y Z
Nom llatí ā ē ef ī el em en ō er es ū ex ī Graeca zēta
Pronúncia
(AFI)
[aː] [beː] [tſeː] [deː] [eː] [ɛf] [geː] [haː] [iː] [kaː] [ɛl] [ɛm] [ɛn] [oː] [peː] [kuː] [ɛr] [ɛs] [teː] [uː] [ɛks] [iː 'graɪka] ['dzeːta]
La Inscripció d'amos, datada al segle VI aC, mostra la forma més antiga coneguda de l'alfabet llatí arcaic.

La W està formada per dues ves (VV) o us (UU). Va ser afegida en temps romans tardans per a representar un so alemany. Les lletres U i J, de manera similar, es consideraven originalment com a variants de V i I respectivament.

Noms de les lletres[modifica | modifica el codi]

Els noms llatins d'algunes lletres són discutits. La H probablement tenia un altre nom en el llatí parlat: basant en les llengües romàniques actuals, aquest ha d'haver estat HACA, a conseqüència de perdre el seu so en èpoques tardanes del llatí, ja que era necessari distingir de la [a]. En general, de qualsevol manera, els romans no feien servir els noms tradicionals (derivats dels semites) com en grec: els noms de les consonants oclusives foren formats afegint [i ː] al so (excepte C, K i Q en les que es necessitava diferent vocal per distingir-les i els noms de les fricatives consistir en, ja sigui el so en si, o el so precedit d'[ɛ].

Quan es va introduir la lletra I va ser, probablement, anomenada hi [hi ː] com en grec (el nom ipsilon no era utilitzat encara) però es va canviar per i graeca ( "i grega") quan el so [i] i [i] es barreja en llatí. A la Z se li va donar el seu nom grec, zeta. No va ser fins a l'edat mitjana que es va afegir la J (que representava la I no sil·làbica), i la U i la W (per distingir de la V).

Majúscules i minúscules[modifica | modifica el codi]

L'alfabet utilitzat pels romans comprenia únicament les lletres majúscules. Les minúscules es van desenvolupar, a partir de la grafia cursiva, a l'edat mitjana, primer com a escriptura uncial i després com escriptura minúscula. Les antigues lletres romanes es van mantenir per inscripcions formals i per donar èmfasi en documents escrits.

Les llengües que usen l'alfabet llatí, generalment, fan servir lletres majúscules per començar paràgrafs i frases i per a noms propis. Les regles de les majúscules han canviat al llarg del temps i no són les mateixes per a tots els idiomes. A diferència de l'espanyol, idiomes com l'anglès usen la majúscula inicial per llengües, nacionalitats i mesos, entre d'altres; l'alemany modern capitalitza tots els noms; el polonès capitalitza els pronoms.

Expansió de l'alfabet llatí[modifica | modifica el codi]

L'alfabet llatí es va expandir des d'Itàlia, amb la llengua llatina, a les terres del voltant del mar Mediterrani amb l'expansió de l'imperi romà. La part est de l'Imperi Romà, incloent-hi Grècia, Àsia Menor, Llevant i Egipte, va continuar fent servir la llengua grega com a lingua franca, però el llatí era àmpliament parlat a la part oest de l'imperi. Del llatí es van desenvolupar les llengües romàniques occidentals incloent-hi l'espanyol, el francès, el català, el portuguès i l'italià, que van continuar utilitzant i adaptant l'alfabet llatí. Amb l'expansió del cristianisme l'alfabet llatí es va estendre als pobles del nord d'Europa que parlaven llengües germàniques i va desplaçar els seus anteriors alfabets rúnics. El mateix succeí amb les llengües bàltiques, com el lituà i el letó, i en moltes llengües no indoeuropees com les fi-ugrias, notablement l'hongarès, el finès i l'estonià. Durant l'edat mitjana, l'alfabet llatí es va començar a utilitzar entre els parlants de les llengües eslaves occidentals, incloent-hi els ancestres dels polonesos, txecs, croats, eslovens i eslovacs moderns, a mesura que adoptaven el catolicisme romà, els parlants de les llengües eslaves orientals, generalment, van adoptar el Cristianisme Ortodox i l'alfabet ciríl·lic.

Fins a 1492, l'alfabet llatí estava limitat a les llengües parlades a Europa occidental, nord i central. Els eslaus Cristians Ortodoxos de l'est i sud d'Europa, majoritàriament, feien servir l'alfabet ciríl·lic i l'alfabet grec se seguia usant entre els parlants grecs al voltant de la Mediterrània oriental. L'alfabet àrab es va estendre àmpliament entre l'Islam, entre nacions àrabs i no àrabs, com Iran, Indonesia, Malaisia i Turquia. La major part de la resta d'Àsia feia servir una varietat d'alfabet brāhmī (devanagari) o escriptura xinesa.

Al llarg dels darrers 500 anys, l'alfabet llatí s'ha expandit per tot el món. Ha arribat a Amèrica, Austràlia i parts d'Àsia, Àfrica i el Pacífic sota les colònies europees, de mà de les llengües espanyola, portuguesa, anglesa, francesa i neerlandesa. Al segle XVII, els romanesos van adoptar l'alfabet llatí, tot i que el romanès és una llengua romànica, els romanesos eren predominantment Cristians Ortodoxos i, fins al segle XIX l'Església feia servir l'alfabet ciríl·lic. Vietnam, sota domini francès, va adoptar l'alfabet llatí per escriure l'idioma vietnamita, que havia fet servir els caràcters xinesos amb anterioritat. L'alfabet llatí es fa servir també en moltes llengües autronèsia, incloent-hi tagal i altres idiomes de les Filipines, el malai oficial i l'indonès, que reemplaçà els anteriors alfabets àrab i brāhmī. El 1928, com a part de la reforma de Mustafa Kemal Atatürk, Turquia va adoptar l'alfabet llatí per al turc, reemplaçant l'alfabet àrab. La majoria dels parlants de les llengües túrquiques de l'antiga URSS, incloent-hi els tàrtars, els bashkiris, àzeri, els kazakhs, els kirguís, etc., van usar l'alfabet túrquic Uniforme en els anys trenta del segle XX. En els quaranta tots aquests alfabets van ser reemplaçats pel ciríl·lic. Després del col·lapse de la Unió Soviètica el 1991, moltes de les noves repúbliques de parla túrquica, van adoptar l'alfabet llatí, reemplaçant el ciríl·lic. Azerbaidjan, Uzbekistan i Turkmenistan han adoptat l'alfabet llatí per les llengües àzeri, uzbeka i turcman, respectivament. En els anys setanta, la República Popular de la Xina va desenvolupar una transliteració oficial del xinès mandarí a l'alfabet llatí, anomenat pinyin, tot i que encara predomina l'ús de caràcters xinesos.

Les llengües eslaves occidentals i la majoria de les del sud, fa servir l'alfabet llatí en lloc del ciríl·lic, com a reflex de la religió dominant entre la gent. Ente ells, el polonès, fa servir una varietat de diacrítics i dígrafs per representar valors fonètics especials, com també la l amb barra (l) per un so semblant a la u en posició inicial de diftongs ([w] en AFI - similar a la w anglesa). En txec utilitza diacrítics com el háček. En croat, eslovè i en la versió llatina del serbi també s'usen háčeks i accents aguts com en C i barres com en đ. Les llengües dels eslaus orientals de l'Església Ortodoxa, generalment usen ciríl·lic. En serbi es fan servir els dos.

Classificació alfabètica amb extensions[modifica | modifica el codi]

Els alfabets que deriven del llatí tenen classificacions alfabètiques diverses:

  • En l'alfabet alemany, les lletres amb umlaut (Ä, Ö, Ü) són tractades generalment com no accentuades o s'escriuen la Ä / ä: AE / ae, la Ö / ö: OE / oe, la Ü / ü: UE / ue; ß es classifica com seg. Això fa l'ordre alfabètic: Arg, Ärgerlich, Arm, Assistant, Aßlar, Assoziation. En els directoris de telèfon i altres llistes de noms semblants, els umlauts es troben on les combinacions de lletres "ae", "oe", "ue". Això fa l'ordre alfabètic: Udet, Übelacker, Uell, Ulle, Ueve, Üxküll, Uffenbach.
  • En asturià LL i CH tenen tractament de lletra, i no està present la J. Així mateix, existeixen els diacrítics Ll (CHE vaquera) i H (H aspirada). La primera representa varietats dialectals de LL "Llum / llum" (Lumbres) o "Ḷḷechi / Llechi" (Llet) i és pronunciat com "j" en francès i portuguès i h representa un so d'H aspirada, similar a la H inicial anglesa, per paraules com guaḥe (nen)
  • En bretó, no hi ha "c" però existeixen les lligadures "ch" i "c'h", que són classificades entre "b" i "d". Per exemple: «buzhugenn, chug, c'hoar, daeraouenn» (cuc de terra, suc, germana, llàgrima).
  • En txec i eslovac, les vocals accentuades tenen una classificació secundària-comparades a altres lletres, són tractades com la lletra base (A-À, E-É-E, I-Í, O-Ò-Ô, U-Ú - U, I-Ý), però són classificades darrere d'aquesta (per exemple, l'ordre lexicogràfic correcte és BAA, BAA, BAA, bab, bab, bac, Bac, Bac, BAC). Les consonants accentuades, tenen classificació primària i són situades immediatament després de les consonants base, amb excepció de d, n i t, que tenen un pes secundari. CH es considera una lletra separada i va entre H i I. En eslovac, DZ i DZ també es consideren lletres per separat i se situen entre D i E (A-À-Ä-BC-C-D-D-DZ-DZ-E-É ...).
  • En croat i serbi i les llengües eslaves familiars, els cinc caràcters accentuats i els tres dígrafs, es classifiquen després de l'original :..., C, C, C, D, DZ, DJ, E,..., L, LJ, M, N, NJ, O,..., S, s, t,..., Z, Z.
  • En els alfabets danès i noruec, existeixen les mateixes vocals extres que en suec (vegeu avall), però en diferent ordre i amb diferents glifs (..., X, Y, Z, Æ, Ø, Å). A més, "Aa" es classifica com una equivalència de "Å". L'alfabet danès ha vist, tradicionalment, la "W" com una variant de "V", però avui dia es considera una lletra per separat.
  • En esperanto, tant les consonants amb accent circumflex (C, G, H, J, S), com la U (o amb breu), es compten com lletres separades i es classifiquen separadament (C, C, d, e, f, g, g, h, h, i, j, j ... s, s, t, u, u, v, z).
  • En estonià o, ä, ö i ü es consideren lletres separades i se situen darrere de la w. Les lletres š, ZY Z apareixen només en préstecs i noms propis estrangers i segueixen a la lletra en el seu alfabet que, sinó, no es diferencia de l'alfabet llatí.
  • En feroès també es tenen algunes de les lletres daneses, noruegues i sueques, com Æ i Ø. A banda d'això, l'alfabet feroès utilitza la lletra islandesa eth ð, que segueix a la D. Cinc de les sis vocals (A, I, O, U i I) poden tenir accents i se situen després de la vocal base. Les consonants C, Q, X, W i Z no apareixen. Per tant, les cinc primeres lletres són A, À, B, D i Ð, i les últimes cinc V, I, Ý, Æ, Ø.
  • En filipí i altres llengües de les Filipines, la lletra Ng es considera una lletra per separat. A més, lletres derivades (com Ñ) segueixen a la lletra base. En filipí també s'usen diacrítics, però no s'usen àmpliament, excepte l'accent (~).
  • L'alfabet finès i les seves normes de classificació alfabètica, són iguals a les del suec, amb excepció de les addicionals S i Z, que es consideren variants de S i Z.
  • En l'alfabet francès i anglès, els caràcters amb dièresi (a, e, i, ö, ü, ÿ) es tracten normalment igual que les lletres inaccentuades. Si dues paraules difereixen només per un diacrític en francès, la qual cosa té és més gran. De totes maneres, el llibre de Unicode 3.0 especifica regles més específiques per a la classificació tradicional de les lletres accentuades franceses.
  • El gal·lès també té regles complexes: les combinacions CH, DD, FF, NG, LL, PH, RH i TH es consideren lletres simples, i cadascuna és llistada darrere de la primera lletra del dígraf, amb l'excepció de NG que es llista després G. De totes maneres, la situació és més complicada, ja que aquestes combinacions no són sempre lletres simples. Un exemple de l'ordre és: LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH: la darrera d'aquestes paraules és una juxtaposició de Llona i GYFARCH, i, contràriament a LLONG, no conté la lletra NG.
  • Les vocals hongareses tenen accents, umlauts i dobles accents, mentre que les consonants s'escriuen soles o en dígrafs. En la classificació, les vocals accentuades segueixen a les no accentuades i els dígrafs segueixen a la lletra simple original. L'ordre alfabètic hongarès és: A, À, B, C, CS, D, E, È, F, G, GY, H, I, Í, J, K, L, LY, M, N, NY, O, Ò, ò, ó, P, Q, R, S, SZ, T, TY, U, Ú, Ü, U, V, W, X, Y, Z, ZS. (Per exemple, l'ordre lexicogràfic correcte és BAA, BAA, bab, bac, bacs,..., baz, bazs, BAA, BAA, bab, Bac, Bács).
  • En islandès s'afegeix Þ, i a D la segueix Ð. Cada vocal (A, E, I, O, U, I) està seguida per la seva corresponent amb accent agut: a, e, i, Ó, Ú, Ý. No hi ha Z, i Þ, Æ, Ö se situen després Ý.
    • dues lletres usades pels escrivans anglosaxons que també van usar la lletra rúnic wynn (Ƿ) per representar / w /.
    • Thorn (Þ) també és una lletra rúnic.
    • Eth (Ð) és la lletra D amb una barra.
  • En neerlandès, la combinació IJ (IJ), va ser antigament situada com I (o de vegades, com una lletra separada I <IJ <Z), però, actualment, es classifica com dues lletres (II <IJ <IK). Els directoris de telèfon són excepcions; IJ se situa sempre com I ja que en molts cognoms s'usa I quan l'ortografia moderna hagués requerit IJ. Noteu, que les paraules que comencen amb ij, capitalitzen les dues lletres, com per exemple ciutat de IJmuiden (Velsen) i el riu IJssel.
  • En polonès, els caràcters amb accent agut, ogonek o amb punt se situen després de la lletra base: A, A, B, C, C, D, E, e,..., L, L, M, N, N, O, O, P,..., S, s, t,..., Z, Z, Z. Això és perquè representen diferents sons, no només variacions d'un mateix fonema (en polonès col loquial E i i es diferencien només del seu tret d'oralitat-nasal, encara que tradicionalment s'haguessin diferenciat en més; Ó representa el so idèntic a U, vocal que també és utilitzada en la llengua). Totes excepte les que tenen ogonek, poden perdre-segons el cas en el qual estan. Quan això succeeix, s'afegeix, generalment, i darrere de la lletra or davant en el cas de Z. En aquests casos, són tractats com dues lletres per separat. També tenen dígrafs com sz o RZ que són tractats com dues lletres, també.
  • En romanès, els caràcters especials derivats de l'alfabet llatí se situen després dels originals: A, a, Â,..., I, Î,..., S, S, T, t,..., Z.
  • En l'alfabet suec, "W" és una variant de "V" i no una lletra per separat. De totes maneres, es manté en noms com "William". L'alfabet també té tres vocals extra que se situen al final (..., X, Y, Z, Å, Ä, Ö).
  • Algunes llengües tenen regles més complexes: l'abecedari espanyol va tractar la CH i la LL com lletres per separat (fins a 1994), ordenant d'aquesta manera: CINC, CREDA, Chispa i LLOM, LLUM, LLAMA. Això no succeeix així avui en dia, la RAE va adoptar l'ús més convencional i ara LL se situa entre LK i LM, i CH entre CG i CI. L'única classificació alfabètica especial en espanyol és Ñ (eñe) que es tracta com una lletra a banda i se situa després N.
  • En tàtar i turc, hi ha 9 lletres addicionals. 5 d'elles són vocals, aparellades amb les lletres originals com durada suau: a-ä, o-ö, u-ü, í-i, ı electrònics. Les quatre que queden: s és la sh anglesa, ç és ch, ñ és ng i G és gh.

L'Unicode collation Algorithm (Algorisme de situació alfabètica d'Unicode) pot ser usat per obtenir qualsevol de les seqüències descrites aquí.

Vegeu també[modifica | modifica el codi]

Referències[modifica | modifica el codi]

  1. Norris, Jeffrey Singley. Perceptually Motivated Symbol Generation (en anglès). ProQuest, 2008, p. 14. ISBN ProQuest. 

Enllaços externs[modifica | modifica el codi]