Alfabet llatí

De Viquipèdia
(S'ha redirigit des de: Història de l'alfabet llatí)
Dreceres ràpides: navegació, cerca
Alfabet llatí
Caslon-schriftmusterblatt.jpeg
Tipus
Llengües Al principi, s'utilitzava per a escriure el llatí. Actualment, s'utilitza per a escriure llengües d'Europa de l'oest, del centre, i del nord, algunes llengües d'Àsia, moltes llengües d'Àfrica, Amèrica, Austràlia i Oceania.
Període
~700 aC i fins avui.
Sistema Pare
Sistemes germans
Alfabet ciríl·lic
Alfabet copte
Alfabet armeni
Alfabet rúnic
ISO 15924 [[|Latn, Plantilla:ISO 15924 Nombre - Plantilla:ISO 15924 Alias]], Plantilla:ISO 15924 nombre
Direcció Plantilla:ISO 15924 direcció
Unicode
Plantilla:ISO 15924 alias
Mapa Unicode
[1]
Distribució mundial de l'alfabet llatí:
* En verd fosc, les àrees on és l'única forma d'escriptura.
* En verd clar, els països on coexisteix amb altres formes d'escriptura.

L'alfabet llatí (o alfabet romà) és el sistema d'escriptura alfabètic més utilitzat en el món avui dia. Està format per 26 lletres i es fa servir, amb algunes modificacions, en la majoria de les llengües de la Unió Europea, Amèrica, l'Àfrica subsahariana i les illes de l'oceà Pacífic. En l'ús modern, l'expressió alfabet llatí és usada per a qualsevol derivació directa de l'alfabet utilitzat pels romans. Aquestes variacions poden perdre lletres (com el cas del hawaià) o afegir-ne (en el cas de l'esperanto) i, per descomptat, moltes lletres han canviat al llarg dels segles (com les minúscules, que els romans no haurien reconegut). L'alfabet llatí fou introduït pels antics romans, que el van importar dels grecs de Sicília i el van modificar. S'escrivia amb una tatxa de bronze (scribere), de canya (càlam) o es pintava (linere) sobre fulles vegetals (folium), sobre escorces (liber) o fustes (tabula, àlbum), més tard sobre coure i sobre llenços. La paraula escriptura procedeix d'scriptura, que era la marca per a reconèixer l'amo del bestiar que s'enviava a pasturar amb un ramat.

L'alfabet llatí clàssic tenia 23 lletres, ja que els romans no tenien les lletres U, W i J. Aquestes tres lletres van ser creades a l'edat mitjana i han estat incorporades en força llengües. A causa que els romans escamparen la seva cultura per tot Europa, ja que durant mil·lennis van ser una gran potència colonitzadora, l'alfabet llatí és un dels més estesos arreu del món, i és utilitzat per bona part de les llengües que no disposaven d'alfabet propi fins a l'arribada dels europeus. Algunes d'aquestes llengües són el català, gallec, portuguès, castellà, anglès, francès, italià, alemany, polonès, indonesi, islandès, turc, javanès, vietnamita, quítxua, haussa, suahili, kazakh, àzeri, tagal, uzbek, turcman, somali, etc.

Les lletres[modifica | modifica el codi]

A B C D E F G H I J K L M
N O P Q R S T U V W X Y Z

L'alfabet llatí per defecte és el romà, afegint-hi les lletres J, U, W, Z i les seves corresponents minúscules: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, amb un total de 26 lletres.[1]

Com la majoria d'alfabets derivats del grec, el llatí té dos sistemes, el de la lletra majúscula i el de la minúscula. El nom de cada lletra està lligat a la pronúncia originària. També es poden formar lletres addicionals:

  • Per lligadura:
    • W originalment era VV
    • Æ (ash) ve de AE
    • eðel (Œ) de OE
    • eszett (ß) ve de ſ (s llarga) i s
    • ŋ de NG
    • Ȣ de OU
    • Ñ de NN
    • ä de ae (vegeu Sütterlin)
    • Ç de CZ
  • Per signes diacrítics: com A, C, U;
  • Per modificació: com la J que era I, com Ø, eth Ð, yogh Ȝ de G, o schwa (ə) de A o E;
  • Poden ser prestades d'un altre alfabet: com thorn Þ i wynn Ƿ, que eren de l'escriptura rúnica.

De tota manera, aquests glifs no són sempre considerats lletres independents en l'alfabet. Per exemple, en anglès modern, æ es considera una variant gràfica de ae, en comptes d'una lletra per separat, mentre que, en els alfabets danès i noruec, és una lletra per si mateixa i està situada al final de l'alfabet, conjuntament amb ø i aa/å. Antigament, en castellà es considerava que els dígrafs ll i ch eren lletres, fins que van perdre aquesta consideració l'any 1994.

Amb el pas del temps, l'alfabet llatí ha estat adoptat per a l'ús de noves llengües, algunes de les quals tenen fonemes que no havien estat usats en les llengües que tenien aquest alfabet com a mitjà d'escriptura. Per tant, quan calien, es van crear extensions d'aquest alfabet. Aquestes prenen la forma de símbols modificats canviant la forma o afegint-hi diacrítics, ajuntant diverses lletres amb lligadura o creant noves formes. A aquestes noves formes, se'ls dóna un lloc en l'alfabet.

Altres lletres i lligadures[modifica | modifica el codi]

Hi ha diferents exemples de noves lletres:

  • Per poc de temps, durant el període històric de Roma, es van afegir tres lletres (lletres clàudies) a l'alfabet, però no van tenir pas bona acollida i es van eliminar.
  • En anglès antic, van ser afegides eth ð i les lletres rúniques thorn þ i wynn ƿ. Eth i Thorn van ser reemplaçades per th i wynn per la nova lletra w. En islandès modern, thorn i eth es continuen fent servir. En castellà, es fa servir la ñ.
  • La llengua africana haussa usa tres consonants addicionals: ɓ, ɗ i ƙ, que són variants de b, d i g, i s'usen pels lingüistes per a representar certs sons que hi són similars.

Un altre element és la lligadura, que és la fusió de dues o més lletres ordinàries en un nou glif. Exemples de lligadures són Æ d'AE, Œ d'OE, ß d'ſs, la ij holandesa de ii j. El parell ſs és simplement la doble s arcaica. La primera part (ſ) és la forma medieval arcaica i la segona és la seva forma final (s). Noti's que ij en majúscules és IJ (i no IJ). El francès utilitza els dígrafs Œ, com a sœur, bœuf o cœur.

Diacrítics[modifica | modifica el codi]

Els signes diacrítics són marques que s'afegeixen a lletres específiques per a modificar-ne la pronunciació. L'efecte que hi realitzen depèn de cada llengua.

  • La ce trencada en ç, originalment una z petita escrita per sota de la c: en altre temps simbolitzava /ts/ en les llengües romàniques, però actualment representa a la c un so suau quan va abans d'una a, o i u; per exemple, en francès façade, en portuguès caçar i en català caçar. En albanès i turc, la ç canvia la qualitat del so c i es pronuncia com una tx. En llengua turca, la essa trencada ş canvia el so de s pel so sh, i no s'ha de confondre amb la ş amb una coma a sota que existeix al romanès.
  • El háček en č, š, ž: usat en llengües bàltiques i eslaves per a marcar la versió postalveolar del fonema base. S'usa també en txec sobre R i E.
  • L'accent (~) en portuguès ã i O, estonià o. En portuguès, era originalment una petita n escrita a sobre de la lletra; havia marcat l'elisió d'una antiga n i ara marca la nasalització de la lletra base. En estonià, o es considera una lletra de l'alfabet per separat. En espanyol, ñ es considera una lletra diferent i té el valor del so de /ɲ/.
  • L'accent agut en á, é, í, ó, ú, en francès, irlandès, italià, portuguès, espanyol, català i altres llengües. Addicionalment, i també s'usa en feroès (però no é), islandès, txec i eslovac. En hongarès i txec, á, é, í, ó, ú, no s'usen com a accent, sinó que representen vocals llargues que s'oposen a les a, e, i, o, u curtes. En polonès, s'utilitza en C, N, S, Z, que representen lletres independents: Ć és [tɕ] (una variant de la ch, que en polonès s'escriu cz); és idèntica a la ñ espanyola; Ś és [ɕ] (una variant de la sh anglesa, que en polonès s'escriu sz); i Ź és [ʑ], que és una variant de la j francesa (que en polonès s'escriu Z). En basc, s'utilitzava antigament la lletra R per a substituir gràficament la doble R (normalment només d'aplicació per a majúscules), observada en cartells i toponímia antiga.
  • L'accent greu en à, è, ì, ò, ù, en francès (menys la ì i la ò), italià, portuguès, català (menys la ì i la ù) i altres llengües.
  • L'accent circumflex en les vocals â, ê, î, ô, û, en francès, portuguès, romanès (funcionen com a lletres totalment diferents i tenen el seu lloc en l'alfabet), i en altres llengües; en les semivocals W i en gal·lès i en les consonants ĉ, ĝ, ĥ, ĵ, ŝ, en esperanto.
  • L'umlaut en ä, ö, ü, en alemany i altres llengües, ë en albanès i en ladí, que li canvia la qualitat (so) de la vocal. En alemany, aquesta marca s'escrivia, antigament, amb una petita i per sobre de la vocal afectada. L'ortografia alemanya moderna accepta ae, oe, i ue com a variants quan l'umlaut és inviable.
  • La dièresi (que és una marca idèntica a l'umlaut) en ä, ë, ï, ö, ü, en diverses llengües, indica que la vocal es pronuncia per separat de la la lletra que la precedeix, quan aquesta no hi forma diftong. En castellà, la ü després de g, abans de E, O, I marca que no és muda i s'oposa a "gueix gui", per exemple ahogar - desguace. En català, també s'usa la dièresi (a part en la u, amb la mateixa funció que en espanyol) també s'usa en la i. En aquest cas, s'usa per trencar un diftong i s'hi posaria accent, però si no compleix les normes adequades d'accentuació, es posa dièresi.
  • El punt per sobre en c, g, Z, en maltès, Z en polonès i en lituà, i B, C, D, F, G, m, p, t, en ortografia tradicional irlandesa denota lenició.
  • El punt per sota de A A, a, E, i, I, o o o, u u, en vietnamita.
  • L'ogonek en ą, ę, į, ų, en polonès i lituà.
  • El macron en a i I o U, en letó, maori, hawaià, samogitià (dialecte del lituà), rōmaji (japonès romanitzat) i llatí (quan s'indica durada de la vocal).
  • El doble accent agut en o, U, en hongarès, representa versions llargues de les vocals amb umlaut ö i ü.
  • El breu en a en romanès, G en turc, i en U en esperanto i en l'alfabet łacinka del bielorús.
  • La coma per sota, utilitzada com a s i t en romanès (sovint presentada com un diacrític en fonts tipogràfiques). També s'usa per a K, L, N, R, en letó. En l'alfabet fonètic internacional també s'usa.
  • La i sense punt (un "diacrític negatiu") ı s'usa en turc.
  • El ganxo com a a a a e i I o o o u u i, en vietnamita.
  • La barra com en đ, en vietnamita, i la versió amb l'alfabet llatí en llengua sèrbia. Utilitzada també en t del sami septentrional.
  • El punt volat, emprat en català (l·l) i en occità (n·h), que distingeix lletres que s'han de pronunciar per separat dels dígrafs ll i nh.

Hi ha més signes diacrítics i altres usos dels que s'han descrit aquí, que es poden observar en altres alfabets derivats del llatí.

Lletres especials i amb diacrítics dels alfabets derivats[modifica | modifica el codi]

  • Diacrítics - ' ` ^ ˆ ˇ ˉ ˘ ˙ ˚ ˛ ˜ ˝ ̃ ̉
  • Alemany - äöü ß ÄÖÜ
  • Albanès - çë ÇË
  • Aragonès
  • Asturià - áéíóú ü ñ ḷḷ ḥ ÁÉÍÓÚ Ü Ñ Ḷḷ Ḥ
  • Basc - ŕ Ŕ. Actualment, aquesta lletra està totalment en desús, i en el seu lloc s'usa el dígraf rr.
  • Català - àèò ïü éíóú ç l·l ÀÈÒ ÏÜ ÉÍÓÚ Ç L·L
  • Castellà - áéíóú ü ñ ÁÉÍÓÚ Ü Ñ
  • Croat -
  • Danès - æøå ÆØÅ
  • Eslovac -
  • Esperanto - ĉĝĥĵŝŭ ĈĜĤĴŜŬ
  • Estoni - äöü õ ÄÖÜ Õ
  • Finès - äö ÄÖ
  • Francès - é àèù âêîôû ëï ç œ É ÀÈÙ ÂÊÎÔÛ ËÏ Ç Œ
  • Gaèlic escocès - àèìòù ÀÈÌÒÙ
  • Gaèlic irlandès - áéíóú ÁÉÍÓÚ
  • Gallec - áéíóú ïü ñ ÁÉÍÓÚ ÏÜ Ñ
  • Hongarès - áéíóú öü őű ÁÉÍÓÚ ÖÜ ŐŰ
  • Islandès - áéíóú ð þ æ ö ÁÉÍÓÚÝ Ð Þ Æ Ö
  • Italià - àèìòù ÀÈÌÒÙ
  • Letó - āīūž ĀĪŪŽ
  • Lituà - ąėšųž ĄŲŽ
  • Maltès - ċġħż ĊĠĦŻ
  • Neerlandès - éó ë ij ÉÓ Ë IJ
  • Noruec - æøå ÆØÅ
  • Occità - àèò ïü áéíóú ç n·h s·h ÀÈÒ ÏÜ ÁÉÍÓÚ Ç N·H S·H
  • Pīnyīn (xinès romanitzat) - áàāǎ éèēě íìīǐ óòōǒ úùūǔ üǘǜǖǚ ÁÀĀĂ ÉÈĒĔ ÍÌĪĬ ÓÒŌŎ ÚÙŪŬ ÜǗǛǕǙ
  • Polonès - ąćęłńóśźż ĄĆĘŁŃÓŚŹŻ
  • Portuguès - áéíóú âêô ãõ à ü ç ÁÉÍÓÚ ÂÊÔ ÃÕ À Ü Ç
  • Romanès - âăî şţ ÂĂÎ ŞŢ
  • Suec - äåö ÄÅÖ
  • Turc - öü ı çğş ÖÜ İ ÇĞŞ
  • Txec - áéíóúý ů čďřšťž ÁÉÍÓÚÝ Ů ČĎŘŠŤŽ
  • Vietnamita - aáàảãạ ăắằẳẵặ âấầẩẫậ eéèẻẽẹ êếềểễệ iíìỉĩị oóòỏõọ ôốồổỗộ ơớờởỡợ uúùủũụ ưứừửữự yýỳỷỹỵ đ AÁÀẢÃẠ ÂẤẦẨẪẬ ĂẮẰẲẴẶ EÉÈẺẼẸ ÊẾỂỂỄỆ IÍÌỈĨỊ OÓÒỎÕỌ ÔỐỒỔỖỘ ƠỚỜỞỠỢ UÚÙỦŨỤ ƯỨỪỬỮỰ YÝỲỶỸỴ Ð

Evolució[modifica | modifica el codi]

Es manté, generalment, que els llatins van adoptar la variant occidental de l'alfabet grec al segle VII aC de la colònia grega de Cumas (sud d'Itàlia). L'antic alfabet etrusc va ser derivat de l'alfabet de Cumas, i els llatins, finalment, van adoptar 21 de les 26 lletres etrusques originals.

En l'alfabet original llatí:

  • C representava g i k.
  • I representava i i j.
  • V representava u i v.

Més endavant, la Z es va perdre i una nova lletra, G, es va adoptar en la seva posició, inventada per Sp Servilius Ruga. Un intent per l'emperador Claudi d'introduir tres noves lletres (lletres clàudies) va durar poc de temps; però, després de la conquesta de Grècia en el segle I aC, les lletres Y i Z van ser adoptada i readoptada, respectivament, i situades al final. El nou alfabet llatí contenia 23 caràcters:

Lletra A B C D E F G H I K L M N O P Q R S T V X Y Z
Nom llatí ā ē ef ī el em en ō er es ū ex ī Graeca zēta
Pronúncia
(AFI)
[aː] [beː] [tſeː] [deː] [eː] [ɛf] [geː] [haː] [iː] [kaː] [ɛl] [ɛm] [ɛn] [oː] [peː] [kuː] [ɛr] [ɛs] [teː] [uː] [ɛks] [iː 'graɪka] ['dzeːta]
La inscripció d'amos, datada al segle VI aC, mostra la forma més antiga coneguda de l'alfabet llatí arcaic.

La W està formada per dues ves (VV) o us (UU). Va ser afegida en temps romans tardans per a representar un so alemany. Les lletres U i J, de manera similar, es consideraven originalment com a variants de V i I, respectivament.

Noms de les lletres[modifica | modifica el codi]

Els noms llatins d'algunes lletres són discutits. La H, probablement, tenia un altre nom en el llatí parlat: basant-se en les llengües romàniques actuals, aquest ha d'haver estat HACA, a conseqüència de perdre el so en èpoques tardanes del llatí, ja que era necessari distingir-la de la [a]. En general, de qualsevol manera, els romans no feien servir els noms tradicionals (derivats dels semites) com en grec: els noms de les consonants oclusives foren formats afegint [i ː] al so (excepte C, K i Q, en les quals es necessitava una vocal diferent per a distingir-les, i els noms de les fricatives consistir en el seu so en si, o en el so precedit de [ɛ].

Quan es va introduir la lletra I va ser, probablement, anomenada hi [hi ː], com en grec (el nom ípsilon no era utilitzat encara), però es va canviar per i graeca ( "i grega") quan el so [i] i [i] es barreja en llatí. A la Z se li va donar el seu nom grec, zeta. No va ser fins a l'edat mitjana que es va afegir la J (que representava la I no sil·làbica), la U i la W (per a distingir-les de la V).

Majúscules i minúscules[modifica | modifica el codi]

L'alfabet utilitzat pels romans comprenia únicament les lletres majúscules. Les minúscules es van desenvolupar, a partir de la grafia cursiva, a l'edat mitjana, primer com a escriptura uncial i després com a escriptura minúscula. Les antigues lletres romanes es van mantenir per a inscripcions formals i per a donar èmfasi en documents escrits.

Les llengües que usen l'alfabet llatí, generalment, fan servir lletres majúscules per a començar paràgrafs i frases, i per a noms propis. Les regles de les majúscules han canviat al llarg del temps i no són les mateixes per a tots els idiomes. A diferència de l'espanyol, idiomes com l'anglès usen la majúscula inicial per a llengües, nacionalitats i mesos, entre d'altres; l'alemany modern capitalitza tots els noms; el polonès capitalitza els pronoms.

Expansió de l'alfabet llatí[modifica | modifica el codi]

L'alfabet llatí es va expandir des d'Itàlia, amb la llengua llatina, a les terres del voltant del mar Mediterrani amb l'expansió de l'imperi romà. La part est de l'Imperi romà, incloent-hi Grècia, Àsia Menor, Llevant i Egipte, va continuar fent servir la llengua grega com a lingua franca, però el llatí era àmpliament parlat a la part oest de l'imperi. Del llatí, es van desenvolupar les llengües romàniques occidentals, incloent-hi l'espanyol, el francès, el català, el portuguès i l'italià, que van continuar utilitzant i adaptant l'alfabet llatí. Amb l'expansió del cristianisme, l'alfabet llatí es va estendre als pobles del nord d'Europa, que parlaven llengües germàniques, i va desplaçar els seus anteriors alfabets rúnics. El mateix succeí amb les llengües bàltiques, com ara el lituà i el letó, i en moltes llengües no indoeuropees com les finoúgriques, notablement l'hongarès, el finès i l'estonià. Durant l'edat mitjana, l'alfabet llatí es va començar a utilitzar entre els parlants de les llengües eslaves occidentals, incloent-hi els ancestres dels polonesos, txecs, croats, eslovens i eslovacs moderns; a mesura que adoptaven el catolicisme romà, els parlants de les llengües eslaves orientals, generalment, van adoptar el cristianisme ortodox i l'alfabet ciríl·lic.

Fins al 1492, l'alfabet llatí estava limitat a les llengües parlades a l'Europa occidental, nord i central. Els eslaus cristians ortodoxos de l'est i sud d'Europa, majoritàriament, feien servir l'alfabet ciríl·lic, i l'alfabet grec se seguia usant entre els parlants grecs al voltant de la Mediterrània oriental. L'alfabet àrab es va estendre àmpliament entre l'Islam, entre nacions àrabs i no àrabs, com Iran, Indonesia, Malàisia i Turquia. La major part de la resta d'Àsia feia servir una varietat d'alfabet brāhmī (devanagari) o l'escriptura xinesa.

Al llarg dels darrers 500 anys, l'alfabet llatí s'ha expandit per tot el món. Ha arribat a Amèrica, Austràlia i parts d'Àsia, Àfrica i el Pacífic sota les colònies europees, mitjançant les llengües espanyola, portuguesa, anglesa, francesa i neerlandesa. Al segle XVII, els romanesos van adoptar l'alfabet llatí; tot i que el romanès és una llengua romànica, els romanesos eren predominantment cristians ortodoxos i, fins al segle XIX l'Església feia servir l'alfabet ciríl·lic. Vietnam, sota domini francès, va adoptar l'alfabet llatí per escriure l'idioma vietnamita, que havia fet servir els caràcters xinesos amb anterioritat. L'alfabet llatí es fa servir també en moltes llengües autronèsies, incloent-hi el tagal i altres idiomes de les Filipines, el malai oficial i l'indonès, que reemplaçà els anteriors alfabets àrab i brāhmī. El 1928, com a part de la reforma de Mustafa Kemal Atatürk, Turquia va adoptar l'alfabet llatí per al turc, reemplaçant l'alfabet àrab. La majoria dels parlants de les llengües turqueses de l'antiga URSS, incloent-hi els tàrtars, els bashkiris, àzeri, els kazakhs, els kirguís, etc., van usar l'alfabet turquès uniforme en els anys trenta del segle XX. En els anys quaranta, tots aquests alfabets van ser reemplaçats pel ciríl·lic. Després del col·lapse de la Unió Soviètica, el 1991, moltes de les noves repúbliques de parla turquesa, van adoptar l'alfabet llatí, reemplaçant el ciríl·lic. Azerbaidjan, Uzbekistan i Turkmenistan han adoptat l'alfabet llatí per a les llengües àzeri, uzbeka i turcman, respectivament. En els anys setanta, la República Popular de la Xina va desenvolupar una transliteració oficial del xinès mandarí a l'alfabet llatí, anomenat pinyin, tot i que encara predomina l'ús de caràcters xinesos.

Les llengües eslaves occidentals i la majoria de les del sud fa servir l'alfabet llatí en lloc del ciríl·lic, com a reflex de la religió dominant entre la gent. Ente aquestes, el polonès, fa servir una varietat de diacrítics i dígrafs per a representar valors fonètics especials, com també la l amb barra (l) per a un so semblant a la u en posició inicial de diftongs ([w] en AFI - similar a la w anglesa). El txec utilitza diacrítics com el háček. En croat, eslovè i en la versió llatina del serbi, també s'usen háčeks i accents aguts com en C i barres com en đ. Les llengües dels eslaus orientals de l'Església ortodoxa, generalment usen el ciríl·lic. En serbi, se'n fan servir els dos.

Classificació alfabètica amb extensions[modifica | modifica el codi]

Els alfabets que deriven del llatí tenen classificacions alfabètiques diverses:

  • En l'alfabet alemany, les lletres amb umlaut (Ä, Ö, Ü) són tractades, generalment, com no accentuades o s'escriuen la Ä / ä: AE / ae, la Ö / ö: OE / oe, la Ü / ü: UE / ue; ß es classifica com seg. Això fa l'ordre alfabètic: Arg, Ärgerlich, Arm, Assistant, Aßlar, Assoziation. En els directoris de telèfon i altres llistes de noms semblants, els umlauts es troben on les combinacions de lletres ae, oe, ue. Això fa l'ordre alfabètic: Udet, Übelacker, Uell, Ulle, Ueve, Üxküll, Uffenbach.
  • En asturià, LL i CH tenen tractament de lletra, i no hi és present la J. Així mateix, existeixen els diacrítics Ll (CHE vaquera) i H (H aspirada). La primera representa varietats dialectals de LL "Llum / llum" (Lumbres) o "Ḷḷechi / Llechi" (Llet) i és pronunciat com a j en francès i portuguès, i h representa un so de H aspirada, similar a la H inicial anglesa, per paraules com guaḥe ("nen")
  • En bretó, no hi ha c, però existeixen les lligadures ch i c'h, que són classificades entre b i d. Per exemple: «buzhugenn, chug, c'hoar, daeraouenn» ("cuc de terra", "suc", "germana", "llàgrima").
  • En txec i eslovac, les vocals accentuades tenen una classificació secundària: comparades amb altres lletres, són tractades com la lletra base (A-À, E-É-E, I-Í, O-Ò-Ô, U-Ú - U, I-Ý), però són classificades darrere d'aquesta (per exemple, l'ordre lexicogràfic correcte és BAA, BAA, BAA, bab, bab, bac, Bac, Bac, BAC). Les consonants accentuades tenen classificació primària i són situades immediatament després de les consonants base, amb excepció de d, n i t, que tenen un pes secundari. CH es considera una lletra separada i va entre H i I. En eslovac, DZ i DZ també es consideren lletres per separat i se situen entre D i E (A-À-Ä-BC-C-D-D-DZ-DZ-E-É...).
  • En croat i serbi i les llengües eslaves familiars, els cinc caràcters accentuats i els tres dígrafs es classifiquen després de l'original: …C, C, C, D, DZ, DJ, E,…, L, LJ, M, N, NJ, O,…, S, s, t,…, Z, Z.
  • En els alfabets danès i noruec, hi ha les mateixes vocals extres que en suec (vegeu avall), però en diferent ordre i amb diferents glifs (…X, Y, Z, Æ, Ø, Å). A més, Aa es classifica com una equivalència de Å. L'alfabet danès ha vist, tradicionalment, la W com una variant de V, però avui dia es considera una lletra per separat.
  • En esperanto, tant les consonants amb accent circumflex (C, G, H, J, S), com la U (o amb breu), es compten com lletres separades i es classifiquen separadament (C, C, d, e, f, g, g, h, h, i, j, js, s, t, u, u, v, z).
  • En estonià, o, ä, ö i ü es consideren lletres separades i se situen darrere de la w. Les lletres š, ZY Z apareixen només en préstecs i noms propis estrangers i segueixen a la lletra en el seu alfabet que, sinó, no es diferencia de l'alfabet llatí.
  • En feroès, també es tenen algunes de les lletres daneses, noruegues i sueques, com Æ i Ø. A banda d'això, l'alfabet feroès utilitza la lletra islandesa eth ð, que segueix a la D. Cinc de les sis vocals (A, I, O, U i I) poden tenir accents i se situen després de la vocal base. Les consonants C, Q, X, W i Z no hi apareixen. Per tant, les cinc primeres lletres són A, À, B, D i Ð, i les últimes cinc V, I, Ý, Æ, Ø.
  • En filipí i en altres llengües de les Filipines, la lletra Ng es considera una lletra per separat. A més, lletres derivades (com Ñ) segueixen la lletra base. En filipí, també s'usen diacrítics, però no pas àmpliament, excepte l'accent (~).
  • L'alfabet finès i les seves normes de classificació alfabètica són iguals a les del suec, amb excepció de les addicionals S i Z, que es consideren variants de S i Z.
  • En l'alfabet francès i anglès, els caràcters amb dièresi (a, e, i, ö, ü, ÿ) es tracten, normalment, igual que les lletres inaccentuades. De tota manera, el llibre d'Unicode 3.0 explicita regles més específiques per a la classificació tradicional de les lletres accentuades franceses.
  • El gal·lès també té regles complexes: les combinacions CH, DD, FF, NG, LL, PH, RH i TH es consideren lletres simples, i cadascuna es llista darrere de la primera lletra del dígraf, amb l'excepció de NG, que es llista després de G. Això no obstant, la situació és més complicada, ja que aquestes combinacions no són sempre lletres simples. Un exemple de l'ordre és: LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH: la darrera d'aquestes paraules és una juxtaposició de Llona i GYFARCH, i, contràriament a LLONG, no conté la lletra NG.
  • Les vocals hongareses tenen accents, umlauts i dobles accents, mentre que les consonants s'escriuen soles o en dígrafs. En la classificació, les vocals accentuades segueixen a les no accentuades i els dígrafs segueixen a la lletra simple original. L'ordre alfabètic hongarès és: A, À, B, C, CS, D, E, È, F, G, GY, H, I, Í, J, K, L, LY, M, N, NY, O, Ò, ò, ó, P, Q, R, S, SZ, T, TY, U, Ú, Ü, U, V, W, X, Y, Z, ZS. (Per exemple, l'ordre lexicogràfic correcte és BAA, BAA, bab, bac, bacs,…, baz, bazs, BAA, BAA, bab, Bac, Bács).
  • En islandès s'hi afegeix Þ, i a D la segueix Ð. Cada vocal (A, E, I, O, U, I) està seguida per la seva corresponent amb accent agut: a, e, i, Ó, Ú, Ý. No hi ha Z, i Þ, Æ, Ö se situen després de Ý.
    • Dues lletres usades pels escrivans anglosaxons, que també van usar la lletra rúnic wynn (Ƿ) per a representar / w /.
    • Thorn (Þ) també és una lletra rúnic.
    • Eth (Ð) és la lletra D amb una barra.
  • En neerlandès, la combinació IJ (IJ), va ser antigament situada com a I (o de vegades, com una lletra separada I <IJ <Z), però, actualment, es classifica com a dues lletres (II <IJ <IK). Els directoris de telèfon són excepcions; IJ se situa sempre com a I, ja que en molts cognoms s'usa I quan l'ortografia moderna hi hagués requerit IJ. Noteu que les paraules que comencen amb ij capitalitzen les dues lletres, com per exemple: ciutat de IJmuiden (Velsen) i el riu IJssel.
  • En polonès, els caràcters amb accent agut, ogonek o amb punt, se situen després de la lletra base: A, A, B, C, C, D, E, e,…, L, L, M, N, N, O, O, P,…, S, s, t,…, Z, Z, Z. Això és perquè representen diferents sons, no sols variacions d'un mateix fonema (en polonès col·loquial, E i i es diferencien només del seu tret d'oralitat-nasal, encara que, tradicionalment, s'haguessin diferenciat en més; Ó representa el so idèntic a U, vocal que també és utilitzada en la llengua). Totes, excepte les que tenen ogonek, poden perdre'l, segons el cas en què estan. Quan això succeeix, s'hi afegeix, generalment, i darrere de la lletra o davant en el cas de Z. En aquests casos, són tractats com dues lletres per separat. També tenen dígrafs com ara sz o RZ, que són tractats com dues lletres, també.
  • En romanès, els caràcters especials derivats de l'alfabet llatí se situen després dels originals: A, a, Â,…, I, Î,…, S, S, T, t,…, Z.
  • En l'alfabet suec, W és una variant de V, i no una lletra per separat. De tota manera, es manté en noms com "William". L'alfabet també té tres vocals extra, que se situen al final (…, X, Y, Z, Å, Ä, Ö).
  • Algunes llengües tenen regles més complexes: l'abecedari espanyol va tractar la CH i la LL com a lletres per separat (fins al 1994), ordenant d'aquesta manera: CINC, CREDA, Chispa i LLOM, LLUM, LLAMA. Això no succeeix així avui en dia, la RAE va adoptar-ne l'ús més convencional, i ara LL se situa entre LK i LM, i CH entre CG i CI. L'única classificació alfabètica especial en espanyol és Ñ (eñe), que es tracta com una lletra a banda i se situa després de N.
  • En tàtar i turc, hi ha 9 lletres addicionals. 5 d'aquestes són vocals, aparellades amb les lletres originals com una durada suau: a-ä, o-ö, u-ü, í-i, ı electrònics. Les quatre que queden: s és la sh anglesa, ç és ch, ñ és ng i G és gh.

L'Unicode collation Algorithm (Algorisme de situació alfabètica d'Unicode) pot ser usat per obtenir qualsevol de les seqüències descrites aquí.

Vegeu també[modifica | modifica el codi]

Referències[modifica | modifica el codi]

  1. Norris, Jeffrey Singley. Perceptually Motivated Symbol Generation (en anglès). ProQuest, 2008, p. 14. ISBN ProQuest. 

Enllaços externs[modifica | modifica el codi]