Romanización - Romanization

El chino mandarín , como muchos idiomas, se puede romanizar de varias formas; arriba: chino tradicional y simplificado , y Hanyu Pinyin , Gwoyeu Romatzyh , Wade-Giles y Yale

Romanización o romanización , en la lingüística , es la conversión de texto desde un diferente sistema de escritura a la escritura romana (en latín) , o un sistema para hacerlo. Los métodos de romanización incluyen la transliteración , para representar texto escrito, y la transcripción , para representar la palabra hablada, y combinaciones de ambos. Los métodos de transcripción se pueden subdividir en transcripción fonémica , que registra los fonemas o unidades de significado semántico en el habla, y transcripción fonética más estricta , que registra los sonidos del habla con precisión.

Métodos

Hay muchos sistemas de romanización uniformes o estandarizados . Se pueden clasificar por sus características. Las características de un sistema en particular pueden hacer que sea más adecuado para diversas aplicaciones, a veces contradictorias, incluida la recuperación de documentos, el análisis lingüístico, la facilidad de lectura y la representación fiel de la pronunciación.

  • Idioma de origen o donante: un sistema puede adaptarse para romanizar el texto de un idioma en particular, o una serie de idiomas, o para cualquier idioma en un sistema de escritura en particular. Un sistema específico del idioma generalmente conserva características del idioma como la pronunciación, mientras que el general puede ser mejor para catalogar textos internacionales.
  • Idioma de destino o receptor: la mayoría de los sistemas están destinados a una audiencia que habla o lee un idioma en particular. (Los llamados sistemas internacionales de romanización para el texto cirílico se basan en alfabetos centroeuropeos como el checo y el croata ).
  • Simplicidad: dado que el alfabeto latino básico tiene un número menor de letras que muchos otros sistemas de escritura, se deben usar dígrafos , diacríticos o caracteres especiales para representarlos a todos en escritura latina. Esto afecta la facilidad de creación, almacenamiento y transmisión digital, reproducción y lectura del texto romanizado.
  • Reversibilidad: si el original se puede restaurar o no a partir del texto convertido. Algunos sistemas reversibles permiten una versión simplificada irreversible.

Transcripción

Si la romanización intenta transliterar el guión original, el principio rector es un mapeo uno a uno de los caracteres del idioma de origen en el guión de destino, con menos énfasis en cómo suena el resultado cuando se pronuncia de acuerdo con el idioma del lector. Por ejemplo, la romanización Nihon-shiki del japonés permite al lector informado reconstruir las sílabas kana japonesas originales con un 100% de precisión, pero requiere conocimientos adicionales para una pronunciación correcta.

Transcripción

Fonémica

La mayoría de las romanizaciones están destinadas a permitir que el lector casual que no está familiarizado con la escritura original pronuncie el idioma de origen con razonable precisión. Tales romanizaciones siguen el principio de la transcripción fonémica e intentan traducir los sonidos significativos ( fonemas ) del original lo más fielmente posible en el idioma de destino. La popular romanización Hepburn del japonés es un ejemplo de romanización transcriptiva diseñada para angloparlantes.

Fonético

Una conversión fonética va un paso más allá e intenta representar todos los teléfonos en el idioma de origen, sacrificando la legibilidad si es necesario mediante el uso de caracteres o convenciones que no se encuentran en el guión de destino. En la práctica, tal representación casi nunca intenta representar todos los alófonos posibles, especialmente aquellos que ocurren naturalmente debido a los efectos de la coarticulación , y en cambio se limita a las distinciones alofónicas más significativas. El Alfabeto Fonético Internacional es el sistema más común de transcripción fonética.

Compensaciones

Para la mayoría de los pares de idiomas, construir una romanización utilizable implica compensaciones entre los dos extremos. Las transcripciones puras generalmente no son posibles, ya que el idioma de origen generalmente contiene sonidos y distinciones que no se encuentran en el idioma de destino, pero que deben mostrarse para que la forma romanizada sea comprensible. Además, debido a la variación diacrónica y sincrónica, ningún idioma escrito representa ningún idioma hablado con perfecta precisión y la interpretación vocal de un guión puede variar en gran medida entre los idiomas. En los tiempos modernos, la cadena de transcripción suele ser la lengua extranjera hablada, la lengua extranjera escrita, la lengua materna escrita, la lengua materna hablada (leída). Reducir el número de esos procesos, es decir, eliminar uno o ambos pasos de la escritura, generalmente conduce a articulaciones orales más precisas. En general, fuera de una audiencia limitada de académicos, las romanizaciones tienden a inclinarse más hacia la transcripción. Como ejemplo, considere el arte marcial japonés 柔 術: la romanización Nihon-shiki zyûzyutu puede permitir que alguien que sepa japonés reconstruya las sílabas kanaじ ゅ う じ ゅ つ, pero la mayoría de los hablantes nativos de inglés, o más bien los lectores, encontrarían más fácil adivinar la pronunciación. de la versión de Hepburn, jūjutsu .

Romanización de sistemas de escritura específicos

Arábica

El alfabeto árabe se utiliza para escribir árabe , persa , urdu y pashto , así como muchos otros idiomas en el mundo musulmán, particularmente los idiomas africanos y asiáticos sin alfabetos propios. Los estándares de romanización incluyen lo siguiente:

  • Deutsche Morgenländische Gesellschaft (1936): adoptado por la Convención Internacional de Eruditos Orientalistas en Roma. Es la base del muy influyente diccionario Hans Wehr ( ISBN  0-87950-003-4 ).
  • BS 4280 (1968): desarrollado por la British Standards Institution
  • SATTS (década de 1970): un sistema de sustitución uno por uno, un legado de la era del código Morse
  • UNGEGN (1972)
  • DIN 31635 (1982): desarrollado por el Deutsches Institut für Normung (Instituto Alemán de Normalización)
  • ISO 233 (1984). Transcripción.
  • Qalam (1985): un sistema que se centra en preservar la ortografía, en lugar de la pronunciación, y utiliza mayúsculas y minúsculas
  • ISO 233-2 (1993): transliteración simplificada.
  • Transliteración de Buckwalter (década de 1990): desarrollada en Xerox por Tim Buckwalter ; no requiere signos diacríticos inusuales
  • ALA-LC (1997)
  • Alfabeto de chat árabe

latín

La romanización como transcripción fonética no es necesaria para este guión. Los alfabetos latinos cuando se transcriben solo se escriben una vez sin romanización.

persa

armenio

georgiano

griego

Existen sistemas de romanización tanto para el griego moderno como para el antiguo .

hebreo

El alfabeto hebreo se romaniza utilizando varios estándares:

  • ANSI Z39.25 (1975)
  • UNGEGN (1977)
  • ISO 259 (1984): Transliteración.
  • ISO 259-2 (1994): transliteración simplificada.
  • ISO / DIS 259-3: Transcripción fonética.
  • ALA-LC

Escrituras índicas (brahmicas)

La familia brahmica de abugidas se utiliza para las lenguas del subcontinente indio y el sudeste asiático. Existe una larga tradición en occidente de estudiar sánscrito y otros textos índicos en transliteración latina. Se han utilizado varias convenciones de transliteración para las escrituras índicas desde la época de Sir William Jones.

Devanagari – nastaʿlīq (indostaní)

El indostaní es una lengua indo-aria con extrema digrafia y diglosia como resultado de la controversia entre hindi y urdu que comenzó en el siglo XIX. Técnicamente, el hindustani en sí no es reconocido ni por la comunidad lingüística ni por ningún gobierno. Dos registros estandarizados , hindi estándar y urdu estándar , están reconocidos como idiomas oficiales en India y Pakistán. Sin embargo, en la práctica la situación es,

  • En Pakistán: Urdu estándar (Saaf o Khaalis) es la variedad "alta", mientras que Hindustani es la variedad "baja" utilizada por las masas (llamada Urdu, escrita en escritura nastaʿlīq ).
  • En India, tanto el hindi estándar (Shuddh) como el urdu estándar (Saaf o Khaalis) son las variedades "H" (escritas en devanagari y nastaʿlīq respectivamente), mientras que el hindi es la variedad "L" utilizada por las masas y escrita en devanagari o nastaʿlīq (y llamado 'Hindi' o 'Urdu' respectivamente).

La digraphia hace que cualquier trabajo en cualquiera de los guiones sea en gran medida inaccesible para los usuarios del otro guión, aunque por lo demás el hindustani es un lenguaje perfectamente inteligible entre sí, lo que esencialmente significa que cualquier tipo de colaboración de código abierto basada en texto es imposible entre los lectores devanagari y nastaʿlīq.

Iniciada en 2011, la Iniciativa Hamari Boli es una iniciativa de planificación lingüística de código abierto a gran escala dirigida a la escritura, el estilo, el estado y la reforma léxica y modernización del hindustani. Uno de los principales objetivos declarados de Hamari Boli es aliviar al indostaní de la paralizante devanagari – nastaʿlīq digraphia mediante la romanización.

chino

La romanización de las lenguas siníticas , en particular el mandarín , ha resultado ser un problema muy difícil, aunque la cuestión se complica aún más por consideraciones políticas. Debido a esto, muchas tablas de romanización contienen caracteres chinos más una o más romanizaciones o Zhuyin .

mandarín

China continental
  • Hanyu Pinyin (1958): En China continental , Hanyu Pinyin se ha utilizado oficialmente para romanizar el mandarín durante décadas, principalmente como una herramienta lingüística para enseñar el idioma estandarizado. El sistema también se utiliza en otras áreas de habla china como Singapur y partes de Taiwán , y ha sido adoptado por gran parte de la comunidad internacional como estándar para escribir palabras y nombres chinos en alfabeto latino. El valor de Hanyu Pinyin en la educación en China radica en el hecho de que China, como cualquier otra área poblada con área y población comparables, tiene numerosos dialectos distintos , aunque solo hay un idioma escrito común y una forma hablada común estandarizada. (Estos comentarios se aplican a la romanización en general)
  • ISO 7098 (1991): Basado en Hanyu Pinyin.
Taiwán
  1. Gwoyeu Romatzyh (GR, 1928–1986, en Taiwán 1945–1986; Taiwán usó el japonés Romaji antes de 1945),
  2. Símbolos fonéticos mandarín II (MPS II, 1986-2002),
  3. Tongyong Pinyin (2002-2008) y
  4. Hanyu Pinyin (desde el 1 de enero de 2009).
Singapur

Cantonés

Min Nan o Hokkien

Teochew

Min Dong

Min Bei

japonés

La romanización (o, más generalmente, las letras romanas ) se llama " rōmaji " en japonés . Los sistemas más comunes son:

  • Hepburn (1867): transcripción fonética a las prácticas angloamericanas, utilizada en nombres geográficos
  • Nihon-shiki (1885): transliteración. También adoptado como ( ISO 3602 Strict ) en 1989.
  • Kunrei-shiki (1937): transcripción fonémica. También adoptado como ( ISO 3602 ).
  • JSL (1987): transcripción fonémica. El nombre del libro Japanese: The Spoken Language de Eleanor Jorden.
  • ALA-LC : similar a la Hepburn modificada
  • Wāpuro : ("romanización del procesador de textos") transliteración. No es estrictamente un sistema, sino una colección de prácticas comunes que permite la entrada de texto en japonés.

coreano

Si bien la romanización ha tomado varias formas y en ocasiones aparentemente no estructuradas, existen algunos conjuntos de reglas:

  • McCune-Reischauer (MR; ¿1937?), La primera transcripción que obtuvo cierta aceptación. Una versión ligeramente modificada de MR fue el sistema oficial para el coreano en Corea del Sur de 1984 a 2000 y, sin embargo, una modificación diferente sigue siendo el sistema oficial en Corea del Norte . Utiliza breves , apóstrofes y diereses , los dos últimos indican límites de sílabas ortográficas en casos que de otro modo serían ambiguos.
    Lo que se llama MR puede ser en muchos casos cualquiera de una serie de sistemas que difieren entre sí y del MR original principalmente en si las terminaciones de las palabras están separadas de la raíz por un espacio, un guión o, según el sistema de McCune y Reischauer, para nada; y si se usa un guión o un espacio, si el cambio de sonido se refleja en la última letra consonante de la raíz y en la primera terminación (por ejemplo, pur-i vs. pul-i ). Aunque en su mayoría irrelevantes cuando se transcriben palabras sin inflexiones, estas aberraciones están tan extendidas que cualquier mención de la "romanización McCune-Reischauer" no necesariamente se refiere al sistema original publicado en la década de 1930.
    • Existe, por ejemplo, el sistema ALA-LC / Biblioteca del Congreso de los Estados Unidos, basado en MR pero con algunas desviaciones. La división de palabras se aborda en detalle, con un uso generoso de espacios para separar las terminaciones de las palabras de las raíces que no se ven en MR. Las sílabas de los nombres de pila siempre se separan con un guión, lo que expresamente nunca lo hace MR. Los cambios de sonido se ignoran con más frecuencia que en la RM. Distingue entre ' y ' .

Varios problemas con MR llevaron al desarrollo de sistemas más nuevos:

  • Yale (1942): este sistema se ha convertido en la romanización estándar establecida para el coreano entre los lingüistas . La longitud de la vocal en la pronunciación antigua o dialectal se indica con un macron . En los casos que de otro modo serían ambiguos, los límites de las sílabas ortográficas se indican con un punto. Este sistema también indica consonantes que han desaparecido de la ortografía surcoreana y la pronunciación estándar de una palabra .
  • Romanización revisada del coreano (RR; 2000): incluye reglas tanto para la transcripción como para la transliteración. Corea del Sur ahora usa oficialmente este sistema que fue aprobado en 2000. Se requirió que las señales de tránsito y los libros de texto siguieran estas reglas lo antes posible, a un costo estimado por el gobierno en al menos 20 millones de dólares estadounidenses. Se han cambiado todas las señales de tráfico, los nombres de las estaciones de tren y metro en los mapas de líneas y las señales, etc. El cambio ha sido ignorado o protegido en algunos casos, en particular la romanización de nombres y empresas existentes. RR es generalmente similar a MR, pero no usa signos diacríticos ni apóstrofes, y usa letras distintas para ㅌ / ㄷ (t / d), ㅋ / ㄱ (k / g), ㅊ / ㅈ (ch / j) y ㅍ / ㅂ ( p / b). En casos de ambigüedad, los límites de las sílabas ortográficas estaban destinados a indicarse con un guión , pero esto se aplica de manera inconsistente en la práctica.
  • ISO / TR 11941 (1996): En realidad, se trata de dos estándares diferentes bajo un nombre: uno para Corea del Norte (RPDC) y el otro para Corea del Sur (ROK). La presentación inicial a la ISO se basó en gran medida en Yale y fue un esfuerzo conjunto entre ambos estados, pero no pudieron ponerse de acuerdo sobre el borrador final.
  • Romanización de Lukoff , desarrollada entre 1945 y 1947 para sus libros de texto de coreano hablado

tailandés

El tailandés , que se habla en Tailandia y en algunas áreas de Laos, Birmania y China, está escrito con su propia escritura , probablemente descendiente de una mezcla de tai-laosiano y antiguo jemer , en la familia brahmica .

Nuosu

El idioma Nuosu , hablado en el sur de China, está escrito con su propia escritura, la escritura Yi . El único sistema de romanización existente es YYPY (Yi Yu Pin Yin), que representa el tono con letras adjuntas al final de las sílabas, ya que Nuosu prohíbe las codas. No usa diacríticos y, como tal, debido al gran inventario fonémico de Nuosu, requiere el uso frecuente de dígrafos, incluso para vocales monoftonas.

cirílico

En los catálogos de bibliotecas, bibliografías y la mayoría de las publicaciones académicas en inglés, el método de transliteración de la Biblioteca del Congreso se utiliza en todo el mundo.

En lingüística, la transliteración científica se utiliza para los alfabetos cirílico y glagolítico . Esto se aplica al antiguo eslavo eclesiástico , así como a los idiomas eslavos modernos que utilizan estos alfabetos.

Bielorruso

búlgaro

Un sistema basado en la transliteración científica e ISO / R 9: 1968 se consideró oficial en Bulgaria desde la década de 1970. Desde finales de la década de 1990, las autoridades búlgaras han optado por el denominado sistema aerodinámico, evitando el uso de signos diacríticos y optimizado para su compatibilidad con el inglés. Este sistema se convirtió en obligatorio para el uso público con una ley aprobada en 2009. Cuando el sistema antiguo usa <č, š, ž, št, c, j, ă>, el nuevo sistema usa <ch, sh, zh, sht, ts, y, a>.

El nuevo sistema búlgaro fue aprobado para uso oficial también por la ONU en 2012, y por BGN y PCGN en 2013.

Kirguís

macedónio

ruso

No existe un sistema único universalmente aceptado para escribir ruso utilizando la escritura latina; de hecho, hay una gran cantidad de tales sistemas: algunos están ajustados para un idioma de destino en particular (por ejemplo, alemán o francés), algunos están diseñados como una transliteración de bibliotecarios, algunos se prescriben para los pasaportes de viajeros rusos; la transcripción de algunos nombres es puramente tradicional. Todo esto ha resultado en una gran duplicación de nombres. Por ejemplo, el nombre del compositor ruso Tchaikovsky también puede ser escrito como Tchaykovsky , Tchajkovskij , Tchaikowski , Tschaikowski , Czajkowski , Čajkovskij , Čajkovski , Chajkovskij , Çaykovski , Chaykovsky , Chaykovskiy , Chaikovski , Tshaikovski , Tšaikovski , Tsjajkovskij etc. sistemas incluyen:

  • BGN / PCGN (1947): Sistema de transliteración (Junta de Nombres Geográficos de los Estados Unidos y Comité Permanente de Nombres Geográficos para Uso Oficial Británico).
  • GOST 16876-71 (1971): un estándar de transliteración soviético ahora desaparecido. Reemplazado por GOST 7.79, que es un equivalente a ISO 9 .
  • Sistema de romanización de las Naciones Unidas para nombres geográficos (1987): Basado en GOST 16876-71 .
  • ISO 9 (1995): Transliteración. De la Organización Internacional de Normalización .
  • ALA-LC (1997)
  • Codificación "Volapuk" (década de 1990): término de jerga (no es realmente Volapük ) para un método de escritura que no es realmente una transliteración, sino que se usa para objetivos similares (ver artículo).
  • La transliteración en inglés convencional se basa en BGN / PCGN, pero no sigue un estándar en particular. Descrito en detalle en la romanización del ruso .
  • Sistema simplificado para la romanización del ruso.
  • Transliteración comparativa del ruso en diferentes idiomas (europeo occidental, árabe, georgiano, braille, morse)

Siríaco

La escritura latina para el siríaco se desarrolló en la década de 1930, siguiendo la política estatal para las lenguas minoritarias de la Unión Soviética , con algunos materiales publicados.

ucranio

El sistema nacional de Ucrania de 2010 ha sido adoptado por la UNGEGN en 2012 y por la BGN / PCGN en 2020. También está muy cerca del sistema ALA-LC modificado (simplificado), que se ha mantenido sin cambios desde 1941.

  • ALA-LC
  • ISO 9
  • Transliteración nacional ucraniana
  • Sistemas nacionales de Ucrania y BGN / PCGN, en el Grupo de trabajo de la ONU sobre sistemas de romanización
  • Comparación de cinco sistemas de Thomas T. Pedersen

Resumen y resumen

La siguiente tabla muestra la romanización de la transcripción fonémica más común utilizada para varios alfabetos diferentes. Si bien es suficiente para muchos usuarios ocasionales, existen múltiples alternativas para cada alfabeto y muchas excepciones. Para obtener más información, consulte cada una de las secciones de idiomas anteriores. (Los caracteres hangul se dividen en componentes jamo ).

Romanizado IPA griego Ruso ( cirílico ) Amazigh hebreo Arábica persa Katakana Hangul Bopomofo
A a A А ַ, ֲ, ָ َ, ا ا, آ
AE ai̯ / ɛ ΑΙ
AI ai י ַ
B B ΜΠ, Β Á בּ ﺏ ﺑ ﺒ ﺐ ﺏ ﺑ
C Kansas Ξ
CH ʧ TΣ̈ Ч צ׳ چ
CHI ʨi
D D ΝΤ, Δ Д ⴷ, ⴹ ד ﺩ - ﺪ, ﺽ ﺿ ﻀ ﺾ د
DH D Δ דֿ ﺫ - ﺬ
DZ ʣ ΤΖ Ѕ
mi e / ɛ Ε, ΑΙ Э , ֱ, י ֵֶ, ֵ, י ֶ エ, ヱ
EO ʌ
UE ɯ
F F Φ Ф פ (o su forma final ף) ﻑ ﻓ ﻔ ﻒ
FU ɸɯ
GRAMO ɡ ΓΓ, ΓΚ, Γ Г ⴳ, ⴳⵯ ג گ
GH ɣ Γ Ғ גֿ, עֿ ﻍ ﻏ ﻐ ﻎ ق غ
H h Η Һ ⵀ, ⵃ ח, ה ﻩ ﻫ ﻬ ﻪ, ﺡ ﺣ ﺤ ﺢ ه ح ﻫ
DECIR AH decir ah
ÉL él
HOLA Hola
HO Ho
I yo / ɪ Η, Ι, Υ, ΕΙ, ΟΙ И, І ִ, י ִ دِ イ, ヰ
IY ij دِي
J ʤ TZ̈ ДЖ, Џ ג׳ ﺝ ﺟ ﺠ ﺞ ج
JJ ʦ͈ / ʨ͈
K k Κ К ⴽ, ⴽⵯ כּ ﻙ ﻛ ﻜ ﻚ ک
KA ka
KE ke
KH X X Х כ, חֿ (o su forma final ך) ﺥ ﺧ ﺨ ﺦ خ
KI ki
KK
KO ko
KU
L l Λ Л ל ﻝ ﻟ ﻠ ﻞ ل
METRO metro Μ М מ (o su forma final ם) ﻡ ﻣ ﻤ ﻢ م
MAMÁ mamá
ME me
MI mi
mes mes
MU
norte norte Ν Н נ (o su forma final ן) ﻥ ﻧ ﻨ ﻦ ن
N / A n / A
nordeste nordeste
NG norte
NI ɲi
NO no
NU
O o Ο, Ω О , ֳ, וֹֹ ُا
OE ø
PAG pag Π П פּ پ
PÁGINAS pag
PD PD Ψ
Q q Θ ק ﻕ ﻗ ﻘ ﻖ غ ق
R r Ρ Р ⵔ, ⵕ ר ﺭ - ﺮ ر
REAL ACADEMIA DE BELLAS ARTES ɾa
RE el
Rhode Island ɾi
RO ɾo
RU ɾɯ
S s Σ С ⵙ, ⵚ ס, שׂ ﺱ ﺳ ﺴ ﺲ, ﺹ ﺻ ﺼ ﺺ س ث ص
SA sa
SE se
SH ʃ Σ̈ Ш שׁ ﺵ ﺷ ﺸ ﺶ ش
SHCH ʃʧ Щ
SHI ɕi
ASI QUE asi que
SS s
SU
T t Τ Т ⵜ, ⵟ ט, תּ, ת ﺕ ﺗ ﺘ ﺖ, ﻁ ﻃ ﻄ ﻂ ت ط
ejército de reserva ejército de reserva
TE te
TH θ Θ תֿ ﺙ ﺛ ﺜ ﺚ
PARA para
TS ʦ ΤΣ Ц צ (o su forma final ץ)
TSU ʦɯ
TT
U tu ΟΥ, Υ У , וֻּ دُ
Interfaz de usuario ɰi
UW uw دُو
V v B В ב و
W w Ω ו, וו ﻭ - ﻮ
Washington Washington
WAE
NOSOTROS nosotros
Wisconsin y / ɥi
WO wo
X X Ξ, Χ
Y j Υ, Ι, ΓΙ Й, Ы, Ј י ﻱ ﻳ ﻴ ﻲ ی
YA ja Я
YAE
S.M je Е, Є
YEO
YI Ji Ї
YO jo Ё
YU ju Ю
Z z Ζ З ⵣ, ⵥ ז ﺯ - ﺰ, ﻅ ﻇ ﻈ ﻆ ز ظ ذ ض
Z H ʐ / ʒ Ζ̈ Ж ז׳ ژ

Ver también

Referencias

enlaces externos

Sobre la romanización
Romanización en línea