Similitud léxica - Lexical similarity

En lingüística , la similitud léxica es una medida del grado en que los conjuntos de palabras de dos idiomas dados son similares. Una similitud léxica de 1 (o 100%) significaría una superposición total entre vocabularios, mientras que 0 significa que no hay palabras comunes.

Hay diferentes formas de definir la similitud léxica y los resultados varían en consecuencia. Por ejemplo, el método de cálculo de Ethnologue consiste en comparar una lista de palabras estandarizada regionalmente (comparable a la lista de Swadesh ) y contar aquellas formas que muestran similitud tanto en forma como en significado. Utilizando el método tal, Inglés fue evaluado para tener una similitud léxica del 60% con Alemania y el 27% con la francesa .

La similitud léxica se puede utilizar para evaluar el grado de relación genética entre dos idiomas. Los porcentajes superiores al 85% suelen indicar que es probable que los dos idiomas que se comparan sean dialectos relacionados .

La similitud léxica es sólo una indicación de la inteligibilidad mutua de las dos lenguas, ya que la última también depende del grado de similitud fonética, morfológica y sintáctica. Las variaciones debidas a las diferentes listas de palabras influyen en esto. Por ejemplo, la similitud léxica entre el francés y el inglés es considerable en los campos léxicos relacionados con la cultura, mientras que su similitud es menor en lo que respecta a las palabras básicas (funciones). A diferencia de la inteligibilidad mutua, la similitud léxica solo puede ser simétrica.

Lenguas indoeuropeas

La siguiente tabla muestra algunos valores de similitud léxica para pares de lenguas romances, germánicas y eslavas seleccionadas, recopiladas y publicadas por Ethnologue .

Lang.
código
Idioma 1
Coeficientes de similitud léxica
catalán inglés francés alemán italiano portugués rumano Romanche ruso sardo Español
gato catalán 1 - 0,85 - 0,87 0,85 0,73 0,76 - 0,75 0,85
eng inglés - 1 0,27 0,60 - - - - 0,24 - -
fra francés 0,85 0,27 1 0,29 0,89 0,75 0,75 0,78 - 0,80 0,75
deu alemán - 0,60 0,29 1 - - - - - - -
ita italiano 0,87 - 0,89 - 1 - 0,77 0,78 - 0,85 0,82
por portugués 0,85 - 0,75 - - 1 0,72 0,74 - - 0,89
ron rumano 0,73 - 0,75 - 0,77 0,72 1 0,72 - 0,74 0,71
roh Romanche 0,76 - 0,78 - 0,78 0,74 0,72 1 - 0,74 0,74
rus ruso - 0,24 - - - - - - 1 - -
srd sardo 0,75 - 0,80 - 0,85 - 0,74 0,74 - 1 0,76
spa Español 0,85 - 0,75 - 0,82 0,89 0,71 0,74 - 0,76 1
catalán inglés francés alemán italiano portugués rumano Romanche ruso sardo Español
Idioma 2 → gato eng fra deu ita por ron roh rus srd spa

Notas:

  • Los códigos de idioma son de la norma ISO 639-3 .
  • Roberto Bolognesi y Wilbert Heeringa encontraron que la divergencia promedio entre sardo e italiano rondaba el 48,7%, desde un grado mínimo de divergencia dialectal del 46,6% hasta el más alto del 51,1%. Eso haría que los diversos dialectos del sardo sean ligeramente más divergentes del italiano que del español (con un grado medio de divergencia del italiano en torno al 46,0%).
  • "-" indica que los datos de comparación no están disponibles.
  • En el caso de la similitud léxica inglés-francés, al menos otros dos estudios estiman el número de palabras en inglés heredadas directamente del francés en un 28,3% y un 41% respectivamente, con un 28,24% y un 15% de otras palabras en inglés derivadas del latín, respectivamente, -Similitud léxica francesa alrededor de 0.56, con similitudes léxicas inglés-alemán recíprocamente más bajas. Otro estudio estima el número de palabras en inglés con origen en cursiva en un 51%, en consonancia con los dos análisis anteriores.

Ver también

Referencias

  • Ethnologue.com (valores de similitud léxica disponibles en algunas de las entradas de idiomas individuales)
  • Definición de similitud léxica en Ethnologue.com
  • Rensch, Calvin R. 1992. "Calculating léxico similarity". En Eugene H. Casad (ed.), Ventanas sobre el bilingüismo , 13-15. (Instituto de Lingüística de Verano y Publicaciones de Lingüística de la Universidad de Texas en Arlington, 110). Dallas: Instituto de Lingüística de Verano y la Universidad de Texas en Arlington.

Notas

  1. ^ "Sobre el Ethnologue" . Ethnologue . 2012-09-25 . Consultado el 24 de febrero de 2019 .
  2. ^ Ver, por ejemplo, datos de similitud léxica para francés , alemán , inglés
  3. a b "Bolognesi, Roberto; Heeringa, Wilbert. Sardegna fra tante lingue , pp.123, 2005, Condaghes" (PDF) . Archivado desde el original (PDF) el 11 de febrero de 2014 . Consultado el 14 de abril de 2017 .
  4. ^ Finkenstaedt, Thomas; Dieter Wolff (1973). Profusión ordenada; estudios en diccionarios y el léxico inglés . C. Invierno. ISBN 3-533-02253-6.
  5. ^ "Joseph M. Willams, orígenes del idioma inglés en" . Amazon.com . Consultado el 21 de abril de 2010 .
  6. ^ Nación, ISP (2001). Aprender vocabulario en otro idioma . Prensa de la Universidad de Cambridge. pag. 477. ISBN 0-521-80498-1.

enlaces externos