Palabra clave en contexto: Key Word in Context

Palabra clave en contexto ( KWIC ) es el formato más común para las líneas de concordancia . El término KWIC fue acuñado por primera vez por Hans Peter Luhn . El sistema se basó en un concepto llamado palabra clave en títulos que fue propuesto por primera vez para las bibliotecas de Manchester en 1864 por Andrea Crestadoro .

Un índice KWIC se forma ordenando y alineando las palabras dentro del título de un artículo para permitir que cada palabra (excepto las palabras vacías ) de los títulos se pueda buscar alfabéticamente en el índice. Fue un método útil de indexación para manuales técnicos antes de que la búsqueda de texto completo computarizada se volviera común.

Por ejemplo, una consulta de búsqueda que incluya todas las palabras en una definición de ejemplo ("KWIC es un acrónimo de Key Word In Context, el formato más común para las líneas de concordancia") y el eslogan de Wikipedia en inglés ("la enciclopedia libre"), buscado en una página de Wikipedia, puede producir un índice KWIC de la siguiente manera. Un índice KWIC generalmente usa un diseño amplio para permitir la visualización de la información máxima 'en contexto' (no se muestra en el siguiente ejemplo).

KWIC es un acrónimo de Key Word In Context, ... Página 1
... Palabra clave en contexto, la más formato común para líneas de concordancia. Página 1
... el formato más común para líneas de concordancia . Página 1
... es un acrónimo de Key Word In Contexto , el formato más común ... Página 1
Wikipedia, The Free Enciclopedia página 0
... En contexto, el más común formato para líneas de concordancia. Página 1
Wikipedia, la Enciclopedia libre página 0
KWIC es un acrónimo de Palabra clave en contexto, la más ... Página 1
  KWIC es un acrónimo de Key Word ... Página 1
... formato común para la concordancia líneas . Página 1
... para Palabras clave en contexto, el formato más común para la concordancia ... Página 1
  Wikipedia , la enciclopedia libre página 0
KWIC es un acrónimo de Key Word In Context, el más común ... Página 1

Un índice KWIC es un caso especial de índice permutado . Este término se refiere al hecho de que indexa todas las permutaciones cíclicas de los encabezados. Los libros compuestos por muchas secciones cortas con sus propios títulos descriptivos, sobre todo colecciones de páginas de manual , a menudo terminan con una sección de índice permutada , lo que permite al lector encontrar fácilmente una sección por cualquier palabra de su título. Esta práctica, también conocida como palabra clave fuera de contexto ( KWOC ), ya no es común.

Referencias en la literatura

Nota: La primera referencia no muestra el índice KWIC a menos que pague para ver el documento. La segunda referencia ni siquiera enumera el documento en absoluto.

  • David L.Parnas utiliza un índice KWIC como ejemplo de cómo realizar un diseño modular en su artículo Sobre los criterios que se utilizarán en la descomposición de sistemas en módulos , disponible como artículo clásico de ACM
  • Christopher D. Manning y Hinrich Schütze describen un índice KWIC y una concordancia por computadora en la sección 1.4.5 de su libro Fundamentos del procesamiento estadístico del lenguaje natural . Cambridge, Mass: MIT Press, 1999. ISBN   9780262133609 . Citan un artículo de HP Luhn de 1960, "Índice de palabras clave en contexto para la literatura técnica (índice kwic)".
  • Según Concordantia et Indices Missalium Romanorum del Rev. Gerard O'Connor , "La mayoría de las concordancias producidas en los últimos tiempos y con la ayuda de software de computadora utilizan los formatos KWIC (palabra clave en contexto) y KWICn (palabra clave en el centro), que enumera la palabra clave, generalmente resaltada en negrita en una posición coherente, dentro de una cantidad limitada de texto de contexto, es decir, tres [o] cuatro palabras del texto antes de la palabra clave y la misma cantidad de texto a continuación. Este formato es extremadamente útil porque la palabra clave se identifica fácilmente junto con su contexto ... La Concordancia del Misal Romano se produce en los formatos KWIC y KWICn y es digno de mención porque cada forma de palabra se enumera como aparece en el texto, es decir, es no lematizado ".

Ver también

Referencias