Gerard Salton - Gerard Salton

Gerard Salton
Nació (1927-03-08) 8 de marzo de 1927
Fallecido 28 de agosto de 1995 (1995-08-28) (68 años)
alma mater Universidad Harvard
Conocido por el padre de la Recuperación de Información
Premio Gerard Salton
Carrera científica
Los campos recuperación de información
Instituciones Universidad de Cornell
Tesis Un sistema automático de procesamiento de datos para la contabilidad de ingresos de servicios públicos   (1958)
Asesor de doctorado Howard Aiken
Estudiantes de doctorado

Gerard A. "Gerry" Salton (8 de marzo de 1927 en Nuremberg - 28 de agosto de 1995), fue profesor de informática en la Universidad de Cornell . Salton fue quizás el científico informático líder que trabajó en el campo de la recuperación de información durante su tiempo, y "el padre de la recuperación de información". Su grupo en Cornell desarrolló el Sistema de recuperación de información SMART , que inició cuando estaba en Harvard. Fue el primer sistema en utilizar el ahora popular modelo de espacio vectorial para la recuperación de información.

Salton nació como Gerhard Anton Sahlmann el 8 de marzo de 1927 en Nuremberg, Alemania . Recibió una licenciatura (1950) y una maestría (1952) en matemáticas de Brooklyn College , y un doctorado. de Harvard en Matemáticas Aplicadas en 1958, el último de los estudiantes de doctorado de Howard Aiken , y enseñó allí hasta 1965, cuando se unió a la Universidad de Cornell y cofundó su departamento de Ciencias de la Computación.

Salton fue quizás más conocido por desarrollar el modelo de espacio vectorial ahora ampliamente utilizado para la recuperación de información. En este modelo, tanto los documentos como las consultas se representan como vectores de recuento de términos, y la similitud entre un documento y una consulta viene dada por el coseno entre el vector de término y el vector de documento. En este artículo, también introdujo TF-IDF , o frecuencia de término-frecuencia-inversa-documento, un modelo en el que la puntuación de un término en un documento es la razón del número de términos en ese documento dividido por la frecuencia de la número de documentos en los que aparece ese término. (El concepto de frecuencia inversa de documentos, una medida de especificidad, fue introducido en 1972 por Karen Sparck-Jones ). Más adelante, se interesó en el análisis y resumen automático de texto, así como en la generación automática de hipertexto. Publicó más de 150 artículos de investigación y 5 libros a lo largo de su vida.

Salton fue editor en jefe de las Comunicaciones de la ACM y la Revista de la ACM , y presidió el Grupo de Interés Especial sobre Recuperación de Información (SIGIR). Fue editor asociado de ACM Transactions on Information Systems . Fue miembro de la ACM (elegido en 1995), recibió un Premio al Mérito de la Sociedad Estadounidense para las Ciencias de la Información (1989) y fue el primer destinatario del Premio SIGIR por sus destacadas contribuciones al estudio de la Recuperación de Información (1983), ahora llamado el premio Gerard Salton .

Bibliografía

  • Salton, Organización y recuperación automática de información , 1968.
  • Gerard Salton (1975). Una teoría de la indexación . Sociedad de Matemáticas Industriales y Aplicadas. pag.  56 .
  • --- y Michael J. McGill, Introducción a la recuperación de información moderna , 1983. ISBN   0-07-054484-0
  • Gerard Salton (1989). Procesamiento automático de texto . Compañía editorial de Addison-Wesley. pag.  530 . ISBN   978-0-201-12227-5 .
  • Gerard Salton en el servidor de bibliografía DBLP Edit this at Wikidata
  • G. Salton, A. Wong y CS Yang (1975), " Un modelo de espacio vectorial para indexación automática ", Communications of the ACM , vol. 18, nr. 11, páginas 613–620. (Artículo en el que se presentó un modelo de espacio vectorial)

Ver también

Referencias

enlaces externos

  • En memoria
  • Fractales de cambio: busca en el carril de la memoria
  • El artículo más influyente que Gerard Salton nunca escribió : este artículo de Tendencias de la biblioteca de 2004 de David Dubin sirve como una revisión histórica de la metamorfosis del término modelo de valor de discriminación (TDV) en el modelo de espacio vectorial como modelo de recuperación de información (VSM como modelo de IR). ). Este artículo cuestiona lo que la comunidad de investigación de Recuperación de Información creía que originalmente se pretendía modelar el modelo de espacio vectorial de Salton. Lo que mucho más tarde se convirtió en un modelo de recuperación de información fue originalmente un modelo matemático-computacional centrado en datos utilizado como un dispositivo explicativo. Además, el artículo de Dubin señala que un artículo de Salton de 1975 citado con frecuencia no existe, pero probablemente sea una combinación de otros dos artículos, ninguno de los cuales se refiere en realidad al VSM como un modelo de RI.