Prueba de señal inteligente mínima - Minimum intelligent signal test

La prueba de señal inteligente mínima , o MIST , es una variación de la prueba de Turing propuesta por Chris McKinstry en la que solo se pueden dar respuestas booleanas (sí / no o verdadero / falso) a las preguntas. El propósito de dicha prueba es proporcionar una medida estadística cuantitativa de la humanidad , que posteriormente se puede utilizar para optimizar el rendimiento de los sistemas de inteligencia artificial destinados a imitar las respuestas humanas.

McKinstry reunió aproximadamente 80,000 propuestas que podrían responderse sí o no, por ejemplo:

¿Es la Tierra un planeta?
¿Fue Abraham Lincoln una vez presidente de los Estados Unidos?
¿Es el sol más grande que mi pie?
¿La gente a veces miente?

A estas proposiciones las llamó Mindpixels .

Estas preguntas evalúan tanto el conocimiento específico de aspectos de la cultura como los hechos básicos sobre el significado de varias palabras y conceptos. Por lo tanto, podría compararse con el SAT , las pruebas de inteligencia y otras medidas controvertidas de la capacidad mental. El objetivo de McKinstry no era distinguir entre matices de inteligencia, sino identificar si un programa de computadora podía considerarse inteligente en absoluto.

Según McKinstry, se consideraría que un programa capaz de hacerlo mucho mejor que el azar en una gran cantidad de preguntas de MIST tiene cierto nivel de inteligencia y comprensión. Por ejemplo, en una prueba de 20 preguntas, si un programa estuviera adivinando las respuestas al azar, se podría esperar que obtuviera una puntuación de 10 correctas en promedio. Pero la probabilidad de que un programa obtenga una puntuación de 20 de 20 correctas mediante conjeturas es sólo de una en ²²⁰ , es decir, de una en 1.048.576; por tanto, si un programa fue capaz de mantener este nivel de rendimiento durante varias pruebas independientes, sin acceso previo a las propuestas, debería considerarse inteligente.

Discusión

McKinstry criticó los enfoques existentes de la inteligencia artificial , como los chatbots , y dijo que sus preguntas podrían "matar" a los programas de IA al exponer rápidamente sus debilidades. Él contrastó su enfoque, una serie de preguntas directas que evalúan las capacidades de una IA, con la prueba de Turing y el método del Premio Loebner de involucrar a una IA en una conversación mecanografiada no dirigida.

Los críticos de la MIST han señalado que también sería fácil "matar" a una IA al estilo McKinstry, debido a la imposibilidad de proporcionarle respuestas correctas a todas las posibles preguntas de sí / no mediante un conjunto finito de Mindpixels generados por humanos. : el hecho de que una IA pueda responder a la pregunta "¿Es el sol más grande que mi pie?" correctamente no significa que pueda responder correctamente a variaciones como "¿Es el sol más grande que (mi mano | mi hígado | una yema de huevo | Alpha Centauri A | ...)?".

Sin embargo, el difunto McKinstry podría haber respondido que una entidad verdaderamente inteligente y conocedora (a la par con los humanos) podría resolver respuestas como (sí | sí | sí | no sé | ...) aplicando su conocimiento de los tamaños relativos de los objetos nombrados. En otras palabras, la MIST fue pensada como una prueba de IA, no como una sugerencia para implementar IA.

También se puede argumentar que la MIST es una prueba de inteligencia más objetiva que la prueba de Turing, una evaluación subjetiva que algunos podrían considerar más una medida de la credulidad del interrogador que de la inteligencia de la máquina. Según este argumento, el juicio de un ser humano sobre una prueba de Turing es vulnerable al efecto ELIZA , una tendencia a confundir los signos superficiales de inteligencia con los reales, antropomorfizando el programa. La respuesta, sugerida por el ensayo de Alan Turing "¿Pueden pensar las máquinas?", Es que si un programa es una imitación convincente de un ser inteligente, de hecho es inteligente. Por tanto, la disputa gira en torno a lo que significa que un programa tenga inteligencia "real" y por qué signos puede detectarse.

Existe un debate similar en la controversia sobre el lenguaje de los grandes simios , en el que se dice que los primates no humanos han aprendido algunos aspectos del lenguaje de signos, pero se discute la importancia de este aprendizaje.

enlaces externos

Prueba de señal inteligente mínima: una prueba de Turing alternativa , Chris McKinstry, inteligencia artificial canadiense n. ° 41
GAC-80k
Software de código abierto para realizar la prueba de señal inteligente mínima

Languages

In other projects

Prueba de señal inteligente mínima - Minimum intelligent signal test

Discusión

enlaces externos