Test de Turing: comportamiento maquinario indistinguible del humano
Con el crecimiento de la inteligencia artificial en los últimos años y la también creciente adopción, es interesante volver atras y repasar los origenes y conceptos que han dado pie al surgimiento y evolución de esta tecnología, sin duda la inteligencia artificial nos acompañará y se integrará en nuestro día a día en los próximos años.
En la decada de los 50, en Inglaterra, se estableció la llamada prueba de Turing (o test de Turing), en un trabajo publicado por Alan Turing titulado "Computing machinery and intelligence", en el que se buscaba encontrar respuestas sobre si las maquinas son capaces de pensar y mostrar inteligencia como la humana.
La pruesta de Turing fue fundamental para la teoría de la computación y la inteligencia artificial, Turing es considerado uno de los padres de la ciencia de la computación y la informática.
Alan Turing
¿En que consiste la prueba de Turing?
El objetivo de la prueba es el siguiente: evaluar si la maquina en cuestión es capaz de mostrar un comportamiento lo suficientemente sofisticado como para considerarla inteligente.
Ahora vienen los detalles, la prueba se realiza unicamente a través de un sistema de texto, por un lado se designa a una persona que actuará como juez, del otro lado habrá una persona y una maquina, el juez deberá interactuar con ambos solamente mediante un teclado y un monitor, aquí no se toma en cuenta la capacidad para transformar el texto en habla.
La prueba requiere 5 minutos de conversación entre el juez y los participantes, si después de este tiempo el juez no puede determinar cual participante es la maquina, la maquina habrá pasado la prueba.
Un tema importante a tener en cuenta es que esta prueba no trata de evaluar la conciencia o comprensión profunda, sino la capacidad para generar respuestas similares a las que un humano daría en una conversación, para así hacer creer a una persona que esta interactuando con un ser humano.
Críticas y limitaciones del test de Turing
Esta prueba ha sido objeto de críticas y debates desde su inicio, algunos argumentan que la capacidad de una maquina para engañar a un juez humano no es necesariamente un indicador de inteligencia.
Además, el éxito de la prueba depende en gran medida de la habilidad del juez humano para interactuar con la maquina y del contexto de la conversación.
La prueba de Turing fue originalmente diseñada de forma que la maquina a evaluar mostrara comportamientos humanos sin importar si son inteligentes o no, por ejemplo, decir mentiras, responder a insultos, errores de escritura y redacción, etc. Si la maquina falla al imitar estos comportamientos la prueba falla porque parecería demasiado lineal y "robotico".
Si la maquina muestra comportamientos demasiado inteligentes, como capacidad de resolver problemas altamente complejos en un periodo corto de tiempo (que puede hacerlo), o que tenga vasta información sobre una variedad de temas también hará que la prueba sea reprobada, ya que un humando fácilmente podrá darse cuenta de que realizar eso para una persona normal no es tan factible.
Entonces, el test de turing será exitoso si la maquina es capaz de balancear los pros y contras, ni tan inteligente, ni tan robótico, de modo que el juez esté convencido de que está tratando efectivamente con un ser humano.
Test de turing vs la inteligencia artificial
La personas que trabajan en el área de la inteligencia artificial simplemente le prestan poca atención a la prueba de turing, la consideran mas una distracción que algo que puede aportar a sus investigaciones.
Argumentan que hay formas mas efectivas de probar la inteligencia de un programa, simplemente se le asigna la tarea directamente y se miden los resultados.
Se hace una analogia de la historia de los vuelos y la aviación en general: los aviones se prueban segun su habilidad de volar (que es lo que interesa), y no comparandolas con aves.
Por lo cual, no deberia definirse la meta de la aviación con crear maquinas voladoras que vuelen tan parecidamente a los pajaros que podrian engañar a una persona haciendole creer que lo que ven es un pajaro.
Este test es mas una idea teórica que una aplicación práctica, a pesar de su importancia historica, rara vez se usa como una métrica definitiva para la inteligencia artificial. Sin embargo, sigue siendo un punto de referencia importante y una fuente de inspiración para el desarrollo de sistemas de conversación mas avanzados como chatbots y asistentes virtuales que ya emplean la interacción por voz.