Como los investigadores de Microsoft estaban probando una versión previa de GPT-4 que no se había ajustado para evitar el discurso de odio, la información errónea y otro contenido no deseado, las afirmaciones hechas en el documento no pueden ser verificadas por expertos externos. Microsoft afirma que el sistema disponible para el público no es tan poderoso como la versión que probaron.

Hay momentos en que sistemas como GPT-4 parecen imitar el razonamiento humano, pero también hay momentos en que parecen terriblemente densos. “Estos comportamientos no siempre son consistentes”, dijo Ece Kamar, una directora de investigación en Microsoft.

Alison Gopnik, profesora de Psicología que forma parte del grupo de investigación sobre IA de la Universidad de California, campus Berkeley, afirmó que sistemas como GPT-4 eran sin duda potentes, pero no estaba claro que el texto generado por estos sistemas fuera el resultado de algo parecido al razonamiento humano o el sentido común.

“Cuando vemos un sistema o una máquina complicados, los antropomorfizamos; todo el mundo lo hace, tanto los que trabajan en este campo como los que no”, explicó Gopnik. “Pero pensar en eso como una comparación constante entre la IA y los humanos —como una especie de competición— no es la forma correcta de pensar en el tema”.