¿Cuánto tardaría un mono en escribir ‘Hamlet’?

El llamado teorema del mono infinito sostiene que un simio con una máquina de escribir pulsando teclas al azar acabaría por escribir cualquier obra de literatura: Hamlet, El Quijote o, incluso, un best seller de creación propia. Aunque en la práctica es poco aplicable —resulta cuanto menos complicado disponer de un mono inmortal dispuesto a escribir eternamente—, esta afirmación permite explorar conceptos muy interesantes como la aleatoriedad, el comportamiento en el infinito y la computación basada en la generación de números pseudoaleatorios.

Seguir leyendo

 El teorema del mono infinito permite explorar la probabilidad y los límites del azar  

El llamado teorema del mono infinito sostiene que un simio con una máquina de escribir pulsando teclas al azar acabaría por escribir cualquier obra de literatura: Hamlet, El Quijote o, incluso, un best seller de creación propia. Aunque en la práctica es poco aplicable —resulta cuanto menos complicado disponer de un mono inmortal dispuesto a escribir eternamente—, esta afirmación permite explorar conceptos muy interesantes como la aleatoriedad, el comportamiento en el infinito y la computación basada en la generación de números pseudoaleatorios.

Se trata de una consecuencia directa del segundo lema de Borel-Cantelli. Este lema afirma que, si cada intento de lograr un resultado concreto es independiente del resto y tiene una probabilidad de éxito mayor que cero, entonces, con suficientes intentos, dicho resultado ocurrirá infinitas veces. En el caso del teorema del mono infinito, si un mono pulsa teclas al azar de manera indefinida, la probabilidad de que escriba un texto determinado en un solo intento es muy baja, pero no nula. Como los intentos se repiten indefinidamente y son independientes entre sí, de acuerdo con el lema, el mono acabará escribiendo el texto deseado en infinitas ocasiones.

Para cumplirse, el teorema se basa en varias suposiciones. La primera de ellas es que el simio ha de teclear de forma aleatoria. Coloquialmente, entendemos como fenómeno aleatorio aquel cuyo resultado no puede determinarse con certeza antes de que ocurra, incluso si se conocen las condiciones iniciales. Son ejemplos de aleatoriedad el lanzamiento de un dado o el sorteo de la Lotería de Navidad. En el caso del mono, se supone que, en cada pulsación del teclado, todas las letras del alfabeto tienen la misma probabilidad de salir, independientemente del texto ya escrito.

Esta condición permite calcular la probabilidad de que el simio escriba cualquier secuencia dada. Por ejemplo, la probabilidad de escribir “hola”, tecleando cuatro teclas al azar en un teclado español (considerando solo las letras y el espacio) es (1/27)^4, aproximadamente 0,0000019. Este valor tan pequeño, para una secuencia tan corta, muestra ya lo complicado del asunto.

Aquí entra la segunda suposición del teorema: se dispone de un tiempo infinito y, por tanto, de un número infinito de intentos. Tras un número n de intentos, que se suponen aislados por simplicidad, la probabilidad de que no aparezca la secuencia ‘hola’ es de (1-0,0000019)^n. Aunque (1-0,0000019) es muy cercano a 1, al multiplicarlo por sí mismo n veces si, n es lo suficientemente grande, se obtiene un valor que se acerca a cero. Por tanto, el mono escribirá “hola” con una probabilidad tan alta como queramos.

Lo mismo sucede con cualquier otra secuencia —incluso la que incluye todas las palabras, ordenadas, de Hamlet— y es en lo que se basa la afirmación del teorema del mono infinito. Ahora bien, ¿se puede estimar aproximadamente cuánto podría tardar en obtenerse, con una gran probabilidad, el clásico de Shakespeare? En un reciente artículo han calculado que, con casi total seguridad, toda la población actual de monos no conseguiría escribir un texto de más de unas pocas palabras antes de la muerte térmica del universo.

Otro curioso experimento relacionado con este teorema permite al usuario introducir cualquier secuencia y simula la generación aleatoria de texto hasta encontrar la secuencia dada. Para producir el texto, esta página usa los llamados generadores de números pseudoaleatorios. Al estar basados en reglas, los cálculos que hacen estos programas son completamente deterministas: si se conocen todas las condiciones iniciales, se puede anticipar el número generado. Es decir, los números pseudoaleatorios no son aleatorios. Sin embargo, desconocidas las condiciones iniciales del generador, los valores generados son indistinguibles de números realmente aleatorios. Existen para ello distintas técnicas, como los generadores basados en aritmética modular o aquellos basados en cifrados, entre otros.

Por último, en puro auge de los grandes modelos de lenguaje, ¿podrían usarse estos como sustitutos de los monos en nuestro experimento? ¿Podrían ChatGPT o DeepSeek escribir espontáneamente El Quijote, si se les pide que escriban durante un tiempo infinito? El razonamiento anterior no vale, ya que estos modelos generan texto basándose en la probabilidad de aparición de palabras dentro de un contexto, no son producto de un proceso aleatorio. Y, como El Quijote está entre los textos con los que han sido entrenados, podría parecer que la probabilidad de que reproduzcan la obra completa sería mayor que en el caso anterior.

Sin embargo, varios factores hacen que esto sea extremadamente improbable. En primer lugar, estos modelos no están entrenados para replicar fielmente textos en español del Siglo de Oro, sino en lenguaje moderno, lo que dificulta que sigan con precisión el estilo de Cervantes. Además, estos programas están diseñados para no copiar textualmente grandes porciones de los textos con los que aprendieron, lo que reduce aún más las posibilidades de que reproduzcan obras completas. Esto, sumado a otras limitaciones del programa, hace que, aunque el modelo podría acercarse más que los monos a ciertas partes del texto, la probabilidad de que lo reproduzca en su totalidad es ínfima.

Pablo García Arce es investigador predoctoral del Consejo Superior de Investigaciones Científicas (CSIC) en el Instituto de Ciencias Matemáticas (ICMAT)

Café y Teoremases una sección dedicada a las matemáticas y al entorno en el que se crean, coordinado por el Instituto de Ciencias Matemáticas (ICMAT), en la que los investigadores y miembros del centro describen los últimos avances de esta disciplina, comparten puntos de encuentro entre las matemáticas y otras expresiones sociales y culturales y recuerdan a quienes marcaron su desarrollo y supieron transformar café en teoremas. El nombre evoca la definición del matemático húngaro Alfred Rényi: “Un matemático es una máquina que transforma café en teoremas”.

Edición, traducción y coordinación:Ágata Timón García-Longoria. Es coordinadora de laUnidad de Cultura Matemática del Instituto de Ciencias Matemáticas(ICMAT)

 Ciencia en EL PAÍS

Noticias Similares