Artículos

Shakespeare sin extras: Un algoritmo encuentra las partes que no escribió de sus obras

Por Pablo G. Bejerano / Blog Think Big | 10 Diciembre, 2019 - 15:00
  • shakespeare4444.jpg

Aunque el autor es recordado por obras que pasaron a la inmortalidad, hay casos como "Enrique VIII" en que no escribió todo.

La capacidad que tienen los algoritmos para identificar patrones de forma rápida y fiable ha llevado a muchos investigadores a utilizarlos como formas de comprobación. Un algoritmo de reconocimiento de imágenes puede comprobar en cuáles de ellas aparece una casa con piscina y uno que reconozca textos puede identificar cuándo aparece la palabra "inversión", por ejemplo. Ahora, es la obra de Shakespeare la que se somete a examen.

Son los casos más sencillos. Pero la tecnología avanza y las aplicaciones son cada vez más complejas. Ya existen algoritmos capaces de bucear en un texto y determinar si una publicación es una fake news. En la Academia Checa de las Ciencias, en Praga, el investigador Enter Petr Plechác ha creado su propio algoritmo en relación con el estudio de textos.

Nada tiene que ver esto con las fake news, aunque sí con la comprobación. La de la obra de Shkespeare, concretamente una de ellas: Enrique VIII. Aquella fue una de las últimas que firmaría el célebre dramaturgo británico. Se publicó en 1613 y él murió tres años más tarde.

Su compañía de teatro estaría buscando sustituto o, al menos, algunos colaboradores que apoyaran la labor del autor. Y uno de ellos fue John Fletcher. Aún en la inercia cultural de la época isabelina, en Londres florecían los autores de teatro, muchos de los cuales han caído en un pacífico olvido con el paso de los siglos. Le ocurrió a Fletcher, como a muchos otros. Hasta que a mediados del siglo XIX un crítico literario comparó su trabajo con el de la obra Enrique VIII, de Shakespeare, y vio similitudes de estilo.

Concluyó que algunas partes de Enrique VIII estaban escritas por Fletcher. Un extremo que ha confirmado el algoritmo de Plechác, empleando machine learning para su deducción. El sistema se entrenó con las obras de Shakespeare escritas en aquel momento, así como con las de Fletcher.

Una herramienta para estudiar obras pasadas
Tras su entrenamiento, el algoritmo pudo determinar qué partes de Enrique VIII estaban escritas por cada autor. Lo hizo en base al estilo de cada uno , denotado en ciertos patrones, como la abreviación de 'you' por 'ye', que hacía Fletcher.

El algoritmo no solo sirve para este caso concreto. P odría entrenarse para identificar el estilo de otros autores. Algo que sería útil en algunas épocas históricas, como el siglo XIX, cuando los folletines novelescos de los periódicos hacían que las plumas de los autores más prolíficos no dieran abasto y necesitaran negros para escribir con su firma.

>