El aprendizaje automático cambia totalmente lo que creemos en la literatura

Los investigadores en literatura están comenzando a adoptar un enfoque algorítmico en su campo, extendiendo nuestra definición de literatura al ámbito de la fanfiction y más allá.

La definición de ciencia ficción es notoriamente resbaladiza. Para algunos, el género lo definen los autores y sus novelas de referencia, comenzando con Veinte mil leguas de viaje submarino del autor Jules Verne, o regresando al Frankenstein de Mary Shelley. Otros argumentan que se trata más de ideas que de personas. La enciclopedia de ciencia ficción, por ejemplo, llama al género «literatura de alienación cognitiva».

Pero si tira datos sobre miles de libros, ¿podría darnos una respuesta más clara? Un campo creciente de estudios literarios está adoptando exactamente este enfoque para tratar de aplicar pocos datos al mundo de la literatura inglesa.

«Muy a menudo simplemente contamos cosas y usamos tipos familiares de estadísticas del siglo XX para comparar números», dice Ted Underwood, profesor asociado de inglés en la Universidad de Illinois. El aprendizaje automático, explica, ha cambiado nuestra comprensión de temas como el género y la historia de la propia literatura inglesa.

En el caso del ejemplo de la ciencia ficción, los autores a menudo describen la escala («vasta», «distante», «mayor») utilizan un gran número («miles») y se refieren a «tierra» y «personas» y » criaturas «. Underwood reduce los libros a «bolsas de palabras»: estadísticas como el número de apariciones de una palabra en un texto. «De alguna manera, estás tomando muestras de la historia literaria, como lo demostraría un científico social a una población», dice.

Su trabajo ha demostrado que los libros que caen dentro de esta percepción pública de la ciencia ficción se extienden mucho más allá de los datos típicos dados para el surgimiento del género. «Algunos investigadores han argumentado que lo que llamamos ‘ciencia ficción’ no cristalizó por completo hasta que se acuñó el término en la década de 1920», dice. «Ahora podemos demostrar que los ‘romances científicos’ y los ‘viajes extraordinarios’ de finales del siglo XIX son un género coherente, continuo con la ciencia ficción moderna».

Otros investigadores en el campo están tratando de averiguar si el aprendizaje automático se puede utilizar para predecir lo que podría suceder con una novela. David Bamman, de la Universidad de California, Berkeley, utiliza el procesamiento del lenguaje natural (NLP), la misma tecnología detrás de los asistentes de voz, para revelar cómo la predictibilidad está entretejida en la narrativa. Un modelo de lenguaje podría leer la primera mitad de una novela de ciencia ficción y luego intentar predecir el siguiente párrafo: la similitud de su resultado con el original podría darnos una idea de los fundamentos de lo que designa un escritor o un género «predecible».

El proyecto actual de Bamman, financiado con una subvención de Amazon, busca mejorar PNL hasta el punto en que pueda producir un modelo de cálculo de la trama: para que una computadora descomponga un concepto complejo en elementos como personaje, ubicación y evento. Bamman dice que ha notado un cambio reciente en la inscripción que refleja esta combinación única de inglés y ciencia de datos: un aumento de estudiantes con especialización dual en estas disciplinas, capacitación en métodos computacionales y empíricos, rompiendo la barrera entre ciencia y literatura.

Y la adopción de un enfoque basado en datos ayuda a sacar de la oscuridad trabajos relativamente desconocidos. Un artículo reciente de investigadores de la Universidad de Cornell analizó más de medio millón de trabajos de fanfiction en el sitio Archive of Our Own, con el objetivo de discernir la apreciación de la ficción innovadora: tramas y personajes, por ejemplo, que se desvían de las expectativas de los lectores. (Parece que no son casi todos; esto probablemente debería ser una sorpresa para el sitio web cuyas secciones más grandes incluyen fanfiction de Sherlock, Harry Potter y el universo Marvel).

Los métodos de cálculo nos dan las herramientas – y la salud – para atravesar esta montaña pura de cultura popular. Puede presagiar un cambio importante en las humanidades, dice Andrew Piper, quien dirige la revista líder en el campo, Cultural Analytics. «Así que el gran movimiento que pivotará en los próximos años es que la gente dejará de estudiar los clásicos o las novelas premiadas y pasará a pensar en todo el comportamiento que está ocurriendo allí, ya sabes, lo que llamamos gente corriente. que escriben a diario en las redes sociales, que crean historias. «

Cómo seguir DyN Noticias en algoritmos

Marque nuestra página central DyN Noticias on Algorithms donde agregaremos nuevos informes e historias a lo largo de la semana.

– Cómo bloquear publicidad dirigida en Facebook, Google, Instagram y Twitter

– La búsqueda de imágenes de Google tiene un problema masivo de sexismo con las celebridades

– ¿Por qué Facebook recomienda amigos que ni siquiera he conocido?

Gran parte de las noticias de la ciencia de el planeta tierra en un sólo sitio. artículos de Ciencia.