Un motor que genere periodismo de calidad, ¿cerca de ser real?

¿Qué es el periodismo de calidad? ¿Cuáles son sus cualidades? Responder estas dos preguntas puede traer más de un dolor de cabeza. De hecho, sería una buen ejercicio escuchar un debate sobre las opiniones de diferentes profesionales del sector. Seguramente, la mayoría de ellos coincidan en varios aspectos básicos que definen el correcto desempeño de la práctica, como pueden ser los análisis basados en hechos y no en opiniones, informaciones originales obtenidas sobre el terreno, basadas en documentos y fuentes oficiales, etc. Pero, quizás, a la hora de entrar en detalles y matices comience también la disparidad de opiniones.

Para muchos medios de comunicación, el periodismo de calidad pasa por un muro de pago. Ya es común ver cómo los portales digitales se van acercando a esta tendencia con un objetivo común: revertir la disminución de ingresos de la industria. Precisamente, este puede ser uno de los motivos por los que se “descuide” el contenido y así lo afirma Girish Gupta, CTO de Deepnews, en un artículo de Monday Note. Para él, se están escribiendo “artículos superficiales y descuidados para servir como vehículo de ingresos por publicidad”. Afortunadamente, esto no siempre es así. El trabajo excelente sigue primando, aunque, muchas veces, el problema es encontrarlo. Precisamente, para diferenciar entre periodismo de alta y baja calidad, su compañía está desarrollando un algoritmo que sea capaz de hacerlo basándose únicamente en la calidad del texto del artículo, obviando su popularidad.

Aunque Girish Gupta reconoce que este método no está hecho “a prueba de balas”, asegura que “está funcionando”. Lo que está claro es que la informática puede sorprendernos y para comprobarlo solo  hay que fijarse en el ejemplo de GPT-3, un generador de lenguaje automático, que fue capaz de escribir un artículo de opinión para The Guardian, aunque requirió de algo de trabajo final, según aseguran sus editores.

¿Cómo funciona el algoritmo de Deepnews?

En el mismo artículo de Monday Note, el reportero explica cómo un ordenador puede puntuar una noticia. Una forma sería programarlo para que busque en el artículo frases como “según los documentos” o “según las fuentes anónimas” y aumentar o disminuir una puntuación en función del resultado, respectivamente. Otro método sería basar la calidad en función de los adjetivos, citas, expertos, países o empresas mencionados.

En Deepnews optaron por agrupar los artículos inicialmente por un editor y, a continuación, se acudió a estudiantes de periodismo para que los analizaran utilizando las métricas que el equipo había acordado. Se les pidió que dieran prioridad a los artículos originales, en profundidad y bien documentados. Parece ser que fue un buen comienzo y se llegaron a recopilar decenas de miles de artículos.

Una vez que recopilaron datos de entrenamiento o formación (training data) los introdujeron en una especie de abstracción matemática/programática conocida como red neuronal. Su función es la de emular un cerebro humano y pasar datos a través de millones de neuronas, cada una de ellas sintonizándose con un elemento del texto y calculando su relevancia para el resultado final. De nuevo, Girish Gupta reconoce buenos resultados, al menos mejores que los del azar. Todavía queda trabajo para afinar esos datos de entrenamiento y de la propia arquitectura de la red neuronal y, entonces, será cuando ocurra la magia. Actualmente se encuentran en proceso de evolución del modelo y pensando en el tipo de red que podrán implementar -sencilla, convolucional, recurrente o una combinación entre ellas-.

La interfaz de Deepnews se abrirá próximamente a los usuarios, tal y como asegura el reportero. De esa manera, se podrá comprobar la diferencia entre las noticias escogidas en bruto por su algoritmo y las que muestran los medios de comunicación. Habrá que esperar y estar atentos para comprobar si los resultados mostrados mediante el aprendizaje automático son el periodismo que realmente queremos leer, como ellos mismos afirman.