Claves
NYT construye un mejor sistema de recomendación de noticias
Por @cdperiodismo
Publicado el 15 de agosto del 2015
El equipo de tecnología del New York Times también está comprometido en la difusión de la información de la organización, que publica más de 300 artículos, posts e historias interactivas al día.
Es en ese sentido que está buscando perfeccionar la forma en que los lectores navegan a través de todo ese contenido. De esta forma se puede ayudar a los lectores a encontrar información relevante para ellos, lo adecuado en un ideal formato multimedia.
En un post, el equipo explica cómo están innovando en el algoritmo que sirve para recomendar artículos dentro de la web del NYT.
Primero debemos conocer cómo trabajó la organización con la vieja tecnología:
- Las noticias recomendadas deben funcionar bien con un nuevo contenido: noticias de última hora que no han sido vistas por muchos lectores. Es por eso que los datos de los artículos disponibles en el momento de la publicación son útiles: el tema, autor, escritor y etiquetas asociadas a las palabras claves de cada artículo.
- El motor de recomendación utiliza las etiquetas de palabras clave para hacer recomendaciones. El uso de etiquetas para los artículos permite al algoritmo recomendar artículos similares a los que ya se han leído.
- El enfoque tiene un atractivo intuitivo: Si un usuario lee diez artículos etiquetados con la palabra “Clinton”, probablemente se le mostrará pronto artículos etiquetados con esa palabra.
- Se está probando el filtro colaborativo, el cual se basa en lo que los lectores leen en común. El enfoque es atractivo cuando un lector tiene preferencias similares al de otro lector. Este método falla cuando se trata de recomendar algo recién publicado.
La nueva tecnología funciona así:
- Se ha combinado las anteriores técnicas para construimos un algoritmo inspirado la Collaborative Topic Modeling (CTM), los modelos de contenidos, el ajuste de este modelo mediante la visualización de las señales de los lectores, la preferencia de los modelos de los lectores y las recomendaciones por similitud entre preferencias y contenidos.
- El algoritmo comienza mediante el modelado de cada artículo como una mezcla de los temas que aborda.
- Se presenta la información a cada lector basado en sus preferencias temáticas.
El reto tiene tres partes más para el equipo:
Parte 1: Cómo modelar un artículo basado en su texto.
Parte 2: Cómo actualizar el modelo basado en los patrones de lectura del público.
Parte 3: Cómo describir a los lectores basados en su historial de lectura.
En conclusión, al modelar el contenido del artículo y las preferencias del lector con temas y realizar ajustes sobre la base de patrones de lectura, se ha reconceptualizado el motor de recomendaciones del NYT.
“Nuestro sistema es ahora una exitosa implementación a gran escala de investigación de vanguardia en el modelado de temas colaborativos, y proporciona incrementos en el rendimiento a comparación con los anteriores algoritmos utilizados para hacer recomendaciones”, escribe el grupo.
Vía NYT.
Publicado por:
@cdperiodismo
Sígueme
COMPATIR EN REDES
NOTICIAS RELACIONADAS
BlackBerry no renunciará a los teclados físicos
TCL, la compañía china que ahora posee los derechos exclusivos de los teléfonos de la marca BlackBerry, publicó un video de presentación de un nuevo teléfono inteligente.
03-01-17La data de los periodistas en Internet sigue siendo vulnerable
En la actualidad el periodista está preocupado por la protección de sus datos confidenciales en Internet. Este trabajo se ha visto amenazado por los gobiernos y por diversos grupos hackers. Al menos ellos pueden acceder a los mensajes de correos electrónicos, incluso después de ser borrados del servidor.
17-08-13Una app colaborativa para editar textos en Gmail, WordPress y Evernote
Poetica es una plataforma que está desarrollándose en la web para que los usuarios prueben una forma alternativa, gratuita y efectiva de editar textos, pero junto a un equipo desde cualquier territorio en tiempo real.
30-03-14