lunes, 30 de octubre de 2017

La Ciencia de Datos y el Contenido de Netflix



¿Te has preguntado de donde vienen las series y películas que ves en Netflix? 


Esto se logra mediante un servicio llamado Red de Entrega de Contenido (CDN por su nombre en Inglés), lo que permite transmitir más de 125 millones de horas todos los días a 100 millones de miembros alrededor del mundo.



Netflix cuenta con un equipo de científicos de datos cuya principal tarea es optimizar la calidad de la experiencia de las transmisiones (QoE) a través rigurosos modelos matemático-estadísticos. Los principales componentes del QoE son los siguientes:


  • Predicción de popularidad y contenidos.
Para utilizar de una manera óptima la capacidad del hardware de la red de servicio de Netflix en horas pico, se predicen las series o películas que serán populares el día de mañana y así poder tener el mejor balance de recursos para no afectar la experiencia del usuario. Otra de las metas para  la predicción de popularidad es priorizar la actualización de contenido y minimizar la cantidad de contenido que se reemplaza para reducir el tráfico.

Las principales herramientas matemáticas usadas son las predicciones con series de tiempo, optimización sin restricciones y modelos de redes, siendo el reto adaptar los algoritmos a las preferencias globales de los usuarios que se comportan de forma dinámica.

  • Optimizar la asignación de contenido mediante conglomerados (OCA).
Después de usar la predicción de popularidad, otra importante área relacionada con el trabajo de los científicos de datos es  optimizar la manera en que los archivos son distribuidos dentro de un grupo (conglomerado o cluster) para maximizar la utilización del hardware. Si un OCA en un cluster comienza a tener problemas, debido a sobrecarga de tráfico o cualquier otro problema operacional, parte de ese tráfico es desviado a una ubicación alternativa. Porque si un OCA comienza a tener problemas, esto puede afectar todo el cluster.

  • Planeación de capacidad a largo plazo.
Son importantes para Netflix los cambios en el comportamiento del sistema como son los cambios en el catálogo, aumento de usuarios, avances en la codificación y el consumo electrónico en el ecosistema (por ejemplo, cada vez se usan más televisiones 4K y cada vez hay más dispositivos móviles por hogar)

Los científicos de datos se encargan en combinar todos estos factores para hacer predicciones que informen la planeación de capacidad a mediano y largo plazo para saber donde poner más servidores y anticipar el crecimiento del tráfico y tener mejor eficiencia.

Por todo este tipo de aplicaciones científicas es que Netflix está a la vanguardia en el servicio de entrega de contenido.





No hay comentarios:

Publicar un comentario