Miércoles, 23 de julio de 2014, de 12.30 a 13.30 hs Horario de Ohio (US)
¿Cómo recibir en streaming información de Twitter sobre temas específicos?
¿Cuales son las posibilidades de Flume a la hora de capturar información y luego volcarla en el sistema de fichero de Hadoop (HDFS)?
¿Cómo es posible explotar la información semi-estructurada de Twitter con Hive, el componente DataWareHouse de Hadoop?
FormHadoop está compuesto por personal especializado en Hadoop y en temas de Big Data.
Con este webinar, se pretende dar una introducción a unos de los componentes principales de Hadoop, aplicados al mundo de social media.
Entre otras cosas, descubrirás:
- El papel de Flume dentro de un proceso ETL en Hadoop.
- Posibilidades de configuración de Flume y cómo conectarlo a la API de Twitter
- Algunas empresas especializadas en fuentes de Social Media y que permiten superar el límite
de la API pública de Twitter.
- Las ventajas de Hive, para explotar la información en Hadoop usando queries similares a SQL
- Por qué Hive es el complemento Big Data a los DataWarehouse tradicionales.
- Cómo Hive es capaz de trabajar con información semi-estructurada. En el caso de Twitter: un formato JSON.
Si estás interesado en el maneja de datos "social media", si gestionas un DataWareHouse o si tienes curiosidad en Hadoop, no te pierdas este webinar.