Webinar • TODOS

Data Lakes de última generación: Lógicos y Multipropósito. Por el gurú Rick van der Lans.Agéndalo en tu calendario habitual ¡en tu horario!

El uso restringido por los Científicos de Datos y la movilización física de los datos restingen los beneficios del Data Lake
Miércoles, 30 de mayo de 2018, de 04.30 a 05.30 hs Horario de Ohio (US)
Webinar en inglés

Aunque todavía es un concepto relativamente novedoso el Data Lake ya ha sido adoptado por muchas organizaciones.

Su función principal es almacenar datos estructurados y no estructurados en un lugar central para facilitar a los científicos de datos y otros usuarios de investigación y exploración analizar datos. Sin un Data Lake estos usuarios desperdiciarían mucho tiempo en buscar todos los datos antes de poder comenzar con su trabajo real: el análisis.

En resumen se supone que el Data Lake acorta el proceso de preparación de los datos que precede al trabajo analítico como tal.

Sin embargo la arquitectura original de los Data Lakes tiene dos inconvenientes graves:

- Uso restringido de los datos: está diseñado exclusivamente para los científicos de datos y no para otros profesionales y departamentos de la empresa. 

- Los datos tienen que moverse físicamente lo que conlleva ciertos problemas

El experto holandés en Big Data y Data Warehousing Rick van der Lans propone la puesta en marcha de lo que denomina Data Lakes "multipropósito" que permitan el acceso a los datos no sólo de los científicos de datos (para los que se hicieron originalmente). Se trataría de permitir el acceso a ese valioso "maná" que son los datos, también, de los típicos usuarios "self-service" de las aplicaciones de BI tradicionales: Recursos Humanos, Márketing, Comercial...

De esta forma las inversiones en Data Lakes se amortizan más fácilmente. 

Los problemas de la naturaleza física de los Data Lake

Originariamente los Data Lake exigen que los datos se copien "físicamente" a un almacén centralizado lo que supone diversas restricciones:

- Los Big Data pueden ser "demasiado grandes" para poder copiarse a ese repositorio centralizado
- Ciertos departamentos "no cooperativos" pueden restringir la copia de "sus" datos ya sea por políticas de empresa u otras razones
- Las cada vez más restrictivas políticas de datos y normativas pueden también restringir la copia de datos
- Los datos almacenados en repositorios securizados no deberían abandonar esos repositorios
- Al copiarse los datos de un sitio a otro puede perderse Metadata
- Algunos datos se deben refrescar de forma periódica y el hecho de tener que copiarse físicamente puede ser restrictivo

En este webinar Rick explicará cómo resolver estas 2 "restricciones" o carencias de los actuales Data Lake mediante la creación de Data Lakes lógicos y multipropósito en los que la Virtualización de datos tiene un papel fundamental. 

Agenda
  • 04:30 - 05:25 hs
    Saque el máximo provecho a su Data Lake por , de R20

    Rick F. van der Lans es un reputado analista independiente, consultor, speaker y autor de numerosos libros. Está especializado en Data Warehousing, Business Intelligence, Big Data, Analítica y tecnología de Base de Datos. 

  • 05:25 - 05:30 hs
    La visión de Denodo por , de Director of Product Marketing, Denodo
¿Le gustaría hacer webinars o eventos online con nosotros?
Sponsors
  • Data Lakes de última generación: Lógicos y Multipropósito. Por el gurú Rick van der Lans.



Ponentes de este webinar
Director of Product Marketing, Denodo
Worldwide marketing leader who analyzes and responds to emerging, disruptive industry trends to drive company revenue and market share. A high value contributor to corporate growth, adept at evolving products to align with future demand, and providing tactical and strategic guidance to company leaders.
Cerrar