Las 5 cosas principales que debe saber sobre las casas de lago de datos

Tom Merritt explica cómo un lago de datos intenta ofrecerle lo mejor de un almacén de datos y un lago de datos.

Los datos no viven en la nube, simplemente pasan a través de ella; de hecho, llueven datos, formando lagos, que combinados con su almacén de datos pueden convertirse en un lago. Si estas oraciones tienen sentido para usted, envíe este Top 5 a un colega que no lo entienda.

Aquí hay cinco cosas que debe saber sobre las casas de lago de datos.

1. ¿Qué es un almacén de datos? Por lo general, se refiere a un hogar para datos estructurados. Si tiene alguna pregunta, puede encontrar la respuesta en el almacén de datos.

2. ¿Qué es un lago de datos? Esencialmente es donde arroja los datos que cree que pueden ser importantes, pero no sabe qué hacer con ellos. Puede ejecutar los datos en el almacén o enviarlos directamente al algoritmo de aprendizaje automático.

3. Un data lakehouse intenta brindarle lo mejor de ambos mundos. Es fácil y, por lo tanto, de bajo costo como un lago de datos. Y tiene algunos de los beneficios de poder responder preguntas, como un almacén de datos, sin tener que tener el almacén de datos.

4. La clave de un lago de datos es la capa de metadatos. Una capa de código abierto como Delta Lake rastrea archivos, admite transmisión de E / S, validación de datos y más.

5. Las casas lacustres de datos van en aumento. Según la investigación de Ventana, el 73% de las organizaciones están combinando sus lagos de datos y almacenes de datos. Las casas de lago de datos se pueden construir sobre sistemas existentes, incluidos S3, HDFS y más.

Mientras trabajaba en este Top 5, el algoritmo de autocorrección siguió cambiando de casa de lago a casa de horneado, lo que supongo que significa que las panaderías de datos serán la próxima evolución en el análisis de datos.

Suscríbase a TechRepublic Top 5 en YouTube para recibir los últimos consejos tecnológicos para profesionales de negocios de Tom Merritt.

Ver también