La arquitectura Medallon es el estandar de facto para organizar datos en la nube. Si tienes datos en multiples sistemas y nadie sabe cual es la fuente de la verdad, este articulo es para ti.
Que es la arquitectura Medallon
La arquitectura Medallon, popularizada por Databricks, organiza datos en un Data Lake en tres capas diferenciadas:
- Bronze: Los datos tal como llegan, sin transformar. Inmutables: nunca se borran.
- Silver: Despues de limpieza, deduplicacion y normalizacion. Ya son fiables para analisis.
- Gold: Datos agregados segun necesidades de negocio. Alimentan dashboards y modelos de ML.
Por que supera a las arquitecturas tradicionales
Los Data Warehouses tradicionales tenian esquemas rigidos. El Data Lake sin estructura era imposible de gobernar. El Medallon resuelve esta dicotomia: Bronze absorbe cambios sin romper nada, Silver aplica transformaciones controladas, Gold expone modelos estables para negocio.
Como implementarlo en Azure o AWS
En Azure: ADLS Gen2 como base, Azure Data Factory o Databricks para pipelines, Power BI o Synapse para consumo.
En AWS: S3, AWS Glue o Apache Spark para transformaciones, y Redshift o Athena para consultas.
Preguntas frecuentes
Cuanto tiempo tarda en implementarse?
Las primeras tablas en capa Gold pueden estar en 4-6 semanas. Una arquitectura completa tarda entre 3 y 6 meses.
Necesito Databricks obligatoriamente?
No. El patron puede implementarse con cualquier stack. Lo esencial es la separacion en capas y los principios de calidad de datos.
