architect
Aceleración de lagos de datos: Optimización de Apache Iceberg y Spark con gcs-analytics-core
Fuente:
cloudblog.withgoogle.com 1 min de lectura
Compartir
Estás leyendo un resumen. El contenido completo está en cloudblog.withgoogle.com.
Google presentó gcs-analytics-core, una biblioteca Java de código abierto que añade optimizaciones compartidas de lectura GCS entre motores analíticos. Integrado de forma nativa con Apache Iceberg 1.11.0+ GCSFileIO, permite la prelectura de E/S vectorizada con hilos y la prelectura inteligente de los parasuelos de parquet, y los benchmarks TPC-DS en Spark muestran reducciones considerables de tiempo de escaneo y ejecución.
Leer el artículo completo en el sitio original
Enlace externo a cloudblog.withgoogle.com
Artículos relacionados
architect
La propuesta del estándar WebMCP para la activación web agencial ya está disponible en Chrome (pruebas de Origin).
1 min read •
architect
Slack elimina SSH en las canalizaciones de EMR y migra más de 700 trabajos a una arquitectura basada en REST.
1 min read •
architect
El giro digital: cómo HSS transformó la contratación con IA proactiva
1 min read •