EN / ES / HU
architect

Aceleración de lagos de datos: Optimización de Apache Iceberg y Spark con gcs-analytics-core

Fuente: cloudblog.withgoogle.com 1 min de lectura

Compartir

Aceleración de lagos de datos: Optimización de Apache Iceberg y Spark con gcs-analytics-core

Estás leyendo un resumen. El contenido completo está en cloudblog.withgoogle.com.

Google presentó gcs-analytics-core, una biblioteca Java de código abierto que añade optimizaciones compartidas de lectura GCS entre motores analíticos. Integrado de forma nativa con Apache Iceberg 1.11.0+ GCSFileIO, permite la prelectura de E/S vectorizada con hilos y la prelectura inteligente de los parasuelos de parquet, y los benchmarks TPC-DS en Spark muestran reducciones considerables de tiempo de escaneo y ejecución.

Leer el artículo completo en el sitio original

Enlace externo a cloudblog.withgoogle.com

Artículos relacionados