Apache beam permite la creación de pipelines que se ejecutan en paralelo.
El potencial de Apache Beam se puede aprovechar en servicios como DataFlow de GCP.
Este repositorio contiene un ejemplo de cómo usar la biblioteca de Apache Beam para python.
- Limpiar texto: Abre un dataset almacenado como un csv y lo transforma para limpiar su texto.