Click here for English version
Jag bygger robusta, skalbara datapipelines och drivs av att lösa verkliga problem från rådata till affärsvärde. Jag är för närvarande under utbildning till Data Engineer vid Stockholms Tekniska Institut (STI) och letar efter en LIA-plats (praktik) inför våren 2027.
Min filosofi är enkel: Lämna tutorial-datan, bygga system som hanterar verklighetens stökiga kantfall, och var alltid redo att anpassa tech-stacken efter affärens behov.
Pågående projekt
Stack: Kafka (KRaft), Python, Pandas, PySpark, dbt, Docker, Parquet
- Designade en end-to-end strömmande datapipeline som drar live-events från GitHub API.
- Hanterar data från Ingestion (Bronze) via Kafka, deduplicering och validering av nästlad JSON (Silver), redo för analytiska vyer (Gold).
- Löste komplexa schema-utmaningar (schema inference bugs) vid konvertering av stökiga API-svar till optimerad kolumnbaserad lagring (Parquet).
Pågående projekt
Stack: Python, Vector Databases, LLMs, RAG-arkitektur
- Utvecklade en AI-driven sökapplikation (Retrieval-Augmented Generation) för att effektivt lagra och hämta Data Engineering-koncept.
- Demonstrerar förståelse för moderna AI/MLOps-mönster och hur man integrerar språkmodeller med egna databaser.
- Data Engineering & Pipelines: Apache Kafka, dbt, PySpark, Pandas
- Databaser & Lagring: DuckDB (OLAP), PostgreSQL (OLTP), Parquet, Dimensional Modeling
- Infrastruktur & DevOps: Docker, GitHub Actions (CI/CD), Pytest
- BI & Visualisering: PowerBI, Streamlit, Matplotlib
- Kommande / Pågående: AWS/Azure (Molnplattformar), Terraform
Jag pratar gärna arkitektur, data-livscykler eller hur man hanterar oväntade null-värden i schemalösa API:er.
Fler projekt t.ex labbar/examinationsuppgifter ifrån tidigare kurser går att hitta under mina repositorys.
- LinkedIn: LinkedIn
- Email: [email protected]


