Data & AI Engineer
- Verfügbarkeit einsehen
- 0 Referenzen
- 95€/Stunde
- 10625 Berlin
- auf Anfrage
- de | en
- 25.06.2026
- Contract ready
Kurzvorstellung
Geschäftsdaten
Qualifikationen
Projekt‐ & Berufserfahrung
3/2026 – 5/2026
TätigkeitsbeschreibungDesigned and deployed a Databricks Supervisor Agent (Mosaic AI) orchestrating multiple Genie Spaces and tools through a single governed endpoint; integrated into the corporate AI platform (LibreChat) via MCP and OAuth 2.0 (Azure Entra ID), incl. architecture design, auth troubleshooting, and technical documentation.
Eingesetzte QualifikationenDatabricks, SQL, Python, Microsoft Azure
3/2026 – 4/2026
TätigkeitsbeschreibungImplemented a cloud-based ingestion pipeline for the Creditreform CWS SOAP API: Python client library, Azure Functions for mailbox processing, ADF orchestration, Databricks notebook for XML parsing and Delta Table upsert into Unity Catalog; full acceptance testing with 17 documented test cases.
Eingesetzte QualifikationenDatabricks, SQL, Python, Microsoft Azure
3/2025 – 7/2025
TätigkeitsbeschreibungDesign and implementation of a fully automated reconciliation process matching internal ledger bookings with external Nostro account statements at transaction level: reconciliation logic on value dates, debit/credit indicators and tolerances; mismatch categorization; match/mismatch reporting; close collaboration with finance and operations teams.
Eingesetzte QualifikationenApache Spark, Databricks, SQL, Python
12/2024 – 2/2025
TätigkeitsbeschreibungConceptual design of a secure, scalable Power BI reporting architecture with Databricks integration: data models and governance concepts, Dev/Test/Prod deployment strategy, RBAC and Row-Level Security, performance optimization, alignment with business and IT stakeholders.
Eingesetzte QualifikationenDatabricks, Power Bi, SQL
5/2024 – 11/2024
TätigkeitsbeschreibungMigration and modernization of marketing-automation processes to the cloud-based SAS CI 360 platform: redesign of data models for cloud compatibility, management of technical environments, coordination between marketing and IT.
Eingesetzte QualifikationenSAS (Software), SQL
2/2024 – 5/2024
TätigkeitsbeschreibungDevelopment of an enterprise-wide ESG strategy and a central ESG dashboard for management reporting: KPI definition, Power BI dashboards, reporting automation, data preparation and processing on Databricks, CSRD compliance.
Eingesetzte QualifikationenDatabricks, Power Bi, SQL
1/2024 – 5/2024
TätigkeitsbeschreibungDesign and implementation of ETL processes and data-warehouse solutions for large-scale operational data: ETL pipeline development, administration and optimization of DWH structures, data quality and consistency, operational support.
Eingesetzte QualifikationenHTML, JavaScript, SAS (Software), SQL
5/2020 – 10/2022
TätigkeitsbeschreibungDatengetriebene makroökonomische Berichte und Prognosen für internationale Finanzkunden wie Banken, Vermögensverwalter und institutionelle Investoren. Klassifizierungs- und Regressionsmodelle zur Vorhersage makroökonomischer Entwicklungen. Visuelle Berichterstattung und systematisches Code-Qualitätsmanagement.
Eingesetzte QualifikationenDatabricks, Power Bi, Python, SQL, Tableau
nicht angegeben
8/2017 – 11/2017
TätigkeitsbeschreibungIntegration von Finanzmodellen und Leistungsstatistiken in einer regulierten Finanzdienstleistungsbranche.
Eingesetzte QualifikationenController
Zertifikate
Databricks
Databricks
SAS
Ausbildung
Berlin
Über mich
Aufbau und Migration von Data-Warehouse-Workloads auf die Databricks-Lakehouse-Plattform — robuste Ingestion- und Verarbeitungspipelines mit PySpark, Delta Lake und SQL, Medallion-Architektur, Unity Catalog.
Entwicklung produktiver GenAI-Lösungen auf Databricks — End-to-End-RAG-Pipelines (Chunking, Embeddings, Vector Search, Re-Ranking) und agentenbasierte Multi-Agent-Architekturen (Mosaic AI, Genie Spaces), bereitgestellt über OpenAI-kompatible APIs (FastAPI) und angebunden via MCP und OAuth 2.0.
Aktuell konzipiere und betreibe ich produktive Agentic-AI-Systeme, die mehrere spezialisierte Agents über einen zentralen, governten Endpoint orchestrieren — inklusive sicherer Authentifizierung (Azure Entra ID) und Integration in Unternehmens-Chat-Plattformen.
Auf der Data-Engineering-Seite habe ich Migrationen von Legacy-Data-Warehouses auf Databricks begleitet, automatisierte Reconciliation-Prozesse für Banking-Kunden gebaut und produktive API-Integrationspipelines (REST/SOAP) mit vollständiger Testabnahme dokumentiert.
Technischer Stack: Databricks (PySpark, Delta Lake, Unity Catalog), Python, SQL, Azure (ADF, ADLS, Entra ID, Key Vault), Terraform, FastAPI, LangChain, MLflow, Power BI, Git/Jira, CI/CD. Grundkenntnisse in GCP/BigQuery (praktische Erfahrung bei FocusEconomics).
Ich arbeite in regulierten Enterprise-Umgebungen mit Git-basierten Workflows, Jira-gestütztem Change-Management, Infrastructure as Code und formaler Kundenabnahme. Mathematik-Hintergrund (B.Sc. Wirtschaftsmathematik, TU Berlin, Schwerpunkt Statistik & Stochastik) gibt mir eine solide quantitative Basis für Datenmodellierung, Forecasting und statistische Auswertungen.
Sofort verfügbar für Freelance-Projekte, 100% remote bevorzugt, gelegentliche Vor-Ort-Termine möglich. Databricks Certified Data Engineer Professional in Vorbereitung (Prüfung Q3/2026).
Weitere Kenntnisse
Data Engineering: ETL/ELT-Pipelines, Medallion-Architektur (Bronze/Silver/Gold), Datenmodellierung (dimensional, relational), Data Warehousing, Data Lake/Lakehouse, Datenqualität & Validierung, Delta Lake, Unity Catalog.
Cloud & DevOps: Microsoft Azure (Azure Data Factory, ADLS Gen2, Azure SQL, Entra ID, Key Vault, Azure Functions), GCP/BigQuery (Grundkenntnisse), Terraform (Infrastructure as Code, inkl. Secret-Management in mehrstufigen Azure-DevOps-Pipelines), Docker, Git, CI/CD, Jira/Confluence.
Backend & APIs: FastAPI, REST/SOAP-API-Integration, OpenAI-kompatible Endpoints, Python (Pandas, PySpark).
Analytics & BI: Power BI (inkl. RBAC/Row-Level Security, Governance-Konzepte), Tableau, SQL, statistische Auswertungen (Regression, Klassifikation, Clustering, Hypothesentests), Forecasting.
MLOps: MLflow (Experiment Tracking, Model Registry, Monitoring), Model Versioning, produktive ML-Pipelines.
Branchenerfahrung: Banking (Nostro-Reconciliation, regulierte Compliance-Anforderungen), Insurance (ESG-Reporting, CSRD-Compliance, Marketing-Automation-Migration), makroökonomische Forschung für institutionelle Investoren, Healthcare/Insurance (Agentic-AI-Integration).
Zertifizierungen: Databricks Certified Data Analyst Associate, Databricks Fundamentals Accreditation, Databricks Certified Data Engineer Professional (in Vorbereitung, Prüfung Q3/2026), SAS Certified Specialist: Base Programming.
Ausbildung: B.Sc. Wirtschaftsmathematik, TU Berlin, Schwerpunkt Statistik & Stochastik.
Sonstiges: Selbstständige Tätigkeit unter mithelfer.ai (AI-Automatisierung für KMU, Statistikberatung), regelmäßiges freiberufliches Tutoring in Statistik und Programmierung.
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden
