freiberufler Data & AI Engineer auf freelance.de

Data & AI Engineer

online
  • 95€/Stunde
  • 10625 Berlin
  • auf Anfrage
  • de  |  en
  • 25.06.2026
  • Contract ready

Kurzvorstellung

Data & AI Engineer (Databricks, Azure, GenAI/RAG). 6+ Jahre Data-Erfahrung, finanznaher Hintergrund

Geschäftsdaten

 Freiberuflich
 Steuernummer bekannt

Qualifikationen

  • Data Engineer
  • Databricks3 J.
  • Docker
  • Generative KI
  • Machine Learning
  • Microsoft Azure
  • Power Bi2 J.
  • Python3 J.
  • R (Programmiersprache)
  • SQL4 J.

Projekt‐ & Berufserfahrung

AI Engineer: AI-Center: Databricks Agentic AI Integration (Festanstellung)
Kundenname anonymisiert, Berlin
3/2026 – 5/2026 (3 Monate)
Gesundheitswesen
Tätigkeitszeitraum

3/2026 – 5/2026

Tätigkeitsbeschreibung

Designed and deployed a Databricks Supervisor Agent (Mosaic AI) orchestrating multiple Genie Spaces and tools through a single governed endpoint; integrated into the corporate AI platform (LibreChat) via MCP and OAuth 2.0 (Azure Entra ID), incl. architecture design, auth troubleshooting, and technical documentation.

Eingesetzte Qualifikationen

Databricks, SQL, Python, Microsoft Azure

Data Engineer: CWS API Integration — Creditreform WebServices (Festanstellung)
Kundenname anonymisiert, Berlin
3/2026 – 4/2026 (2 Monate)
Gesundheitswesen
Tätigkeitszeitraum

3/2026 – 4/2026

Tätigkeitsbeschreibung

Implemented a cloud-based ingestion pipeline for the Creditreform CWS SOAP API: Python client library, Azure Functions for mailbox processing, ADF orchestration, Databricks notebook for XML parsing and Delta Table upsert into Unity Catalog; full acceptance testing with 17 documented test cases.

Eingesetzte Qualifikationen

Databricks, SQL, Python, Microsoft Azure

Data Engineer: Automated Nostro Account Reconciliation
Kundenname anonymisiert, Berlin
3/2025 – 7/2025 (5 Monate)
Banken
Tätigkeitszeitraum

3/2025 – 7/2025

Tätigkeitsbeschreibung

Design and implementation of a fully automated reconciliation process matching internal ledger bookings with external Nostro account statements at transaction level: reconciliation logic on value dates, debit/credit indicators and tolerances; mismatch categorization; match/mismatch reporting; close collaboration with finance and operations teams.

Eingesetzte Qualifikationen

Apache Spark, Databricks, SQL, Python

Scalable Power BI Architecture with Databricks Integration
Kundenname anonymisiert, Berlin
12/2024 – 2/2025 (3 Monate)
Dienstleistungsbranchen (Service)
Tätigkeitszeitraum

12/2024 – 2/2025

Tätigkeitsbeschreibung

Conceptual design of a secure, scalable Power BI reporting architecture with Databricks integration: data models and governance concepts, Dev/Test/Prod deployment strategy, RBAC and Row-Level Security, performance optimization, alignment with business and IT stakeholders.

Eingesetzte Qualifikationen

Databricks, Power Bi, SQL

Data Engineer: Migration SAS Marketing Automation to SAS CI 360 (Festanstellung)
Kundenname anonymisiert, Berlin
5/2024 – 11/2024 (7 Monate)
Versicherungen
Tätigkeitszeitraum

5/2024 – 11/2024

Tätigkeitsbeschreibung

Migration and modernization of marketing-automation processes to the cloud-based SAS CI 360 platform: redesign of data models for cloud compatibility, management of technical environments, coordination between marketing and IT.

Eingesetzte Qualifikationen

SAS (Software), SQL

Data Engineer: ESG Strategy and Dashboard (Festanstellung)
Kundenname anonymisiert, Berlin
2/2024 – 5/2024 (4 Monate)
Dienstleistungsbranchen (Service)
Tätigkeitszeitraum

2/2024 – 5/2024

Tätigkeitsbeschreibung

Development of an enterprise-wide ESG strategy and a central ESG dashboard for management reporting: KPI definition, Power BI dashboards, reporting automation, data preparation and processing on Databricks, CSRD compliance.

Eingesetzte Qualifikationen

Databricks, Power Bi, SQL

Data Engineer: SAS-Based ETL and Data Warehouse Development (Festanstellung)
Kundenname anonymisiert, Berlin
1/2024 – 5/2024 (5 Monate)
Öl- und Gasindustrie
Tätigkeitszeitraum

1/2024 – 5/2024

Tätigkeitsbeschreibung

Design and implementation of ETL processes and data-warehouse solutions for large-scale operational data: ETL pipeline development, administration and optimization of DWH structures, data quality and consistency, operational support.

Eingesetzte Qualifikationen

HTML, JavaScript, SAS (Software), SQL

Data Engineer / Data Analyst
FocusEconomics, Barcelona
5/2020 – 10/2022 (2 Jahre, 6 Monate)
Finanzdienstleister
Tätigkeitszeitraum

5/2020 – 10/2022

Tätigkeitsbeschreibung

Datengetriebene makroökonomische Berichte und Prognosen für internationale Finanzkunden wie Banken, Vermögensverwalter und institutionelle Investoren. Klassifizierungs- und Regressionsmodelle zur Vorhersage makroökonomischer Entwicklungen. Visuelle Berichterstattung und systematisches Code-Qualitätsmanagement.

Eingesetzte Qualifikationen

Databricks, Power Bi, Python, SQL, Tableau

Data Analyst Praktikant, Controlling
tecis Finanzdienstleistungen AG, Berlin
8/2017 – 11/2017 (4 Monate)
nicht angegeben
Tätigkeitszeitraum

8/2017 – 11/2017

Tätigkeitsbeschreibung

Integration von Finanzmodellen und Leistungsstatistiken in einer regulierten Finanzdienstleistungsbranche.

Eingesetzte Qualifikationen

Controller

Zertifikate

Databricks Certified Data Analyst Associate
Databricks
2024
Databricks Fundamentals Accreditation
Databricks
2024
SAS Certified Specialist: Base Programming
SAS
2024

Ausbildung

Technische Universität Berlin
Bachelor of Science in Wirtschaftsmathematik
2019
Berlin

Über mich

Data & AI Engineer mit ~3 Jahren Hands-on-Erfahrung in Databricks und einem finanznahen Hintergrund aus Banking, Insurance und makroökonomischer Forschung für institutionelle Investoren. Mein Schwerpunkt liegt auf zwei sich ergänzenden Stärken:

Aufbau und Migration von Data-Warehouse-Workloads auf die Databricks-Lakehouse-Plattform — robuste Ingestion- und Verarbeitungspipelines mit PySpark, Delta Lake und SQL, Medallion-Architektur, Unity Catalog.
Entwicklung produktiver GenAI-Lösungen auf Databricks — End-to-End-RAG-Pipelines (Chunking, Embeddings, Vector Search, Re-Ranking) und agentenbasierte Multi-Agent-Architekturen (Mosaic AI, Genie Spaces), bereitgestellt über OpenAI-kompatible APIs (FastAPI) und angebunden via MCP und OAuth 2.0.

Aktuell konzipiere und betreibe ich produktive Agentic-AI-Systeme, die mehrere spezialisierte Agents über einen zentralen, governten Endpoint orchestrieren — inklusive sicherer Authentifizierung (Azure Entra ID) und Integration in Unternehmens-Chat-Plattformen.
Auf der Data-Engineering-Seite habe ich Migrationen von Legacy-Data-Warehouses auf Databricks begleitet, automatisierte Reconciliation-Prozesse für Banking-Kunden gebaut und produktive API-Integrationspipelines (REST/SOAP) mit vollständiger Testabnahme dokumentiert.
Technischer Stack: Databricks (PySpark, Delta Lake, Unity Catalog), Python, SQL, Azure (ADF, ADLS, Entra ID, Key Vault), Terraform, FastAPI, LangChain, MLflow, Power BI, Git/Jira, CI/CD. Grundkenntnisse in GCP/BigQuery (praktische Erfahrung bei FocusEconomics).
Ich arbeite in regulierten Enterprise-Umgebungen mit Git-basierten Workflows, Jira-gestütztem Change-Management, Infrastructure as Code und formaler Kundenabnahme. Mathematik-Hintergrund (B.Sc. Wirtschaftsmathematik, TU Berlin, Schwerpunkt Statistik & Stochastik) gibt mir eine solide quantitative Basis für Datenmodellierung, Forecasting und statistische Auswertungen.
Sofort verfügbar für Freelance-Projekte, 100% remote bevorzugt, gelegentliche Vor-Ort-Termine möglich. Databricks Certified Data Engineer Professional in Vorbereitung (Prüfung Q3/2026).

Weitere Kenntnisse

GenAI & Agentic AI: RAG-Architekturen (Chunking, Embedding, Retrieval, Re-Ranking), Multi-Agent-Systeme, Mosaic AI Agent Framework, Genie Spaces, MCP (Model Context Protocol), OAuth 2.0, Prompt Engineering, LangChain, Vector Search, Embeddings.
Data Engineering: ETL/ELT-Pipelines, Medallion-Architektur (Bronze/Silver/Gold), Datenmodellierung (dimensional, relational), Data Warehousing, Data Lake/Lakehouse, Datenqualität & Validierung, Delta Lake, Unity Catalog.
Cloud & DevOps: Microsoft Azure (Azure Data Factory, ADLS Gen2, Azure SQL, Entra ID, Key Vault, Azure Functions), GCP/BigQuery (Grundkenntnisse), Terraform (Infrastructure as Code, inkl. Secret-Management in mehrstufigen Azure-DevOps-Pipelines), Docker, Git, CI/CD, Jira/Confluence.
Backend & APIs: FastAPI, REST/SOAP-API-Integration, OpenAI-kompatible Endpoints, Python (Pandas, PySpark).
Analytics & BI: Power BI (inkl. RBAC/Row-Level Security, Governance-Konzepte), Tableau, SQL, statistische Auswertungen (Regression, Klassifikation, Clustering, Hypothesentests), Forecasting.
MLOps: MLflow (Experiment Tracking, Model Registry, Monitoring), Model Versioning, produktive ML-Pipelines.
Branchenerfahrung: Banking (Nostro-Reconciliation, regulierte Compliance-Anforderungen), Insurance (ESG-Reporting, CSRD-Compliance, Marketing-Automation-Migration), makroökonomische Forschung für institutionelle Investoren, Healthcare/Insurance (Agentic-AI-Integration).
Zertifizierungen: Databricks Certified Data Analyst Associate, Databricks Fundamentals Accreditation, Databricks Certified Data Engineer Professional (in Vorbereitung, Prüfung Q3/2026), SAS Certified Specialist: Base Programming.
Ausbildung: B.Sc. Wirtschaftsmathematik, TU Berlin, Schwerpunkt Statistik & Stochastik.
Sonstiges: Selbstständige Tätigkeit unter mithelfer.ai (AI-Automatisierung für KMU, Statistikberatung), regelmäßiges freiberufliches Tutoring in Statistik und Programmierung.

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
Reisebereitschaft
auf Anfrage
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
5
Alter
33
Berufserfahrung
8 Jahre und 10 Monate (seit 08/2017)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden