freiberufler Data Scientist | Aktuar auf freelance.de

Data Scientist | Aktuar

zuletzt online vor wenigen Stunden
  • 70‐75€/Stunde
  • 70372 Stuttgart
  • National
  • fr  |  de  |  en
  • 22.05.2026
  • Contract ready

Kurzvorstellung

Data Scientist & AI Engineer | ML-Pricing (GLM, XGBoost) · Survival Analysis (Cox, Kaplan-Meier) · NLP/LLM (BERT, LangChain, GPT-4o) | Python · Azure · Plotly | Versicherungs-Expertise (BU, RLV, Leben) | 3+ Jahre Allianz

Geschäftsdaten

 Freiberuflich
 Steuernummer bekannt

Qualifikationen

  • Aktuar
  • Data Science
  • Datenanalyse
  • Machine Learning
  • Microsoft Office 365
  • Predictive Modeling
  • Produktentwicklungsingenieur
  • Python
  • R (Programmiersprache)
  • Versicherungsmathematik

Projekt‐ & Berufserfahrung

Aktuar
Allianz Leben, Stuttgart
9/2024 – 7/2025 (11 Monate)
Versicherungen
Tätigkeitszeitraum

9/2024 – 7/2025

Tätigkeitsbeschreibung

Entwicklung und Produktivsetzung eines NLP-Klassifizierungsmodells zur automatischen Kategorisierung eingehender Kundenanfragen
(E-Mails, Briefe) in 8 Klassen mit SLA-basiertem Routing.

• Datenbasis: 452.318 qualitätsgeprüfte Texte aus dem Allianz CRM-Archiv (2021–2024); 48.500 manuell annotiert (2 Annotatoren,
Cohen's Kappa = 0,91)
• BERT Fine-Tuning (deepset/gbert-base, 110M Parameter): Accuracy 98,2 %, F1 = 0,981 — übertrifft TF-IDF/SVM Baseline (95,4 %)
signifikant
• Semi-Supervised Pseudo-Labeling auf 403.818 unlabeled Texten (Konfidenz ≥ 0,95)
• DSGVO-konforme Anonymisierung via spaCy NER (Namen, Vertragsnummern, IBAN)
• LangChain + GPT-4o Zero-Shot als Fallback für neue/unbekannte Kategorien
• Automatisierungsrate 78 % — Zeitersparnis ~2.500 Stunden/Monat
• Python, HuggingFace Transformers, spaCy, LangChain, Plotly/Dash

Eingesetzte Qualifikationen

Machine Learning

Aktuar
Allianz Leben, Stuttgart
3/2024 – 12/2024 (10 Monate)
Versicherungen
Tätigkeitszeitraum

3/2024 – 12/2024

Tätigkeitsbeschreibung

Aufgaben:
Survival-analytische Untersuchung des Stornoverhaltens im RLV-Bestand (500.778 Verträge) zur Identifikation und
Quantifizierung von Anti-Selektionseffekten.

• Kaplan-Meier Überlebensanalyse nach Raucherstatus, Gesundheit und Altersgruppe — Log-rank Tests (p < 0,001) zur
Signifikanzprüfung von Gruppenunterschieden
• Cox Proportional Hazards Modell: Identifikation der Storno-Treiber (Nichtraucher HR=1,84; Gesundheit "Gut" HR=1,62—
Anti-Selektion statistisch nachgewiesen
• Anti-Selektions-Index (ASI = 1,24): Portfolio nach 5 Jahren um 24 % risikoreicher als zu Beginn
• Entwicklung eines Storno-Score-Modells zur proaktiven Früherkennung kündigungsgefährdeter Niedrigrisiko-VN
• Python (Pandas, Lifelines, Scikit-learn), interaktives Dashboard (Plotly/Dash)

Eingesetzte Qualifikationen

Data Science

Aktuar (Festanstellung)
Allianz leben, Stuttgart
3/2023 – 11/2023 (9 Monate)
Versicherungen
Tätigkeitszeitraum

3/2023 – 11/2023

Tätigkeitsbeschreibung

End-to-End ML-Projekt zur datengetriebenen Überprüfung und Optimierung des BU-Tarifs auf Basis von 387.241 aktiven Verträgen
(2020–2023).

• Datenaufbereitung & Feature Engineering: Exploration und Transformation des BU-Portfolios, Behandlung fehlender Werte (< 0,8 %),
Identifikation relevanter Risikotreiber — Python (Pandas, NumPy), SQL
• Modellentwicklung: Systematischer Vergleich GLM (Tweedie/Binomial) vs. XGBoost/Gradient Boosting — Hyperparameter-Tuning,
Regularisierung (Ridge, Lasso)
• Modellvalidierung: AUC 0,725 (GLM), Brier Score 0,063, 5-fold Cross-Validation (CV-AUC 0,720), SHAP-Values zur
Interpretierbarkeit gegenüber Fachabteilungen
• Pricing-Gap-Analyse: Identifikation von 2 stark unterkalibrierten Segmenten (Schwere Körperarbeit +321 %, Handwerk +165 %) —
konkrete Tarifanpassungsempfehlungen für das Management
• Interaktives Management-Dashboard (Python, Plotly/Dash) zur Portfolioüberwachung
• Präsentation der Ergebnisse vor Pricing- und Produktmanagement

Eingesetzte Qualifikationen

Aktuar, Data Scientist

Ausbildung

Aktuar (DAV)
Ausbildung
Deutsche Aktuarvereinigung
2026
Applied Mathematics
M.Sc.
Hochschule Koblenz
2022
Koblenz
Wirtschaftsmathematik
B.Sc.
Hochschule Koblenz
2020
Koblenz

Über mich

Data Scientist mit aktuariellem Hintergrund und mehrjähriger Erfahrung im Aufbau und der Validierung von Predictive-Pricing-Modellen in der Lebens- und BU-Versicherung.

Meine Kern-Expertise liegt in der End-to-End-Entwicklung von ML-Modellen — von der explorativen Portfolioanalyse über Feature Engineering bis zur Modellvalidierung (AUC, Brier Score, K-Fold Cross-Validation) und dem Deployment in interaktiven Dashboards.
Ich vergleiche klassische Ansätze (GLM/Logit) systematisch mit modernen Boosting-Methoden (XGBoost, Gradient Boosting) und übersetze die Ergebnisse direkt in praxisrelevante Pricing-Entscheidungen.

Projekterfahrung umfasst u. a.:
- BU-Pricing-Optimierung — vollständige ML-Pipeline (GLM vs. GBM), Pricing-Gap-Analyse, Tarifanpassungsempfehlungen
- Datengetriebene Pricing-Methoden — OKAPY & Data Cure (Allianz-interne Methodik)
- Sensitivitätsanalysen für biometrische Risikomodelle
- RLV-Storno- & Lapse-Analyse — Survival Analysis (Kaplan-Meier, Cox Proportional Hazards), Nachweis von Anti-Selektion im
RLV-Bestand, Quantifizierung der Portfolioverschlechterung über 5 Jahre (500k+ Verträge)
- NLP-Klassifizierung von Kundenanfragen — BERT Fine-Tuning (deepset/gbert-base), LangChain + GPT-4o (Zero-Shot), semi-supervised
Pseudo-Labeling auf 450k+ Dokumenten; 78 % Automatisierungsrate, ~2.500 Std. Zeitersparnis/Monat
- Interaktive Dashboards zur Visualisierung von Modelloutputs (Python, Plotly / Streamlit)

Der aktuarielle Hintergrund schafft eine seltene Kombination: versicherungsmathematische Tiefe, klassisches ML-Pricing und moderne LLM-Kompetenz in einer Person — ein klarer Mehrwert für Pricing-Teams, Risk-Analytics- und AI-Projekte.

Sprachen: Deutsch (verhandlungssicher) · Französisch (Muttersprache) · Englisch (fließend)

Weitere Kenntnisse

Skills — Data Science Profil

Machine Learning & Modellierung
- Supervised Learning: GLM, Logistic Regression, Decision Trees
- Ensemble Methods: Gradient Boosting, XGBoost, LightGBM, Random Forest
- Modellvalidierung: AUC-ROC, Brier Score, K-Fold CV, Lift Curves
- Feature Engineering & Selektion
- Pricing-Gap-Analyse & Tarifkalibrierung

Survival Analysis & Storno-Modellierung
- Kaplan-Meier Überlebensschätzung, Log-Rank-Test
- Cox Proportional Hazards (Hazard Ratios, Signifikanztests)
- Anti-Selektions-Analyse & Portfolio-Verschlechterungsquantifizierung
- lifelines (Python)

NLP & LLM-Integration
- BERT Fine-Tuning (deepset/gbert-base, HuggingFace Transformers)
- LangChain + GPT-4o (Zero-Shot, Few-Shot, Prompt Engineering)
- Anthropic Claude API, OpenAI API, Azure OpenAI
- RAG-Architektur (Retrieval Augmented Generation, Vector-DBs)
- Semi-Supervised Learning (Pseudo-Labeling, 450k+ Dokumente)
- Halluzinationskontrolle, Konfidenz-Scoring, Audit-Trail

Python-Stack
- Pandas, NumPy (Datenaufbereitung)
- Scikit-learn (Modellierung & Validierung)
- Matplotlib, Seaborn, Plotly (Visualisierung)
- Streamlit / Dash (Dashboards)
- LangChain, HuggingFace Transformers, lifelines

Domänenwissen
- Versicherungs-Pricing (Leben, BU, Risikoleben)
- Biometrische Risikomodelle
- Portfolio-Analyse & Risikosegmentierung
- Storno- & Lapse-Analyse (RLV-Bestand)
- BaFin-reguliertes Umfeld, DSGVO-konforme Pipelines

Sonstiges
- R (fortgeschritten), SQL, Git, Excel/VBA
- Microsoft Azure (AI Services, Functions, Storage)

Persönliche Daten

Sprache
  • Französisch (Muttersprache)
  • Deutsch (Fließend)
  • Englisch (Gut)
Reisebereitschaft
National
Arbeitserlaubnis
  • Europäische Union
  • Schweiz
  • Vereinigte Staaten von Amerika
Home-Office
bevorzugt
Profilaufrufe
51
Alter
28
Berufserfahrung
3 Jahre und 11 Monate (seit 06/2022)
Projektleitung
1 Jahr

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden