Data Scientist | Aktuar

zuletzt online vor wenigen Stunden

Verfügbarkeit einsehen
0 Referenzen

70‐75€/Stunde
70372 Stuttgart
National
fr | de | en
22.05.2026
Contract ready

Kurzvorstellung

			Data Scientist & AI Engineer | ML-Pricing (GLM, XGBoost) · Survival Analysis (Cox, Kaplan-Meier) · NLP/LLM (BERT, LangChain, GPT-4o) | Python · Azure · Plotly | Versicherungs-Expertise (BU, RLV, Leben) | 3+ Jahre Allianz
		

Geschäftsdaten

Freiberuflich

Steuernummer bekannt

Qualifikationen

		 Aktuar
 Data Science
 Datenanalyse
 Machine Learning
 Microsoft Office 365
 Predictive Modeling
 Produktentwicklungsingenieur
 Python
 R (Programmiersprache)
 Versicherungsmathematik

		

Projekt‐ & Berufserfahrung

Aktuar 
									Allianz Leben, Stuttgart								

9/2024 – 7/2025 (11 Monate)

Details anzeigen

Tätigkeitszeitraum

9/2024 – 7/2025

Tätigkeitsbeschreibung

Entwicklung und Produktivsetzung eines NLP-Klassifizierungsmodells zur automatischen Kategorisierung eingehender Kundenanfragen
(E-Mails, Briefe) in 8 Klassen mit SLA-basiertem Routing.

• Datenbasis: 452.318 qualitätsgeprüfte Texte aus dem Allianz CRM-Archiv (2021–2024); 48.500 manuell annotiert (2 Annotatoren,
Cohen's Kappa = 0,91)
• BERT Fine-Tuning (deepset/gbert-base, 110M Parameter): Accuracy 98,2 %, F1 = 0,981 — übertrifft TF-IDF/SVM Baseline (95,4 %)
signifikant
• Semi-Supervised Pseudo-Labeling auf 403.818 unlabeled Texten (Konfidenz ≥ 0,95)
• DSGVO-konforme Anonymisierung via spaCy NER (Namen, Vertragsnummern, IBAN)
• LangChain + GPT-4o Zero-Shot als Fallback für neue/unbekannte Kategorien
• Automatisierungsrate 78 % — Zeitersparnis ~2.500 Stunden/Monat
• Python, HuggingFace Transformers, spaCy, LangChain, Plotly/Dash

Eingesetzte Qualifikationen

Machine Learning

Aktuar 
									Allianz Leben, Stuttgart								

3/2024 – 12/2024 (10 Monate)

Details anzeigen

Tätigkeitszeitraum

3/2024 – 12/2024

Tätigkeitsbeschreibung

Aufgaben:
Survival-analytische Untersuchung des Stornoverhaltens im RLV-Bestand (500.778 Verträge) zur Identifikation und
Quantifizierung von Anti-Selektionseffekten.

• Kaplan-Meier Überlebensanalyse nach Raucherstatus, Gesundheit und Altersgruppe — Log-rank Tests (p < 0,001) zur
Signifikanzprüfung von Gruppenunterschieden
• Cox Proportional Hazards Modell: Identifikation der Storno-Treiber (Nichtraucher HR=1,84; Gesundheit "Gut" HR=1,62—
Anti-Selektion statistisch nachgewiesen
• Anti-Selektions-Index (ASI = 1,24): Portfolio nach 5 Jahren um 24 % risikoreicher als zu Beginn
• Entwicklung eines Storno-Score-Modells zur proaktiven Früherkennung kündigungsgefährdeter Niedrigrisiko-VN
• Python (Pandas, Lifelines, Scikit-learn), interaktives Dashboard (Plotly/Dash)

Eingesetzte Qualifikationen

Data Science

Aktuar (Festanstellung)
									Allianz leben, Stuttgart								

3/2023 – 11/2023 (9 Monate)

Details anzeigen

Tätigkeitszeitraum

3/2023 – 11/2023

Tätigkeitsbeschreibung

End-to-End ML-Projekt zur datengetriebenen Überprüfung und Optimierung des BU-Tarifs auf Basis von 387.241 aktiven Verträgen
(2020–2023).

• Datenaufbereitung & Feature Engineering: Exploration und Transformation des BU-Portfolios, Behandlung fehlender Werte (< 0,8 %),
Identifikation relevanter Risikotreiber — Python (Pandas, NumPy), SQL
• Modellentwicklung: Systematischer Vergleich GLM (Tweedie/Binomial) vs. XGBoost/Gradient Boosting — Hyperparameter-Tuning,
Regularisierung (Ridge, Lasso)
• Modellvalidierung: AUC 0,725 (GLM), Brier Score 0,063, 5-fold Cross-Validation (CV-AUC 0,720), SHAP-Values zur
Interpretierbarkeit gegenüber Fachabteilungen
• Pricing-Gap-Analyse: Identifikation von 2 stark unterkalibrierten Segmenten (Schwere Körperarbeit +321 %, Handwerk +165 %) —
konkrete Tarifanpassungsempfehlungen für das Management
• Interaktives Management-Dashboard (Python, Plotly/Dash) zur Portfolioüberwachung
• Präsentation der Ergebnisse vor Pricing- und Produktmanagement

Eingesetzte Qualifikationen

Aktuar, Data Scientist

Ausbildung

Aktuar (DAV)

Ausbildung
Deutsche Aktuarvereinigung

2026

Applied Mathematics

M.Sc.
Hochschule Koblenz

2022
Koblenz

Wirtschaftsmathematik

B.Sc.
Hochschule Koblenz

2020
Koblenz

Über mich

			Data Scientist mit aktuariellem Hintergrund und mehrjähriger Erfahrung im Aufbau und der Validierung von Predictive-Pricing-Modellen in der Lebens- und BU-Versicherung.

  Meine Kern-Expertise liegt in der End-to-End-Entwicklung von ML-Modellen — von der explorativen Portfolioanalyse über Feature Engineering bis zur Modellvalidierung (AUC, Brier Score, K-Fold Cross-Validation) und dem Deployment in interaktiven Dashboards.

Ich vergleiche klassische Ansätze (GLM/Logit) systematisch mit modernen Boosting-Methoden (XGBoost, Gradient Boosting) und übersetze die Ergebnisse direkt in praxisrelevante Pricing-Entscheidungen.

  Projekterfahrung umfasst u. a.:

  - BU-Pricing-Optimierung — vollständige ML-Pipeline (GLM vs. GBM), Pricing-Gap-Analyse, Tarifanpassungsempfehlungen

  - Datengetriebene Pricing-Methoden — OKAPY & Data Cure (Allianz-interne Methodik)

  - Sensitivitätsanalysen für biometrische Risikomodelle

  - RLV-Storno- & Lapse-Analyse — Survival Analysis (Kaplan-Meier, Cox Proportional Hazards), Nachweis von Anti-Selektion im

  RLV-Bestand, Quantifizierung der Portfolioverschlechterung über 5 Jahre (500k+ Verträge)

  - NLP-Klassifizierung von Kundenanfragen — BERT Fine-Tuning (deepset/gbert-base), LangChain + GPT-4o (Zero-Shot), semi-supervised

  Pseudo-Labeling auf 450k+ Dokumenten; 78 % Automatisierungsrate, ~2.500 Std. Zeitersparnis/Monat

  - Interaktive Dashboards zur Visualisierung von Modelloutputs (Python, Plotly / Streamlit)

Der aktuarielle Hintergrund schafft eine seltene Kombination: versicherungsmathematische Tiefe, klassisches ML-Pricing und moderne LLM-Kompetenz in einer Person — ein klarer Mehrwert für Pricing-Teams, Risk-Analytics- und AI-Projekte.

  Sprachen: Deutsch (verhandlungssicher) · Französisch (Muttersprache) · Englisch (fließend)

Weitere Kenntnisse

			Skills — Data Science Profil

  Machine Learning & Modellierung

  - Supervised Learning: GLM, Logistic Regression, Decision Trees

  - Ensemble Methods: Gradient Boosting, XGBoost, LightGBM, Random Forest

  - Modellvalidierung: AUC-ROC, Brier Score, K-Fold CV, Lift Curves

  - Feature Engineering & Selektion

  - Pricing-Gap-Analyse & Tarifkalibrierung

  Survival Analysis & Storno-Modellierung

  - Kaplan-Meier Überlebensschätzung, Log-Rank-Test

  - Cox Proportional Hazards (Hazard Ratios, Signifikanztests)

  - Anti-Selektions-Analyse & Portfolio-Verschlechterungsquantifizierung

  - lifelines (Python)

  NLP & LLM-Integration

  - BERT Fine-Tuning (deepset/gbert-base, HuggingFace Transformers)

  - LangChain + GPT-4o (Zero-Shot, Few-Shot, Prompt Engineering)

  - Anthropic Claude API, OpenAI API, Azure OpenAI

  - RAG-Architektur (Retrieval Augmented Generation, Vector-DBs)

  - Semi-Supervised Learning (Pseudo-Labeling, 450k+ Dokumente)

  - Halluzinationskontrolle, Konfidenz-Scoring, Audit-Trail

  Python-Stack

  - Pandas, NumPy (Datenaufbereitung)

  - Scikit-learn (Modellierung & Validierung)

  - Matplotlib, Seaborn, Plotly (Visualisierung)

  - Streamlit / Dash (Dashboards)

  - LangChain, HuggingFace Transformers, lifelines

  Domänenwissen

  - Versicherungs-Pricing (Leben, BU, Risikoleben)

  - Biometrische Risikomodelle

  - Portfolio-Analyse & Risikosegmentierung

  - Storno- & Lapse-Analyse (RLV-Bestand)

  - BaFin-reguliertes Umfeld, DSGVO-konforme Pipelines

  Sonstiges

  - R (fortgeschritten), SQL, Git, Excel/VBA

  - Microsoft Azure (AI Services, Functions, Storage)

Persönliche Daten

Sprache

							Französisch (Muttersprache)
Deutsch (Fließend)
Englisch (Gut)

							

Reisebereitschaft

National

Arbeitserlaubnis

							Europäische Union
Schweiz
Vereinigte Staaten von Amerika

							

Home-Office

bevorzugt

Profilaufrufe

Alter

Berufserfahrung

							3 Jahre und 11 Monate
							(seit 06/2022)
							

Projektleitung

1 Jahr

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden