Data Scientist | Aktuar
- Verfügbarkeit einsehen
- 0 Referenzen
- 70‐75€/Stunde
- 70372 Stuttgart
- National
- fr | de | en
- 22.05.2026
- Contract ready
Kurzvorstellung
Geschäftsdaten
Qualifikationen
Projekt‐ & Berufserfahrung
9/2024 – 7/2025
Tätigkeitsbeschreibung
Entwicklung und Produktivsetzung eines NLP-Klassifizierungsmodells zur automatischen Kategorisierung eingehender Kundenanfragen
(E-Mails, Briefe) in 8 Klassen mit SLA-basiertem Routing.
• Datenbasis: 452.318 qualitätsgeprüfte Texte aus dem Allianz CRM-Archiv (2021–2024); 48.500 manuell annotiert (2 Annotatoren,
Cohen's Kappa = 0,91)
• BERT Fine-Tuning (deepset/gbert-base, 110M Parameter): Accuracy 98,2 %, F1 = 0,981 — übertrifft TF-IDF/SVM Baseline (95,4 %)
signifikant
• Semi-Supervised Pseudo-Labeling auf 403.818 unlabeled Texten (Konfidenz ≥ 0,95)
• DSGVO-konforme Anonymisierung via spaCy NER (Namen, Vertragsnummern, IBAN)
• LangChain + GPT-4o Zero-Shot als Fallback für neue/unbekannte Kategorien
• Automatisierungsrate 78 % — Zeitersparnis ~2.500 Stunden/Monat
• Python, HuggingFace Transformers, spaCy, LangChain, Plotly/Dash
Machine Learning
3/2024 – 12/2024
Tätigkeitsbeschreibung
Aufgaben:
Survival-analytische Untersuchung des Stornoverhaltens im RLV-Bestand (500.778 Verträge) zur Identifikation und
Quantifizierung von Anti-Selektionseffekten.
• Kaplan-Meier Überlebensanalyse nach Raucherstatus, Gesundheit und Altersgruppe — Log-rank Tests (p < 0,001) zur
Signifikanzprüfung von Gruppenunterschieden
• Cox Proportional Hazards Modell: Identifikation der Storno-Treiber (Nichtraucher HR=1,84; Gesundheit "Gut" HR=1,62—
Anti-Selektion statistisch nachgewiesen
• Anti-Selektions-Index (ASI = 1,24): Portfolio nach 5 Jahren um 24 % risikoreicher als zu Beginn
• Entwicklung eines Storno-Score-Modells zur proaktiven Früherkennung kündigungsgefährdeter Niedrigrisiko-VN
• Python (Pandas, Lifelines, Scikit-learn), interaktives Dashboard (Plotly/Dash)
Data Science
3/2023 – 11/2023
Tätigkeitsbeschreibung
End-to-End ML-Projekt zur datengetriebenen Überprüfung und Optimierung des BU-Tarifs auf Basis von 387.241 aktiven Verträgen
(2020–2023).
• Datenaufbereitung & Feature Engineering: Exploration und Transformation des BU-Portfolios, Behandlung fehlender Werte (< 0,8 %),
Identifikation relevanter Risikotreiber — Python (Pandas, NumPy), SQL
• Modellentwicklung: Systematischer Vergleich GLM (Tweedie/Binomial) vs. XGBoost/Gradient Boosting — Hyperparameter-Tuning,
Regularisierung (Ridge, Lasso)
• Modellvalidierung: AUC 0,725 (GLM), Brier Score 0,063, 5-fold Cross-Validation (CV-AUC 0,720), SHAP-Values zur
Interpretierbarkeit gegenüber Fachabteilungen
• Pricing-Gap-Analyse: Identifikation von 2 stark unterkalibrierten Segmenten (Schwere Körperarbeit +321 %, Handwerk +165 %) —
konkrete Tarifanpassungsempfehlungen für das Management
• Interaktives Management-Dashboard (Python, Plotly/Dash) zur Portfolioüberwachung
• Präsentation der Ergebnisse vor Pricing- und Produktmanagement
Aktuar, Data Scientist
Ausbildung
Deutsche Aktuarvereinigung
Hochschule Koblenz
Koblenz
Hochschule Koblenz
Koblenz
Über mich
Meine Kern-Expertise liegt in der End-to-End-Entwicklung von ML-Modellen — von der explorativen Portfolioanalyse über Feature Engineering bis zur Modellvalidierung (AUC, Brier Score, K-Fold Cross-Validation) und dem Deployment in interaktiven Dashboards.
Ich vergleiche klassische Ansätze (GLM/Logit) systematisch mit modernen Boosting-Methoden (XGBoost, Gradient Boosting) und übersetze die Ergebnisse direkt in praxisrelevante Pricing-Entscheidungen.
Projekterfahrung umfasst u. a.:
- BU-Pricing-Optimierung — vollständige ML-Pipeline (GLM vs. GBM), Pricing-Gap-Analyse, Tarifanpassungsempfehlungen
- Datengetriebene Pricing-Methoden — OKAPY & Data Cure (Allianz-interne Methodik)
- Sensitivitätsanalysen für biometrische Risikomodelle
- RLV-Storno- & Lapse-Analyse — Survival Analysis (Kaplan-Meier, Cox Proportional Hazards), Nachweis von Anti-Selektion im
RLV-Bestand, Quantifizierung der Portfolioverschlechterung über 5 Jahre (500k+ Verträge)
- NLP-Klassifizierung von Kundenanfragen — BERT Fine-Tuning (deepset/gbert-base), LangChain + GPT-4o (Zero-Shot), semi-supervised
Pseudo-Labeling auf 450k+ Dokumenten; 78 % Automatisierungsrate, ~2.500 Std. Zeitersparnis/Monat
- Interaktive Dashboards zur Visualisierung von Modelloutputs (Python, Plotly / Streamlit)
Der aktuarielle Hintergrund schafft eine seltene Kombination: versicherungsmathematische Tiefe, klassisches ML-Pricing und moderne LLM-Kompetenz in einer Person — ein klarer Mehrwert für Pricing-Teams, Risk-Analytics- und AI-Projekte.
Sprachen: Deutsch (verhandlungssicher) · Französisch (Muttersprache) · Englisch (fließend)
Weitere Kenntnisse
Machine Learning & Modellierung
- Supervised Learning: GLM, Logistic Regression, Decision Trees
- Ensemble Methods: Gradient Boosting, XGBoost, LightGBM, Random Forest
- Modellvalidierung: AUC-ROC, Brier Score, K-Fold CV, Lift Curves
- Feature Engineering & Selektion
- Pricing-Gap-Analyse & Tarifkalibrierung
Survival Analysis & Storno-Modellierung
- Kaplan-Meier Überlebensschätzung, Log-Rank-Test
- Cox Proportional Hazards (Hazard Ratios, Signifikanztests)
- Anti-Selektions-Analyse & Portfolio-Verschlechterungsquantifizierung
- lifelines (Python)
NLP & LLM-Integration
- BERT Fine-Tuning (deepset/gbert-base, HuggingFace Transformers)
- LangChain + GPT-4o (Zero-Shot, Few-Shot, Prompt Engineering)
- Anthropic Claude API, OpenAI API, Azure OpenAI
- RAG-Architektur (Retrieval Augmented Generation, Vector-DBs)
- Semi-Supervised Learning (Pseudo-Labeling, 450k+ Dokumente)
- Halluzinationskontrolle, Konfidenz-Scoring, Audit-Trail
Python-Stack
- Pandas, NumPy (Datenaufbereitung)
- Scikit-learn (Modellierung & Validierung)
- Matplotlib, Seaborn, Plotly (Visualisierung)
- Streamlit / Dash (Dashboards)
- LangChain, HuggingFace Transformers, lifelines
Domänenwissen
- Versicherungs-Pricing (Leben, BU, Risikoleben)
- Biometrische Risikomodelle
- Portfolio-Analyse & Risikosegmentierung
- Storno- & Lapse-Analyse (RLV-Bestand)
- BaFin-reguliertes Umfeld, DSGVO-konforme Pipelines
Sonstiges
- R (fortgeschritten), SQL, Git, Excel/VBA
- Microsoft Azure (AI Services, Functions, Storage)
Persönliche Daten
- Französisch (Muttersprache)
- Deutsch (Fließend)
- Englisch (Gut)
- Europäische Union
- Schweiz
- Vereinigte Staaten von Amerika
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden
