freiberufler Unternehmensberatung auf freelance.de

Unternehmensberatung

zuletzt online vor wenigen Stunden
  • auf Anfrage
  • 20257 Eimsbüttel
  • Europa
  • de  |  fr  |  en
  • 06.01.2024

Kurzvorstellung

Mehrjährige Erfahrung in Machine Learning und Deep Learning mit Schwerpunkt Document Understanding/Document AI sowie Large Language Models (GPT-3.5, GPT-4, Llama, etc.)

Entwicklung von Prototypen und produktiven KI-Komponenten.

Qualifikationen

  • Data Science
  • Datawarehouse / DWH
  • Maschinelles Lernen
  • Python
  • PyTorch
  • Rechnungswesen (allg.)
  • Risikomanagement (Finan.)
  • TensorFlow
  • Vertriebscontrolling

Projekt‐ & Berufserfahrung

Beratung/ Entwicklung
Kundenname anonymisiert, Hamburg
1/2023 – 10/2023 (10 Monate)
Versicherungen
Tätigkeitszeitraum

1/2023 – 10/2023

Tätigkeitsbeschreibung

Einführung der Document AI Plattform

 Automatisierte Verarbeitung der Anhänge des E-Mail-Posteingangs
 Klassifikation der Anhänge (Arztbrief, Rezept, etc.)
 Anleiten bei der Erstellung Annotationen
 Training von image transformer encoder (Donut type model)

Eingesetzte Qualifikationen

PyTorch

Berater, Entwickler
Kundenname anonymisiert, Hamburg
8/2022 – 12/2022 (5 Monate)
Gesundheitswesen
Tätigkeitszeitraum

8/2022 – 12/2022

Tätigkeitsbeschreibung

Erstellung einer Datenbank von literarischen Quellverzeichnissen

 Extraktion von Literaturverzeichnissen aus wissenschaftlichen Publikationen
 Verwendung von Vision (Detectron2), OCR (AWS Textract) und NLP-Modellen (SpaCy)

Eingesetzte Qualifikationen

Python

Entwickler
Kundenname anonymisiert, Hamburg
1/2020 – offen (4 Jahre, 3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

1/2020 – offen

Tätigkeitsbeschreibung

Entwicklung des Open Source Python Packages deepdoctection
zum Parsen und Extrahieren von Informationen aus komplex strukturierten Dokumenten (1500+ Stars)

-Hyperlink entfernt-

 Deep-Learning basiertes adaptierbares Parsen von komplex strukturierten Dokumenten
 Layout-Erkennung, Tabellenerkennung und Segmentierung, OCR und strukturierte Ausgabe für Downstream Tasks (zum Beispiel Feed zu OpenAI)
 Adaption der integrierten Modelle auf eigene Dokumentstrukturen zur Erhöhung der Extraktionsqualität
 Orchestrierung der Pipeline (Speichern der gelieferten Daten, Logging)
 Einbindung von Python Drittpackages in Pipelines durch einfache Schnittstellen-API

Eingesetzte Qualifikationen

PyTorch, TensorFlow, Python

Berater
Kundenname anonymisiert, Frankfurt
9/2008 – 12/2018 (10 Jahre, 4 Monate)
Banken
Tätigkeitszeitraum

9/2008 – 12/2018

Tätigkeitsbeschreibung

Diverse Projekte bei Finanzinstituten und Kapitalverwaltungsgesellschaften

 Diverse Themen bei der fachlichen Konzeption zur Einführung eines Finance-und Risk Datawarehouse bei einer deutschen Universalbank
- Automatisierte Abstimmung des Buchungsstoff zwischen Kernbank- und Accounting System
- Verwendung von NLP spezifischen Frameworks: SpaCy und Regex
- Anbindung diverse Quellsysteme. Konzeption von Schnittstellen für Zielsysteme (z.B. Meldewesen Abacus DaVinci/A360)
- Konzeption von Business-Logik, die in die ETL-Strecken abgebildet werden mussten.
 Fach- und Feinkonzeption sowie Implementierung einer Access-Datenbank (inkl. VBA und Interfacegestaltung) zur Erzeugung von Buchungen im Hauptbuch, die Hedge-Accounting Effekte betreffen
 Konzeption und Implementierung von Stress-Test Szenarien bei einer KVG. Berücksichtigung von Marktpreis-Zins- und Op-Risiken. Abstimmung der Abbildung mit der Geschäftsführung und dem internen Audit.

Eingesetzte Qualifikationen

Python, MS Excel

Ausbildung

Mathematik
Promotion
2005
TU Berlin

Über mich

Mehrjährige Erfahrung in Machine Learning und Deep Learning mit Schwerpunkt Document Understanding/Document AI: Identifizierung Use-Case, Data-Annotation, Training, Evaluation und Integration im Produktionsprozess. Beratung und Unterstützung bei Auswahl eines Plattformanbieters

Entwicklung und Wartung der Open Source Library deepdoctection (>1700 Stars auf Github): Zusammenstellung von Pipelines (OCR, Computer Vision, Foundation Modelle) zur Prozessierung von unstrukturierten Dokumenten: Dokumenten Layout Analysis, Textklassifikation und Entitätenerkennung. Sprecher bei der PyData 2022 in Berlin.

Erfahrung bei der Konzeption und Prototyping von Use-Cases mit Large Language Models (Langchain, LLamaIndex, Hugging Face). Data-Preparation für Fine-Tuning von LLMs auf Domain-spezifischen Gebiet.

Weitere Kenntnisse

Python, Data Science, SQL, Microsoft Office (Access, Excel, VBA), C, C++

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Französisch (Fließend)
  • Englisch (Fließend)
Reisebereitschaft
Europa
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
2003
Alter
47
Berufserfahrung
15 Jahre und 6 Monate (seit 09/2008)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden