freiberufler Data Scientist | Data Engineer auf freelance.de

Data Scientist | Data Engineer

zuletzt online vor wenigen Tagen
  • 70€/Stunde
  • 50937 Köln
  • Weltweit
  • de  |  en
  • 04.04.2025

Kurzvorstellung

Ehemaliger Data Scientist bei Lidl International und AXA mit tiefgehender Erfahrung in der Entwicklung von datengetriebenen Lösungen. Spezialisiert auf die Automatisierung von Prozessen mit Python, PySpark und Azure Databricks.

Qualifikationen

  • Data Analyst4 J.
  • Data Engineer4 J.
  • Data Science4 J.
  • Databricks
  • Langchain
  • Microsoft Azure
  • Natural Language Processing1 J.
  • Pyspark
  • Python
  • Snowflake

Projekt‐ & Berufserfahrung

Data Scientist (Festanstellung)
Lidl Stiftung & Co. KG, Neckarsulm
7/2020 – 5/2024 (3 Jahre, 11 Monate)
Handel
Tätigkeitszeitraum

7/2020 – 5/2024

Tätigkeitsbeschreibung

● Developed an automated reference product identification application for supply chain operations, eliminating manual search processes through embedding technology and similarity algorithms.
● Transformed manual Excel-based energy reporting into a fully automated cloud solution across all Lidl countries using Databricks and PySpark. Consolidating data from multiple energy and master systems while significantly reducing manual effort and improving data accuracy.
● Created a best practice template for Lidl departments to automatically generate and share reports from Azure Databricks.
● Conducted job interviews for interns and provided mentoring and guidance throughout their tenure.
● Developed an image processing pipeline for product images. Utilized contour extraction and a pretrained Faster R-CNN model to extract relevant objects from varying images. These objects were used to generate more meaningful image embeddings to automatically identifying similar images / products.
● Created a multi-page Power BI dashboard for the controlling department to monitor checkout zone related processes across stores. Visualized KPIs such as scanning time, paying time, and waiting time to identify potential inefficiencies.

Eingesetzte Qualifikationen

Data Science, Python-Programmierer, Data Analyst, Data Engineer

Data Science Intern
AXA Konzern AG, Köln
1/2020 – 4/2020 (4 Monate)
Versicherungen
Tätigkeitszeitraum

1/2020 – 4/2020

Tätigkeitsbeschreibung

● Built a data pipeline for the actuary department. Performed data cleaning, preprocessing, and feature engineering for the risk modelling process. Additionally generated a summary report for the actuaries to recommend which of the 100+ features from the data warehouse are potential candidates to be used as exogenous variables during the modelling process.
● Optimized SQL queries on Snowflake to streamline data retrieval and improve efficiency in processing motor insurance quotation data.

Eingesetzte Qualifikationen

Data Science, Python, Data Analyst, Data Engineer

Data Science Intern
Bechtle AG, Köln
9/2019 – 11/2020 (1 Jahr, 3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

9/2019 – 11/2020

Tätigkeitsbeschreibung

● Built a keyword extractor for a document management system to automatically categorize documents by using the TextRank algorithm and LDA Topic Modelling. Prototyped a Flask API to deploy the keyword extractor as a microservice.

Eingesetzte Qualifikationen

Data Science, Natural Language Processing, Python-Programmierer

Ausbildung

Master of Science in Economics
Master of Science
Universität zu Köln
2021
Köln

Über mich

Ich unterstütze Unternehmen dabei, datengetriebene Entscheidungen zu optimieren und Prozesse effizienter zu gestalten. Mit Erfahrung in Data Science, Analytics und Engineering entwickle ich skalierbare Lösungen – von Machine Learning-Modellen über Data Pipelines bis hin zu Automatisierungen für Reporting und Entscheidungsfindung. Mein Fokus liegt auf der praktischen Umsetzung von datengetriebenen Ansätzen, die echten Mehrwert schaffen.

Weitere Kenntnisse

- Datenvisualisierung & BI: Power BI, Dash, Plotly
- Cloud & DevOps: Azure Databricks, Docker, Linux, GIT, Azure DevOps
- Machine Learning & NLP: OpenAI API, LangChain, Hugging Face, Sentence-Transformers, Scikit-learn, PyTorch, XGBoost, LDA Topic Modelling
- Datenbanken & Pipelines: Snowflake, Postgres, Elasticsearch, SQLAlchemy
- Web & API-Entwicklung: FastAPI, Flask

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
Reisebereitschaft
Weltweit
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
45
Alter
34
Berufserfahrung
5 Jahre und 8 Monate (seit 09/2019)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden