Data Scientist / Machine Learning Engineer

zuletzt online vor 4 Tagen

Verfügbarkeit einsehen
0 Referenzen

100€/Stunde
50674 Köln
auf Anfrage
de | en
14.05.2024

Kurzvorstellung

			Ich bin ein kommunikativer Cloud-native Data Scientist und Machine Learning Engineer. Meine Stärken liegen in meiner umfassenden Expertise in modernen KI-Technologien, sowie in der verständlichen Präsentation komplexer technischer Zusammenhänge
		

Qualifikationen

		Apache Spark
Azure Databricks
Big Data
Data Science
Kubernetes
LLM
Natural Language Processing (NLP)
Python
PyTorch
SQL

		

Projekt‐ & Berufserfahrung

Machine Learning Engineer 
									Kundenname anonymisiert, Osnabrück								

2/2023 – 6/2024 (1 Jahr, 5 Monate)

Details anzeigen

Tätigkeitszeitraum

2/2023 – 6/2024

Tätigkeitsbeschreibung

Deployment von PySpark KI-Anwendungen in Kubernetes und Hadoop

- Deployment, Skalierung und Überwachung von KI-Anwendungen im Kubernetes Cluster (Stackable), sowie im Hadoop Cluster (Cloudera)
- Einbindung von Monitoring Tools (mlflow) zur kontinuierlichen Modellüberwachung (MLOps)
- Skalierung und Logging der Hyperparametersuche von ML-Pipelines mit PySpark und MLFlow - Beschleunigung der bisherigen Suche um 500%.
- Performance- und Ressourcen Optimierung von verschiedenen Machine Learning Apps durch anpassen von Spark Konfigurationen und Datenpartitionierung
- Einführung von modernen GitOps Praktiken für CI/CD im Migrationsprozess

Eingesetzte Qualifikationen

Apache Hadoop, Apache Spark, Docker, Kubernetes, Python

Data Scientist 
									Kundenname anonymisiert, Osnabrück								

9/2022 – 7/2024 (1 Jahr, 11 Monate)

Details anzeigen

Tätigkeitszeitraum

9/2022 – 7/2024

Tätigkeitsbeschreibung

Development of LLM Based AI-Applications in PySpark

- Fine-tuning of foundational LLM (Llama2, Mistral) for generation of text summaries in German. Development utilizing Parameter Efficient Fine Tuning (PEFT) and Low Rank Adaption (LoRA) with Huggingface.
- Segmentation of multi-dimensional customer data by utilizing efficient LLM feature representations - Enhancement of existing clustering approaches by 2x.
- Detection of data anomalies and duplicates through distributed end-to-end Machine Learning pipelines in PySpark, substantially enhancing data quality.
- Time- and cost optimization of GPU resources through dynamic job scheduling on Nvidia A100 and A30 GPUs.

Eingesetzte Qualifikationen

Apache Hadoop, Apache Spark, Generative KI, LLM, Python

Data Analyst (Festanstellung)
									Kundenname anonymisiert, Utrecht								

1/2021 – 9/2021 (9 Monate)

Details anzeigen

Tätigkeitszeitraum

1/2021 – 9/2021

Tätigkeitsbeschreibung

Development of ML-Applications for Data Quality Enhancement

- Development of tree based ML classifiers for detection of anomalies in charge point data.
- Creation of business insights regarding data quality utilizing SQL based database queries.

Eingesetzte Qualifikationen

Python, R (Programmiersprache), Scikit-learn, SQL

Zertifikate

							Certified Kubernetes Application Developer

								The Linux Foundation

2023

							Databricks Certified Associate Developer for Apache Spark

								Databricks

2023

Ausbildung

M. Sc. Artificial Intelligence

Master of Science
Utrecht University

2022
Utrecht

B. Sc. Psychologie in IT

Bachelor of Science
Technische Universität Darmstadt

2019
Darmstadt

Persönliche Daten

Sprache

							Deutsch (Muttersprache)
Englisch (Muttersprache)

Reisebereitschaft

auf Anfrage

Arbeitserlaubnis

Europäische Union

Home-Office

bevorzugt

Profilaufrufe

Alter

Berufserfahrung

							3 Jahre und 4 Monate
							(seit 01/2021)
							

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden