freiberufler Edge AI Engineer | Generative AI & Embedded Systems auf freelance.de

Edge AI Engineer | Generative AI & Embedded Systems

zuletzt online vor wenigen Tagen
  • 100‐120€/Stunde
  • München
  • National
  • de  |  en
  • 18.02.2026

Kurzvorstellung

Spezialist für Embedded & Edge AI mit 6 Jahren Embedded-Erfahrung (C, Robotik) und tiefem Know-how in Generative AI (LLM-Optimierung, Agents). Ich sorge dafür, dass moderne KI-Modelle auch außerhalb der Cloud performant und zuverlässig laufen.

Geschäftsdaten

 Freiberuflich
 Steuernummer bekannt

Qualifikationen

  • Edge AI
  • Embedded Entwicklung / hardwarenahe Entwicklung1 J.
  • Hugging Face
  • Ingenieur Robotik
  • Langchain
  • Large Language Models
  • MCP
  • Programmierer C, C++
  • Python7 J.
  • Typescript

Projekt‐ & Berufserfahrung

Automatisierung Kundenbestellungen
Kundenname anonymisiert, München
12/2025 – 1/2026 (2 Monate)
IT & Entwicklung
Tätigkeitszeitraum

12/2025 – 1/2026

Tätigkeitsbeschreibung

- Aufgabe: Abbildung und Automatisierung eines Bestellprozesses.
- Lösung: Modellierung in BPMN (Camunda) und Automatisierung mithilfe mehrerer Python-Worker (Bestandsprüfung, Rechnung, Auslieferung).
- Tech Stack: Linux, Camunda 7, Python, PostgreSQL, Docker

Eingesetzte Qualifikationen

Postgresql, Docker, Linux Entwicklung, Python

Deployment eines lokalen LLMs (Edge AI)
Kundenname anonymisiert, München
12/2025 – 1/2026 (2 Monate)
IT & Entwicklung
Tätigkeitszeitraum

12/2025 – 1/2026

Tätigkeitsbeschreibung

- Aufgabe: Ersetzen einer Cloud-Lösung durch ein lokales LLM (Privacy & Latenz).
- Lösung: Custom Build von `llama.cpp` mit CPU-spezifischen Optimierungen. Benchmarking von GGUF-Quantisierungen.
- Integration: Anbindung an Open WebUI via API als Drop-In Replacement.
- Tech Stack: Linux, Docker, CMake, Open WebUI, Python, llama.cpp

Eingesetzte Qualifikationen

Docker, Linux Entwicklung, Python

LLM Inferenz-Optimierung & Fine-Tuning
Kundenname anonymisiert, München
12/2025 – 1/2026 (2 Monate)
IT & Entwicklung
Tätigkeitszeitraum

12/2025 – 1/2026

Tätigkeitsbeschreibung

- Ziel: Evaluation und Implementierung von SOTA-Techniken zur Beschleunigung der LLM-Inferenz auf hardwarebeschränkten Systemen.
- Performance: Anwendung von int8-Quantisierung (via `llmcompressor`) auf Qwen-Modelle. Steigerung des Durchsatzes um 50% (>5000 Tokens/s) bei gleichbleibender Genauigkeit (GSM8K).
- Advanced AI: Untersuchung von Speculative Decoding (Training eines EAGLE-Draft-Modells) sowie Durchführung von Fine-Tuning (SFT & LoRA).
- Tech Stack: Python, vLLM, Hugging Face (PEFT, TRL), Kubernetes, Docker, NVIDIA Dynamo

Eingesetzte Qualifikationen

Cloud Computing, Docker, Kubernetes, Python

Universelle Konfigurations-Software für ECUs
Co-Founder / Industrial-Tech Startup (Pre-Seed), München
11/2025 – 1/2026 (3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

11/2025 – 1/2026

Tätigkeitsbeschreibung

- Kontext: Entwicklung einer Desktop-Software im Gründerteam zur intuitiven Parametrierung von Fremd-Steuergeräten (Universal-Tool).
- Lösung: Cross-Platform App (Electron) mit Cloud-Synchronisation. Implementierung der CAN-Kommunikation via PCAN-USB Treiber zur Live-Konfiguration.
- Tech Stack: TypeScript, Electron, Supabase, SQL, C, CAN-Bus, GitHub Actions

Eingesetzte Qualifikationen

C (Programmiersprache), SQL, Continuous Delivery, Typescript, CAN-Bus (controller area network)

HR-Dashboard & Evaluations-Plattform
Internationales SaaS Unternehmen, München
8/2025 – 1/2026 (6 Monate)
IT & Entwicklung
Tätigkeitszeitraum

8/2025 – 1/2026

Tätigkeitsbeschreibung

- Ziel: Entwicklung einer UX-fokussierten WebApp zur Visualisierung von Leistungsdaten für >1000 Mitarbeiter (Feedback-Gespräche).
- Engineering: Professioneller Dev-Workflow: Lokale Entwicklung mit TypeScript und clasp. Deployment als performante Single-Page-Application (SPA) auf Google Apps Script.
- Daten & Security: Aggregation aus Snowflake. Absicherung streng vertraulicher HR-Daten durch Integration von Okta (SSO) und granularem RBAC.
- Tech Stack: Python, TypeScript (clasp), Google Apps Script, Snowflake, Streamlit, Okta

Eingesetzte Qualifikationen

Python, Snowflake, Typescript

KI-Agent zur Automatisierung von HR
Internationales SaaS Unternehmen, München
7/2025 – 9/2025 (3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

7/2025 – 9/2025

Tätigkeitsbeschreibung

- Aufgabe: Automatisierung des Preboardings neuer Mitarbeiter.
- Lösung: Implementierung diverser MCP-Server und eines KI-Agenten (Dialog via Slack, Tasks in ClickUp, Daten in Google Sheets).
- Tech Stack: Linux, Python, MCP, REST APIs, LangChain Utils

Eingesetzte Qualifikationen

API-Entwickler, Langchain, Linux Entwicklung, Python

PDF-Extraktion und Datenstrukturierung
Bauunternehmen, München
6/2025 – 8/2025 (3 Monate)
Bauwirtschaft, Anlagen- und Schiffbau
Tätigkeitszeitraum

6/2025 – 8/2025

Tätigkeitsbeschreibung

- Aufgabe: Ersetzen manueller Prozesse bei der Handhabung von Lieferscheinen durch LLMs.
- Lösung: Pipeline: PDF zu Bild, Auslesen via Visual Language Model, Strukturierung via Function Calling.
- Tech Stack: Linux, Python, OpenAI-API, GPT-4o, Docker, AWS, Open WebUI

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Docker, GPT, Linux Entwicklung, Python, Representational State Transfer (REST)

PoC - Talent-Sourcing Plattform mit KI
Internationales Technologieunternehmen, München
6/2025 – 8/2025 (3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

6/2025 – 8/2025

Tätigkeitsbeschreibung

- Aufgabe: Entwicklung eines KI-gestützten Frameworks zur Identifikation passender Kandidaten.
- Lösung: WebApp zur Generierung von Kandidatenlisten und personalisierten E-Mails basierend auf Projektbeschreibungen.
- Tech Stack: Linux, Next.js, TypeScript, Python, LangGraph, Pinecone, FastAPI, Docker, AWS

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Docker, Langchain, Linux Entwicklung, Python, Representational State Transfer (REST), Typescript

Smart-Attachment-Controller (CAN-Bus)
Co-Founder / Hardware-Startup (Pre-Seed), München
12/2024 – 5/2025 (6 Monate)
IT & Entwicklung
Tätigkeitszeitraum

12/2024 – 5/2025

Tätigkeitsbeschreibung

- Kontext: Technische Leitung in einem 3-köpfigen Gründerteam zur Entwicklung einer universellen Steuereinheit für Bagger-Anbaugeräte.
- Ziel: Schaffung einer kostengünstigen Nachrüst-Lösung, um passive Werkzeuge mittels MiC 4.0 Standard kommunikationsfähig zu machen.
- Umsetzung: Entwicklung eines funktionalen PoC auf Basis von Embedded Linux (Raspberry Pi). Implementierung der Logik und des CAN-Stacks in Python (SocketCAN).
- Tech Stack: Python, Linux (Embedded), SocketCAN, J1939, Autodesk Fusion

Eingesetzte Qualifikationen

Linux Entwicklung, Python, CAN-Bus (controller area network), Autodesk (allg.)

Code-Review Agent (RAG Pipeline) (Festanstellung)
Vemcon GmbH, München
8/2024 – 11/2024 (4 Monate)
IT & Entwicklung
Tätigkeitszeitraum

8/2024 – 11/2024

Tätigkeitsbeschreibung

- Aufgabe: Automatisierte Vorprüfung von Merge Requests zur Entlastung von Entwicklern.
- Lösung: RAG-Pipeline liefert Kontext über Codebase für halluzinationsfreie Reviews. Integration in GitLab CI/CD.
- Tech Stack: Linux, Python, OpenAI API, GitLab CI/CD, Docker

Eingesetzte Qualifikationen

Continuous Integration, Docker, Git, Linux Entwicklung, Python

Sensorfusion & Kinematik-Tracking (Festanstellung)
Vemcon GmbH, München
6/2021 – 11/2024 (3 Jahre, 6 Monate)
IT & Entwicklung
Tätigkeitszeitraum

6/2021 – 11/2024

Tätigkeitsbeschreibung

- Aufgabe: Bestimmung der Baggerarm-Kinematik während der Bewegung.
- Lösung: Optimierter Algorithmus auf ARM-Mikroprozessor (nutzt dlib). Sensorfehler von 50% auf <1% reduziert.
- Tech Stack: C, C++, dlib, CAN-Bus, Linux, Python

Eingesetzte Qualifikationen

C (Programmiersprache), Python-Programmierer, C++, Linux Entwicklung, CAN-Bus (controller area network)

Dynamische Nutzlastschätzung (Festanstellung)
Vemcon GmbH, München
6/2020 – 11/2024 (4 Jahre, 6 Monate)
IT & Entwicklung
Tätigkeitszeitraum

6/2020 – 11/2024

Tätigkeitsbeschreibung

- Aufgabe: Bestimmung der Nutzlast im Baggerlöffel _während_ der dynamischen Bewegung.
- Erfolg: Reduktion des Fehlers in der Massenbestimmung von 300% auf 1% trotz limitierter Rechenkapazität (100 Hz Takt).
- Tech Stack: C, C++, ARM, Python

Eingesetzte Qualifikationen

C (Programmiersprache), ARM-Architektur, C++, Python, CAN-Bus (controller area network)

Steuerungssoftware für Kalibrierstand (Festanstellung)
Vemcon GmbH, München
4/2019 – 6/2020 (1 Jahr, 3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

4/2019 – 6/2020

Tätigkeitsbeschreibung

- Aufgabe: Entwicklung eines robusten Produktionssystems inkl. Hardware-Ansteuerung.
- Lösung: Strikte Trennung von Hardware-Treibern (CAN) und Fachlogik (DDD). High-Speed Datalogging.
- Tech Stack: Windows/Linux, Python, Git, CAN-Bus, Qt, DDD

Eingesetzte Qualifikationen

CAN-Bus (controller area network), Git, Linux Entwicklung, Python, Qt (Software)

Intuitive Kransteuerung (Inverse Kinematik) (Festanstellung)
Vemcon GmbH & Technische Universität München, München
4/2018 – 4/2019 (1 Jahr, 1 Monat)
IT & Entwicklung
Tätigkeitszeitraum

4/2018 – 4/2019

Tätigkeitsbeschreibung

- Aufgabe: Mathematische Herleitung und Implementierung der Inversen Kinematik (überbestimmtes System).
- Ergebnis: Portierung auf Embedded C, Feldversuch und Veröffentlichung im Paper.
- Tech Stack: C, Linux, Python, MATLAB, ARM

Eingesetzte Qualifikationen

C (Programmiersprache), Embedded Entwicklung / hardwarenahe Entwicklung, ARM-Architektur, Linux Entwicklung, Python

Ausbildung

M.Sc. Robotics, Cognition, Intelligence
Master of Science
Technische Universität München
2018
München

Über mich

Schwerpunkte: Generative AI (LLMs, Agents), Edge AI / On-Device Inference, Embedded Software Engineering, Robotics & Sensor Fusion.

Generative AI & LLM Engineering:
- Inference Optimization: vLLM, llama.cpp, TensorRT-LLM, Quantisierung (GGUF, AWQ, GPTQ, int8), Speculative Decoding (EAGLE), Model Pruning.
- Frameworks & Tools: PyTorch, Hugging Face (Transformers, PEFT, TRL), LangChain, LangGraph, LlamaIndex.
- Agentic AI: Entwicklung autonomer Agenten, Function Calling, MCP, Multi-Agent Systems.
- RAG: Aufbau von Retrieval-Augmented Generation Pipelines, Vektordatenbanken (Pinecone, ChromaDB), Embeddings.

Embedded Systems & C/C++:
- Core: C/C++, Embedded Linux (Yocto/Buildroot), RTOS.
- Robotics: Inverse Kinematik, Sensorfusion (IMU), Regelungstechnik, ROS/ROS2, dlib.
- Kommunikation: CAN-Bus (J1939, CANopen), SPI, I2C, MQTT, TCP/IP.

Software Architecture & DevOps:
- Sprachen: Python & C (Expert), C++, TypeScript/JavaScript.
- Infrastructure: Docker, Kubernetes (K8s), AWS (EC2, S3, Lambda), NVIDIA GPU Container.
- CI/CD: GitLab CI, GitHub Actions, CMake, Make.
- Web/Backend: FastAPI, Flask, Next.js, Supabase, PostgreSQL, GraphQL.

Methoden & Soft Skills:
- Anforderungsanalyse, Mentoring.
- Sprachen: Deutsch (Muttersprache), Englisch (Verhandlungssicher).

Weitere Kenntnisse

AI / ML: vLLM, llama.cpp, Hugging Face (PEFT, TRL), RAG, LangChain, MCP, Vektordatenbanken

DevOps/IT: Kubernetes, Docker, Linux, Git, CMake, CI/CD, AWS, NVIDIA Dynamo

Programmiersprachen: C, C++, TypeScript, Python, Bash, SQL

Elektronik: Embedded-Programmierung, KiCad, Arduino/ESP32, dlib, CAN-Bus

Mechanik: Autodesk Fusion, Onshape, 3D-Druck

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
Reisebereitschaft
National
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
259
Alter
35
Berufserfahrung
7 Jahre und 5 Monate (seit 10/2018)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden