Edge AI Engineer | Generative AI & Embedded Systems
- Verfügbarkeit einsehen
- 0 Referenzen
- 100‐120€/Stunde
- München
- National
- de | en
- 18.02.2026
Kurzvorstellung
Geschäftsdaten
Qualifikationen
Projekt‐ & Berufserfahrung
12/2025 – 1/2026
Tätigkeitsbeschreibung
- Aufgabe: Abbildung und Automatisierung eines Bestellprozesses.
- Lösung: Modellierung in BPMN (Camunda) und Automatisierung mithilfe mehrerer Python-Worker (Bestandsprüfung, Rechnung, Auslieferung).
- Tech Stack: Linux, Camunda 7, Python, PostgreSQL, Docker
Postgresql, Docker, Linux Entwicklung, Python
12/2025 – 1/2026
Tätigkeitsbeschreibung
- Aufgabe: Ersetzen einer Cloud-Lösung durch ein lokales LLM (Privacy & Latenz).
- Lösung: Custom Build von `llama.cpp` mit CPU-spezifischen Optimierungen. Benchmarking von GGUF-Quantisierungen.
- Integration: Anbindung an Open WebUI via API als Drop-In Replacement.
- Tech Stack: Linux, Docker, CMake, Open WebUI, Python, llama.cpp
Docker, Linux Entwicklung, Python
12/2025 – 1/2026
Tätigkeitsbeschreibung
- Ziel: Evaluation und Implementierung von SOTA-Techniken zur Beschleunigung der LLM-Inferenz auf hardwarebeschränkten Systemen.
- Performance: Anwendung von int8-Quantisierung (via `llmcompressor`) auf Qwen-Modelle. Steigerung des Durchsatzes um 50% (>5000 Tokens/s) bei gleichbleibender Genauigkeit (GSM8K).
- Advanced AI: Untersuchung von Speculative Decoding (Training eines EAGLE-Draft-Modells) sowie Durchführung von Fine-Tuning (SFT & LoRA).
- Tech Stack: Python, vLLM, Hugging Face (PEFT, TRL), Kubernetes, Docker, NVIDIA Dynamo
Cloud Computing, Docker, Kubernetes, Python
11/2025 – 1/2026
Tätigkeitsbeschreibung
- Kontext: Entwicklung einer Desktop-Software im Gründerteam zur intuitiven Parametrierung von Fremd-Steuergeräten (Universal-Tool).
- Lösung: Cross-Platform App (Electron) mit Cloud-Synchronisation. Implementierung der CAN-Kommunikation via PCAN-USB Treiber zur Live-Konfiguration.
- Tech Stack: TypeScript, Electron, Supabase, SQL, C, CAN-Bus, GitHub Actions
C (Programmiersprache), SQL, Continuous Delivery, Typescript, CAN-Bus (controller area network)
8/2025 – 1/2026
Tätigkeitsbeschreibung
- Ziel: Entwicklung einer UX-fokussierten WebApp zur Visualisierung von Leistungsdaten für >1000 Mitarbeiter (Feedback-Gespräche).
- Engineering: Professioneller Dev-Workflow: Lokale Entwicklung mit TypeScript und clasp. Deployment als performante Single-Page-Application (SPA) auf Google Apps Script.
- Daten & Security: Aggregation aus Snowflake. Absicherung streng vertraulicher HR-Daten durch Integration von Okta (SSO) und granularem RBAC.
- Tech Stack: Python, TypeScript (clasp), Google Apps Script, Snowflake, Streamlit, Okta
Python, Snowflake, Typescript
7/2025 – 9/2025
Tätigkeitsbeschreibung
- Aufgabe: Automatisierung des Preboardings neuer Mitarbeiter.
- Lösung: Implementierung diverser MCP-Server und eines KI-Agenten (Dialog via Slack, Tasks in ClickUp, Daten in Google Sheets).
- Tech Stack: Linux, Python, MCP, REST APIs, LangChain Utils
API-Entwickler, Langchain, Linux Entwicklung, Python
6/2025 – 8/2025
Tätigkeitsbeschreibung
- Aufgabe: Ersetzen manueller Prozesse bei der Handhabung von Lieferscheinen durch LLMs.
- Lösung: Pipeline: PDF zu Bild, Auslesen via Visual Language Model, Strukturierung via Function Calling.
- Tech Stack: Linux, Python, OpenAI-API, GPT-4o, Docker, AWS, Open WebUI
Amazon Web Services (AWS), Docker, GPT, Linux Entwicklung, Python, Representational State Transfer (REST)
6/2025 – 8/2025
Tätigkeitsbeschreibung
- Aufgabe: Entwicklung eines KI-gestützten Frameworks zur Identifikation passender Kandidaten.
- Lösung: WebApp zur Generierung von Kandidatenlisten und personalisierten E-Mails basierend auf Projektbeschreibungen.
- Tech Stack: Linux, Next.js, TypeScript, Python, LangGraph, Pinecone, FastAPI, Docker, AWS
Amazon Web Services (AWS), Docker, Langchain, Linux Entwicklung, Python, Representational State Transfer (REST), Typescript
12/2024 – 5/2025
Tätigkeitsbeschreibung
- Kontext: Technische Leitung in einem 3-köpfigen Gründerteam zur Entwicklung einer universellen Steuereinheit für Bagger-Anbaugeräte.
- Ziel: Schaffung einer kostengünstigen Nachrüst-Lösung, um passive Werkzeuge mittels MiC 4.0 Standard kommunikationsfähig zu machen.
- Umsetzung: Entwicklung eines funktionalen PoC auf Basis von Embedded Linux (Raspberry Pi). Implementierung der Logik und des CAN-Stacks in Python (SocketCAN).
- Tech Stack: Python, Linux (Embedded), SocketCAN, J1939, Autodesk Fusion
Linux Entwicklung, Python, CAN-Bus (controller area network), Autodesk (allg.)
8/2024 – 11/2024
Tätigkeitsbeschreibung
- Aufgabe: Automatisierte Vorprüfung von Merge Requests zur Entlastung von Entwicklern.
- Lösung: RAG-Pipeline liefert Kontext über Codebase für halluzinationsfreie Reviews. Integration in GitLab CI/CD.
- Tech Stack: Linux, Python, OpenAI API, GitLab CI/CD, Docker
Continuous Integration, Docker, Git, Linux Entwicklung, Python
6/2021 – 11/2024
Tätigkeitsbeschreibung
- Aufgabe: Bestimmung der Baggerarm-Kinematik während der Bewegung.
- Lösung: Optimierter Algorithmus auf ARM-Mikroprozessor (nutzt dlib). Sensorfehler von 50% auf <1% reduziert.
- Tech Stack: C, C++, dlib, CAN-Bus, Linux, Python
C (Programmiersprache), Python-Programmierer, C++, Linux Entwicklung, CAN-Bus (controller area network)
6/2020 – 11/2024
Tätigkeitsbeschreibung
- Aufgabe: Bestimmung der Nutzlast im Baggerlöffel _während_ der dynamischen Bewegung.
- Erfolg: Reduktion des Fehlers in der Massenbestimmung von 300% auf 1% trotz limitierter Rechenkapazität (100 Hz Takt).
- Tech Stack: C, C++, ARM, Python
C (Programmiersprache), ARM-Architektur, C++, Python, CAN-Bus (controller area network)
4/2019 – 6/2020
Tätigkeitsbeschreibung
- Aufgabe: Entwicklung eines robusten Produktionssystems inkl. Hardware-Ansteuerung.
- Lösung: Strikte Trennung von Hardware-Treibern (CAN) und Fachlogik (DDD). High-Speed Datalogging.
- Tech Stack: Windows/Linux, Python, Git, CAN-Bus, Qt, DDD
CAN-Bus (controller area network), Git, Linux Entwicklung, Python, Qt (Software)
4/2018 – 4/2019
Tätigkeitsbeschreibung
- Aufgabe: Mathematische Herleitung und Implementierung der Inversen Kinematik (überbestimmtes System).
- Ergebnis: Portierung auf Embedded C, Feldversuch und Veröffentlichung im Paper.
- Tech Stack: C, Linux, Python, MATLAB, ARM
C (Programmiersprache), Embedded Entwicklung / hardwarenahe Entwicklung, ARM-Architektur, Linux Entwicklung, Python
Ausbildung
Technische Universität München
München
Über mich
Generative AI & LLM Engineering:
- Inference Optimization: vLLM, llama.cpp, TensorRT-LLM, Quantisierung (GGUF, AWQ, GPTQ, int8), Speculative Decoding (EAGLE), Model Pruning.
- Frameworks & Tools: PyTorch, Hugging Face (Transformers, PEFT, TRL), LangChain, LangGraph, LlamaIndex.
- Agentic AI: Entwicklung autonomer Agenten, Function Calling, MCP, Multi-Agent Systems.
- RAG: Aufbau von Retrieval-Augmented Generation Pipelines, Vektordatenbanken (Pinecone, ChromaDB), Embeddings.
Embedded Systems & C/C++:
- Core: C/C++, Embedded Linux (Yocto/Buildroot), RTOS.
- Robotics: Inverse Kinematik, Sensorfusion (IMU), Regelungstechnik, ROS/ROS2, dlib.
- Kommunikation: CAN-Bus (J1939, CANopen), SPI, I2C, MQTT, TCP/IP.
Software Architecture & DevOps:
- Sprachen: Python & C (Expert), C++, TypeScript/JavaScript.
- Infrastructure: Docker, Kubernetes (K8s), AWS (EC2, S3, Lambda), NVIDIA GPU Container.
- CI/CD: GitLab CI, GitHub Actions, CMake, Make.
- Web/Backend: FastAPI, Flask, Next.js, Supabase, PostgreSQL, GraphQL.
Methoden & Soft Skills:
- Anforderungsanalyse, Mentoring.
- Sprachen: Deutsch (Muttersprache), Englisch (Verhandlungssicher).
Weitere Kenntnisse
DevOps/IT: Kubernetes, Docker, Linux, Git, CMake, CI/CD, AWS, NVIDIA Dynamo
Programmiersprachen: C, C++, TypeScript, Python, Bash, SQL
Elektronik: Embedded-Programmierung, KiCad, Arduino/ESP32, dlib, CAN-Bus
Mechanik: Autodesk Fusion, Onshape, 3D-Druck
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden
