Data Scientist – Databricks MLOps & GenAI Standards (m/w/d) 100% remote ID02527B
Start: sofort
Ende: 31.12.2026
Einsatzort: Frankfurt am Main & Remote (100 % remote)
´Projektsprache: Deutsch
Projektbeschreibung
Im Rahmen der Migration und Modernisierung einer datengetriebenen Plattform wird eine skalierbare Azure-Databricks-Umgebung aufgebaut und eine einheitliche Arbeitsweise für Data Science, KI, Generative KI und MLOps etabliert. Ziel ist eine standardisierte, sichere und governance-konforme Umsetzung von ML- und GenAI-Workloads auf einer Lakehouse-Architektur, inklusive Enablement relevanter Stakeholder. Das Projekt umfasst sowohl konzeptionelle Leitplanken als auch operative Unterstützung bei Migration und Weiterentwicklung bestehender Analyse-Workloads.
Aufgaben
Definition einer standardisierten Data-Science- und MLOps-Arbeitsweise auf Azure Databricks inklusive Rollen- und Lifecycle-Modellen
Erarbeitung von Leitplanken und Templates für Notebooks, Jobs, MLflow, Feature Store, Model Serving, Vector Search und Unity Catalog
Konzeption von MLOps-Standards für Training, Versionierung, Deployment, Monitoring und Stilllegung inkl. CI/CD- und Governance-Aspekten
Unterstützung von GenAI- und RAG-Ansätzen sowie Architekturmustern für Agentic-AI-Szenarien
Integration von Datenquellen für Trainings-, Inferenz- und Evaluationsszenarien sowie Nutzung der Medallion-Architektur
Konzeption von Governance-, Security-, Logging- und Kostenkontrollmechanismen für AI/ML-Workloads
Dokumentation, Workshops und Wissenstransfer
Technologien
Azure Databricks, Data Lakehouse, Spark, MLflow, Feature Store, Model Serving, Vector Search, Unity Catalog, Azure Active Directory, Microsoft Azure, ADLS Gen2, AWS, AWS S3, Microsoft Fabric, dbt, Denodo, Kafka, MQTT, IoT, SQL, Scala, SSIS, ETL/ELT, CI/CD, Terraform, Databricks Asset Bundles, AWS CDK, Data Governance, Compliance, Datenschutz, Informationssicherheit, Monitoring, Logging, Kostenkontrolle, Machine Learning, Generative AI, RAG, Agentic AI, Confluence, SharePoint, Jira, GitLab, Artifactory
Muss-Kriterien
Professional-Level Databricks-Zertifizierungen, insbesondere Databricks Certified Data Engineer Professional und Databricks Certified Machine Learning Engineer Professional, sowie aktiver Databricks-Einsatz in mindestens zwei Projekten
Mehr als 3 Jahre Erfahrung im Aufbau, Betrieb oder der Weiterentwicklung von Datenplattformen bzw. Data Lakes in Cloud-Umgebungen, mit mindestens zwei Projekten von jeweils mindestens 12 Monaten Laufzeit
Umfangreiche Kenntnisse von Cloud-Managed-Services, insbesondere Microsoft Azure, belegt durch einschlägige Projekterfahrung sowie Zertifizierung auf Architect- oder Administrator-Level
Soll-Kriterien
Erfahrung mit Infrastructure as Code, insbesondere Terraform und Databricks Asset Bundles, AWS CDK von Vorteil
Praktische Erfahrung im Aufbau von MLOps mit MLflow in mindestens einem Projekt mit mindestens 6 Monaten Laufzeit
Deutschkenntnisse mindestens B2, idealerweise C1/C2
Das Team von der mund consulting freut sich auf Ihre Bewerbung – bitte mit aktuellem CV, Stundensatz und Verfügbarkeit.
Herzliche Grüße
Thomas Mund
post@mund-consulting.de