Hintergrund:
Eine der größten Herausforderungen beim Trainieren von neuronalen Netzen ist die Beschaffung von annotierten Daten. Ein alternativer Ansatz ist es Trainingsdaten künstlich zu generieren. Hierbei liegt die Herausforderung darin die Diskrepanz zwischen realen und generierten Daten zu minimieren.
Ziel der Arbeit:
Untersuchung und Optimierung von Datengenerierungsprozessen, um die erforderliche Menge von annotierten Daten drastisch reduzieren zu können.
Aufgaben
- Erzeugung eines künstlichen Trainingsdatensatzes der mit einem vorhandenen annotierten Datensatz vergleichbar ist.
- Trainieren eines Models mit dem Generierten und Vergleichsdatensatz
- Vergleich der Performance der trainierten Modelle
- Optimieren des Datengenerierungsprozesses, um den Unterschied in der Modelperformance zu minimieren.
Qualifikation
- Abgeschlossenes Bachelorstudium in Informatik, Mathematik, Physik, Elektrotechnik, Maschinenbau, oder ein vergleichbarer Abschluss
- Kenntnisse im Bereich Machine Learning
- Gute Programmierkenntnisse in Python
- Erfahrung mit Werkzeugen der modernen Softwareentwicklung (git, IDE, z.B., VS Code, PyCharm)
Benefits
- Zusammenarbeit mit einem interdisziplinären Team und die Möglichkeit, an einem praxisrelevanten Projekt in einem innovativen Umfeld zu arbeiten
- Zugang zu modernster Roboter- und Greifertechnologie sowie Unterstützung bei der Durchführung der Tests
- Ein dynamisches, motiviertes Team, getrieben von Innovationsgeist und Kreativität
- Ein Arbeitsalltag in dem gemeinsam viel geschafft und viel gelacht wird
- Freiraum und Flexibilität bei deiner persönlichen Arbeitsgestaltung
- Flexible Arbeitszeitenregelung
- Eine gelebte „use your own brain“-policy
- Kantinenzuschuss - die Mittagspause verbringen wir gern gemeinsam
- Einen immer gefüllten Kühlschrank mit Spezi, Cola und Club Mate, Wasserbar und richtig guten Kaffee