Machine Learning

Entwicklung

Plattform zur Generierung synthetischer Daten für Machine-Learning-Modelle

visynth.ai ermöglicht Unternehmen die Erstellung hochwertiger synthetischer Bilder zur Trainings- und Validierungszwecken von Computer-Vision-Modellen. Die Plattform wurde entwickelt, um Datenknappheit zu überwinden, die Modellleistung zu verbessern und den gesamten Workflow von der Datensatz-Integration bis zum Modelltraining zu optimieren.

Über das Projekt

Visynth.ai unterstützt Unternehmen dabei, fehlende Trainingsdaten durch die Generierung realistischer synthetischer Bilder für Machine-Learning-Modelle zu kompensieren. Die Plattform kombiniert Datensatz-Import, manuelle Annotation, KI-gestützte Datengenerierung und Modelltraining.

Architektur

Funktionen

Entwicklung

Hauptziele

Unser Team entwickelte Visynth.ai von Grund auf neu — inklusive Frontend-Entwicklung, Backend-Logik in Python sowie einer serverlosen DevOps-Infrastruktur auf AWS.

Skalierbare Architektur

Aufbau einer robusten, serverlosen Plattform, die große Datensätze, KI-Modellbereitstellung und komplexe Datenverarbeitungs-Workflows zuverlässig verarbeitet.

Datenaufbereitung

Ermöglicht den Import, die Organisation und präzise Annotation von Datensätzen, um hochwertige Trainings- und Testdaten für ML-Modelle bereitzustellen.

KI-gestützte Generierung

Konzeption und Implementierung einer automatisierten synthetischen Datengenerierung mit iterativer Verfeinerung und Human-in-the-Loop-Feedback zur Verbesserung der Modellleistung.

Herausforderung & Lösung

Herausforderung

Sicherstellen, dass die Plattform eingehende Datensätze präzise analysiert, hochrelevante und vielfältige synthetische Bilder erzeugt und gleichzeitig Datenqualität sowie Konsistenz gewährleistet.

Lösung

Entwicklung einer skalierbaren serverlosen Architektur mit AWS Lambda, SageMaker und Python, ergänzt durch maßgeschneiderte Frontend-Tools für Annotation und Feedback.

GenAI erkennt, was andere KI-Vision-Systeme übersehen

Gehen Sie über starre Vision-Systeme hinaus und setzen Sie auf adaptive GenAI, die Defekte, Abweichungen und versteckte Probleme erkennt, lernt und eigenständig darauf reagiert — weit über die Möglichkeiten klassischer Modelle hinaus.

Funktionen

Herausforderung & Lösung

Funktionen

Annotationstool

Ermöglicht die manuelle Markierung von Defekten mittels Polygonen, Kurven und Bounding Boxes. Sorgt für eine präzise Datenaufbereitung für das Training von ML-Modellen und die Bildgenerierung.

Konzepte

Benutzer können Defektvorlagen definieren und deren Form, Größe sowie Variationen konfigurieren. Diese Parameter steuern die Generierung realistischer synthetischer Bilder basierend auf projektspezifischen Anforderungen.

Feedback-Mechanik

Nutzer können generierte Bilder prüfen und Feedback geben. Das System regeneriert die Daten iterativ, bis die Ergebnisse den Erwartungen entsprechen.

Mit Visynth.ai können wir nun kleinste Defekte in der Produktion unserer Insulinpumpen in Echtzeit erkennen. Anfangs verfügten wir nur über sehr wenige Defektbilder, doch die Plattform generierte sämtliche relevanten Varianten.

James W., Qualitätsmanager

Führender Hersteller medizinischer Geräte

Branchen

Plattform-Einsatz

Potenzielle Kunden

Automobilindustrie

Kratzer, Dellen oder Lackfehler treten häufig während der Montage auf. Synthetische Daten ermöglichen KI-Systemen, ein breites Spektrum an Defektszenarien zu erkennen, wodurch Nacharbeit reduziert und die Qualitätskontrolle verbessert wird.
Medizintechnik

Produktionsfehler wie falsch ausgerichtete Sensoren oder Gehäuserisse sind bei tragbaren medizinischen Geräten keine Seltenheit. ML-Modelle, die mit synthetischen Defektvarianten trainiert wurden, erkennen Probleme frühzeitig und erhöhen die Patientensicherheit.
Luft- & Raumfahrt

Oberflächenrisse, Korrosion oder Montageabweichungen treten häufig an Flugzeugkomponenten auf. Synthetische Bilder ermöglichen die Erkennung seltener, sicherheitskritischer Defekte und verbessern Inspektionsprozesse.
Schienenfahrzeuge

Probleme wie Radflachstellen, Achsrisse oder Sensordrift treten im Schienenverkehr regelmäßig auf. Frühzeitige Anomalieerkennung verhindert kostspielige Ausfälle.
Elektronik & Halbleiter

Lötfehler, Chiprisse oder falsch platzierte Bauteile sind mit begrenzten Datensätzen schwer zu erfassen. Synthetische Defektbilder trainieren KI-Modelle, auch seltene Fehler zuverlässig zu erkennen.
Verpackung & Fertigung

Dellen, Verformungen oder Etikettierungsfehler entstehen häufig während der Produktion. Die Generierung synthetischer Varianten ermöglicht es KI-Systemen, fehlerhafte Produkte zuverlässig auszusortieren.

Vom initialen Datensatz
zu synthetischen Daten: Schritt für Schritt

Funktionsweise

Plattform

Entwicklung

Importieren

Analysieren

Generieren

Feinjustieren

Trainieren

Importieren

Datensatz importieren

Nach dem Hochladen der Bilder in AWS S3 können Nutzer den entsprechenden Datensatz innerhalb der Plattform auswählen.

Analysieren

Arbeiten mit dem Annotationstool

Nutzer markieren Defekte oder relevante Objekte manuell mithilfe von Polygonen, Bounding Boxes oder benutzerdefinierten Formen. Für jede Klasse werden Schwarz-Weiß-Masken erzeugt, die später für das Modelltraining und die Datengenerierung verwendet werden.

Generieren

Generierung synthetischer Daten

Die Plattform erzeugt iterativ Bilder auf Basis freigegebener Konzepte. Nutzer prüfen eine Stichprobe (z. B. 50 Bilder) und geben Feedback zu Qualität und Genauigkeit.

Feinjustieren

Human-in-the-Loop & Optimierung

Das Feedback wird automatisch von den Algorithmen der Plattform verarbeitet. Es werden mehrere Varianten des Konzepts erzeugt, die sich anhand der Nutzerrückmeldungen kontinuierlich verbessern, bis der Kunde die Ergebnisse freigibt.

Trainieren

Batch-Generierung für das Modelltraining

Nach der Freigabe erzeugt der Kunde große Batches synthetischer Bilder (Hunderte oder Tausende). Diese Bilder sind sofort exportierbar und für das Training von ML-Modellen geeignet.

Projekte

Projekte

Datensätze

Der Nutzer beginnt mit der Einrichtung eines neuen Projekts, vergibt einen Namen und wählt die Quelle des Datensatzes aus. Dieser Schritt initialisiert den Arbeitsbereich und bereitet die Plattform auf die Verarbeitung der Bilddaten vor.

Datensätze in trainierte Modelle verwandeln – sofort & präzise

Datensätze

Dateien importieren

Entwicklung

Datensatz importieren

Nutzer importieren Bilder durch die Anbindung bestehender Speicherlösungen wie AWS-S3-Buckets. Die Plattform analysiert den Datensatz und extrahiert wichtige Informationen wie Bildanzahl, Klassen und Metadaten.

Klassen hinzufügen

Entwicklung

Funktionen

Klassen

Annotationstool öffnen

Der Nutzer wählt ein Bild aus dem importierten Datensatz und öffnet das Annotationstool, um Defektbereiche mit Polygonen zu markieren.

Definieren und markieren

Nutzer vergeben einen Namen für die neue Klasse und markieren relevante Defektbereiche im Bild. Mehrere Polygone können kombiniert werden, um komplexe Defekte oder Objekte präzise hervorzuheben.

Speichern und anwenden

Nach dem Speichern wird die Annotation auf den Datensatz angewendet und dieser für die Generierung synthetischer Bilder vorbereitet.

Konzepte

Konzept-Erstellung

Bilder auswählen & Defekt definieren

Auswahl einer Teilmenge von Bildern aus dem importierten Datensatz sowie Beschreibung des zu modellierenden Defekts mittels Prompt oder Text.

Trainingsdaten filtern

Ausschluss von Bildern mit fehlerhaften Annotationen oder irrelevanten Defekten zur Sicherstellung der Datenqualität.

Formparameter festlegen

Definition der Formparameter des Konzepts, einschließlich Polygonen, Kreisen oder Rechtecken, sowie Anpassung von Größe und Variation.

Vorschau generieren & prüfen

Nach der Erstellung des Konzepts werden Vorschaubilder generiert, die geprüft und kommentiert werden können.

Batch generieren

Nachdem das Konzept verfeinert wurde und der Nutzer mit den Ergebnissen zufrieden ist, kann ein vollständiger Batch synthetischer Bilder erzeugt werden. Der Batch kann Hunderte oder sogar Tausende von Bildern umfassen, die alle auf dem freigegebenen Konzept und den definierten Defektvariationen basieren.

Modelltraining

Nutzer können ML-Modelle mit Datensätzen und Batches trainieren, die in den vorherigen Schritten vorbereitet wurden. Sowohl annotierte als auch nicht annotierte Bilder sowie synthetische Batches können als Eingabedaten verwendet werden.

Wie wird das Modell trainiert?

Machine Learning

Modelltraining

Trainingsdaten auswählen

Nutzer wählen Datensätze und/oder synthetische Batches aus, die dem Modell als Trainingsdaten zugeführt werden.

Training konfigurieren

Nutzer wählen Batches aus, bestimmen konkrete Bilder für das Training, definieren Klassen, wählen einen Datensatz und richten Validierungsschritte ein.

Training starten

Sobald alle Parameter festgelegt sind, ist das Modell bereit für das Training. Nach dem Klick auf den Start-Button beginnt der Trainingsprozess.

Ergebnisse bewerten

Nach Abschluss des Trainings können Nutzer Kennzahlen einsehen und beurteilen, wie zuverlässig das Modell Defekte erkennt.

Ergebnisse

Entwicklung

Plattform

Erfolge

Starkes Frontend

Dank des intuitiven Workflows und des benutzerfreundlichen Annotationstools können Nutzer Defekte einfach markieren. Die Datensatzvorbereitung wird dadurch schnell, präzise und auch bei komplexen Bildern effizient.

Python-basiertes Backend

Wir setzten AWS Lambda für serverlose Verarbeitung und SageMaker für die Bereitstellung von KI-Modellen ein. Diese Architektur bietet eine skalierbare, effiziente und wartungsarme Infrastruktur für Modelltraining und die Generierung synthetischer Bilder.

DevOps & Infrastruktur

Wir implementierten eine vollständig serverlose AWS-Architektur mit automatischer Skalierung, Monitoring und sicherer Datenverarbeitung. Dadurch wurde eine zuverlässige Performance auch bei großen Datensätzen und hoher Batch-Auslastung gewährleistet.