Vor einiger Zeit hat Adobe eine Funktion in Photoshop vorgestellt, die eine automatische Freistellung des Hauptmotivs in Bildern ermöglicht. Während der Software-Riese aus dem Silicon Valley sich damit vor allem auf Familien- oder Tierbilder konzentriert, gibt es in spezifischen Anwendungsfällen noch enorme Innovationspotenziale.
Genau hier hat unser Mitgliedsunternehmen Laudert GmbH & Co. KG aus Vreden angesetzt und in Kooperation mit der Bergischen Universität Wuppertal eine Software-Lösung entwickelt, die das automatische Freistellen von Produkten aus Fotografien ermöglicht. Der Clou dabei: Durch maschinelles Lernen lernt die Software jeden Tag dazu und erzielt schon jetzt beachtliche Ergebnisse.
Wir wollten mehr über dieses Innovationsprojekt erfahren und haben mit Tobias Enk, Software-Entwickler bei Laudert, gesprochen.
Erzähl uns in ein paar Sätzen, wie die Idee zur neuen Software-Lösung entstanden ist und welches Ziel ihr hiermit verfolgt.
Wir wollten uns schon immer mit dem Thema Maschinelles Lernen (ML) auseinandersetzen und haben nach einem geeigneten Einstieg gesucht. Wie es der Zufall wollte, kam ein ehemaliger Mitarbeiter auf uns zu, der sich im Rahmen seiner Promotion an der Uni Wuppertal mit Anwendungen von ML im Umfeld Print- und Media auseinandersetzt. Nach nur einem Meeting zwischen der BUW und Laudert haben wir festgestellt, dass ein gemeinsames Interesse besteht, sich dem Thema KI mit einer konkreten Fragestellung zu widmen. Wir identifizierten das Thema ‚Freistellung‘ als besonders guten Einstieg für uns. Das hat zum einen damit zu tun, dass es wirtschaftlich relevant für uns bei Laudert ist, und zum anderen, dass hierzu international bereits sehr viel geforscht wurde. Wir fangen hier also nicht bei der Grundlagenforschung an, sondern adaptieren bestehendes so, dass es auf unsere Fragestellung passt. Besonders herausfordernd war es, ein System zu entwickeln, das den besonders hohen Ansprüchen in der Fotografie und in der Produktpräsentation genügt.
Besonders herausfordernd war es, ein System zu entwickeln, das den besonders hohen Ansprüchen in der Fotografie und in der Produktpräsentation genügt.
Wie kam der Kontakt zur Bergischen Universität Wuppertal zustande? Kanntet ihr euch aus früheren Projekten?
Es bestand bereits eine langjährige partnerschaftliche Beziehung mit der Druck- und Medientechnik der BUW. Wir haben in der Vergangenheit bereits ein ZIM Projekt – eine Aufheller Simulation – und einige Thesen zusammen umgesetzt. Außerdem ist einer unserer ehemaligen Mitarbeiter mittlerweile an der BUW tätig.
Zunächst mussten wir feststellen, dass wir intern Know-How aufbauen müssen, um zum einen die dynamischen Entwicklungen im Bereich KI qualifiziert bewerten zu können und diese Technologie für uns am Ende auch nutzbar zu machen.
Was waren die wichtigsten Learning, die ihr im Projektverlauf gemacht habt?
Zunächst mussten wir feststellen, dass wir intern Know-How aufbauen müssen, um zum einen die dynamischen Entwicklungen im Bereich KI qualifiziert bewerten zu können und diese Technologie für uns am Ende auch nutzbar zu machen. Hierzu sind wir immer auf der Suche nach pfiffigen Menschen, die auf diesem Gebiet Expertise mitbringen oder sich einarbeiten wollen.
ML ist wie ein Schweizer Taschenmesser für unzählige Fragestellungen. Es gibt viele potenzielle Anwendungsfelder bei Laudert, für die es bisher keine geeigneten Werkzeuge gab. Die Technologie ML bietet riesiges Potential um „cold cases“ neu aufzuarbeiten oder völlig neue Wege zu gehen, die vorher nicht denkbar gewesen wären, da kein Modell bekannt ist oder aufgestellt werden kann, das einem eine hinreichend genaue Lösung für ein Problem liefert.
Da unsere Prozesse voll digital und gut strukturiert sind, befinden wir uns bei Laudert in einer sehr komfortablen Ausgangslage für diverse KI-Projekte. Insbesondere der Bereich Bild ist bei uns wirtschaftlich sehr wichtig. Glücklicherweise ist dieser Bereich sehr erfolgreich in der ML Szene und etabliert sich in immer mehr kommerziellen Anwendungen. Das schafft auch Vertrauen in die Technologie. Computer Vision mit ML ist inzwischen ein sehr weit verzweigter und sehr offener Forschungszweig mit viel Dynamik. Die Offenheit, mit der Forschungsergebnisse publiziert und Code der Allgemeinheit zugänglich gemacht wird, ist teilweise schon erstaunlich. Aber genau das fördert den Einstieg in die Thematik, die Weiterentwicklung der Technologie und den Transfer zu kommerziellen Anwendungen.
Was waren, bzw. sind die größten Hürden im Projekt und wie habt ihr diese überwunden?
Unsere Trainingsdaten sollten möglichst wenige Fehler aufweisen. Datensätze nach Fehlern zu durchsuchen war nicht einfach. Aber wir haben es gemeistert. Dabei haben wir auch festgestellt, wie fehleranfällig der Mensch ist und wie schwierig es eigentlich ist, eine wirklich saubere Definition der Aufgabe „Produktfreistellung“ zu finden. Auch die Formulierung der Aufgabenstellung ist eine mögliche Fehlerquelle bei manuellen Prozessen.
Gleichzeitig möchten wir teure, manuelle Prozesse automatisieren und diese weniger zeitintensiv machen.
Was ist eure langfristige Vision mit dem Projekt?
Wir planen vor allem die Automatisierung von Prozessen, die bislang als Dienstleistungen eingekauft werden (Insourcing). Gleichzeitig möchten wir teure, manuelle Prozesse automatisieren und diese weniger zeitintensiv machen.
Wie lange musstet ihr überlegen, ob ihr ein Produkt entwickelt, das in Konkurrenz zum Software-Riesen Adobe steht?
Nicht lange, da Adobe seine KI-Lösungen mit Sicherheit nicht für unser spezifischen Anforderungen bei Laudert entwickelt, sondern für die ganze Welt. Fotostudio Sets sind nicht der erste Anwendungsfall, an den Adobe denkt. Deshalb kann es auch noch einige Zeit dauern bis Adobe Tools auf den Markt bringt, die uns wirklich helfen. Und darum wollten wir selber aktiv werden. Langfristig könnte es aber gut sein, dass Adobe eine Freistellfunktionen implementiert, die auch unseren spezifischen Anforderungen genügt.
Wie schaut ihr auf die regionale Digital- und Startup-Szene?
Wir sehen es als wichtig an, uns mit innovativen, jungen Unternehmen auszutauschen. Laudert zeichnet schon immer auch aus, sich mit neuen Technologien vertraut zu machen und sie einfach auszuprobieren. Da zahlt sich jeder Dialog am Ende aus.