Anzeige
"Text-zu-Hologramm"

Amazon kooperiert mit Proto

Amazon Web Services entwickelt gemeinsam mit Proto eine Lösung, mit der Retailer ihre Produkte Hologramm-artig visualisieren können. Die Schwebebilder entstehen auf Basis von Text-Prompts.
Das "Text-zu-Hologramm"-Tool erstellt aus Artikel ein animiertes Video, das in den Proto-Displays hologramm-artig erscheint. (Foto: AWS)
Das „Text-zu-Hologramm“-Tool erstellt aus Artikel ein animiertes Video, das in den Proto-Displays hologramm-artig erscheint. (Foto: AWS)

Gibt es viele Einzelhändler, die mehr als 50.000 US-Dollar für einen riesigen LCD-Screen ausgeben, auf dem die Produkte auf einer transparenten Fläche schweben? Ich glaube nicht, aber einige Leute in der Cloud-Computing-Abteilung des E-Commerce-Riesen Amazon sehen etwas, was ich vielleicht nicht sehe.

Dieser Artikel erschien zuerst in englischer Sprache auf dem Fachportal Sixteen-Nine des invidis-Contentpartners Dave Haynes.

Amazon Web Services (AWS) und das in Los Angeles ansässige Unternehmen Proto haben gemeinsam etwas entwickelt, das sie als „hochmoderne Text-zu-Hologramm-Pipeline“ beschreiben, „die es den Benutzern ermöglicht, mit nur ein paar Zeilen Text dynamische, immersive Inhalte für die hochmodernen holografischen Displays von Proto zu erstellen“.

Kurz gesagt verwendet die Lösung verschiedene Komponenten des AWS-Tech-Stacks, um Produktvideos aus AI-basierten Prompts zu für die transparenten Displays von Proto zu generieren. Der Hersteller vermarktet diese Displays als Hologramme, aber eigentlich handelt es sich um ein flaches Bild. Der Schwebe-Effekt entsteht durch die Kombination des großen weißen Gehäuses hinter dem Screen und die mittels AI erzeugten Schatten in den Bildern. Diese werden dann zu einem gerenderten Video verarbeitet.

Zusammengefasst beschreibt AWS die Lösung so:

  1. Benutzerauthentifizierung: Amazon Cognito stellt sicher, dass nur autorisierte Benutzer Zugriff haben.
  2. Eingabe: Benutzer geben einen Promt über eine REST-API ein, die von Amazon API Gateway gehostet wird.
  3. Auslösung: AWS Lambda löst einen AWS Step Functions-Zustandsautomaten aus, der den Workflow orchestriert.
  4. Bildgenerierung: Das Amazon Titan Image Generator-Modell erstellt aus der Texteingabe visuelle Darstellungen.
  5. Videogenerierung: Das Bild wird über die API der Stability AI-Entwicklerplattform an das Stable Video Diffusion-Modell von Stability AI gesendet, das das Bild in ein dynamisches Video umwandelt.
  6. Holografische Darstellung: Das Video wird in das Proto Hologram Content Management System hochgeladen und auf einem Proto-Holografie-Display angezeigt.

Der für das Beispielbild verwendete Prompt scheint so zu lauten: „Ein Dutzend brauner Lederhandtaschen schweben in der Luft vor einem weißen Studiohintergrund.“

Ich bin nicht sicher, ob das Video tatsächlich konvertiert wird, da es nicht wirklich holografisch ist. Möglich ist aber, dass die eingereichten Videodateien von der Proto-Software verarbeitet werden. Der Teil des Prompts „schwebend in der Luft vor einem weißen Studiohintergrund“ könnte die Schattenarbeit simulieren, die normalerweise in einer Proto-Licht- und Kameraaufnahmeeinrichtung durchgeführt wird.

Transparente LCD-Screens gibt es schon seit vielen Jahren, Hersteller haben aber Schwierigkeiten, skalierbare Anwendungen dafür zu finden. Diese Technologie kann beeindruckend sein, wenn sie gut umgesetzt wird, ist jedoch sehr teuer und nicht etwas, in das viele Einzelhändler investieren möchten. Proto, ursprünglich als Portl bekannt, war das erste Unternehmen, das eine Lösung mit maßgeschneiderten transparenten LCD-Gehäusen, verstärkter Kantenbeleuchtung, und Chromakey-Videoerfassung entwickelte. Seitdem sind mehrere andere Unternehmen mit ähnlichen Produkten auf den Markt gekommen, die sich möglicherweise von Proto inspirieren ließen.

Gerade für Remote-Anwendungen

Mir gefällt diese Technologie für bestimmte Anwendungen, insbesondere für Remote-Auftritte, wie bei einer Rede des ukrainischen Präsidenten Volodymyr Zelenskyj vor zwei Jahren. Sie ermöglicht es jemandem, von einem Studio aus mit einer Menschenmenge am anderen Ende der Stadt oder des Landes zu sprechen und in Echtzeit zu interagieren. Auch Fernunterricht und Telemedizin sind interessante, aber teure Einsatzmöglichkeiten. Die transparente LCD- und Videoaufzeichnungstechnik wird auch genutzt, um schwebende, sich drehende NFTs und Produktbilder zu zeigen, was nicht unbedingt sinnvoll erscheint.

„Hologramm“: Zelenskyj spricht über 3D-Display

Wahrscheinlich hat Proto etwas Besonderes entwickelt, aber letztlich sind das Display und der Player nur Endpunkte. Diese Technologie könnte auf jedem Screen laufen.

Ein rätselhafter Aspekt dieser Technologie ist die Verwendung der AI-Bildgenerierung, also die Darstellung von Produkten basierend auf Daten aus einem Large Language Model. Obwohl die Bild- und Videogenerierung durch AI beeindruckend ist, verkaufen Einzelhändler fertige Waren und keine generierten Vorstellungen davon.

Potenzial im Luxus-Retail

Die Darstellung der schwebenden Handtaschen zeigt nur konzeptionell, was möglich ist. Eine pragmatische Anwendung in der realen Welt mit echten Produkten, Branding und konkreten Handlungsaufforderungen wäre überzeugender.

Es gibt sicherlich einige wohlhabende Ladenbesitzer in Dubai, Katar, Riad oder Las Vegas, die wegen des Wow-Effekts in diese Technologie investieren würden. Jedoch ist es unwahrscheinlich, dass sie im großen Maßstab Verbreitung findet.

Interessant ist, wie schnell die AI-basierte Bild- und Videogenerierung voranschreitet. Kreative Menschen wie Designer bleiben wertvoll für die Entwicklung wirkungsvoller Ideen und visueller Konzepte. Maschinen können jedoch zunehmend die mühsame Arbeit der Erstellung statischer und bewegter Dateien übernehmen.