Seit Juni 2026 betreibt der humanoide Roboter Xiao Gai einen Convenience Store an Hongkongs Hung-Hom-Waterfront – 24 Stunden am Tag, ohne menschliches Personal. Der G1-Roboter des Pekinger Herstellers Galbot ist 1,73 Meter groß, hat eine Armspannweite von 1,90 Metern und erledigt alles: Regale einräumen, kassieren, nachbestellen, Kunden auf mehreren Sprachen beraten. Das KI-System dahinter – Galbots eigenes AstraBrain mit einem speziellen Navigationsmodell – erkennt Produkte, versteht Kaufabsichten und führt Gespräche. Der Hersteller prognostiziert 40 Prozent mehr Laufkundschaft allein durch den Neuigkeitswert und plant 100 weitere Filialen in zehn asiatischen Städten.
Die Schlagzeilen überschlagen sich. Endlich wird aus der Robotik-Vision Realität. Doch nur wenige Wochen zuvor lieferte Stockholm die Gegenthese.
3.000 Gummihandschuhe und kein Brot
Das Start-up Andon Labs setzte im April 2026 einen KI-Agenten namens Mona als Geschäftsführerin eines Cafés ein. Mona, basierend auf Googles Gemini-Modell, sollte Personal koordinieren, Bestellungen aufgeben und den Tagesbetrieb steuern – alles über Slack-Nachrichten an die menschlichen Baristas.
Das Ergebnis nach weniger als einem Monat: Von einem Startbudget von über 21.000 Dollar blieben weniger als 5.000 übrig. Mona bestellte 3.000 Gummihandschuhe, 6.000 Servietten und vier Erste-Hilfe-Kästen. Dazu Tomaten, die auf keiner Speisekarte standen. Und sie vergaß regelmäßig, rechtzeitig Brot bei der Bäckerei zu ordern – was dazu führte, dass die Baristas Sandwiches von der Karte streichen mussten.
Der Fall ist kein Einzelfall, sondern ein Muster. Wenn ein KI-System ohne Leitplanken, ohne Budgetgrenzen und ohne definierte Fehlerbehandlung operiert, erzeugt es nicht Effizienz, sondern Chaos. Das Sprachmodell selbst funktionierte. Was fehlte, war alles drumherum.
Was Galbot nicht zeigt
Zurück nach Hongkong. Galbot zeigt stolz, wie Xiao Gai Medikamente aus dem Regal holt und mehrsprachig berät. Was Galbot nicht zeigt: Was passiert bei einem Stromausfall? Bei einem Diebstahl? Bei einem aggressiven Kunden um drei Uhr nachts? Auf Fragen zu Notfallprotokollen schweigt das Unternehmen.
Die 40-Prozent-Prognose für zusätzliche Laufkundschaft ist dabei der ehrlichste Teil der Pressemitteilung. Sie sagt im Grunde: Die Menschen kommen, weil es neu ist. Nicht weil es besser funktioniert als ein Laden mit Personal.
Das eigentliche Problem liegt tiefer – und teilt sich in drei Schichten, über die in der aktuellen Begeisterung kaum jemand spricht.
Drei Schichten, ohne die autonome Filialen scheitern
Das Gebäude muss mitspielen
Ein humanoider Roboter navigiert nicht von allein durch einen Laden. Er braucht ein Gebäude, das als Betriebssystem funktioniert: visuelle Orientierungsmarker an Regalen und Wegkreuzungen, damit der Roboter weiß, wo er ist. Sicherheitsfolien auf Glasflächen, die seine Sensoren erkennen können. Bodenbeschaffenheit, die für Radnavigation geeignet ist. Ein lückenloses Netzwerk bis in den letzten Regalwinkel. Und Fluchtwegekonzepte, die einen autonomen Agenten einbeziehen. Nichts davon ist Teil der Roboter-Lieferung. Alles davon entscheidet, ob der Roboter funktioniert oder nach zwei Wochen gegen die Eingangstür fährt.
Rossmann hat das verstanden. Die Drogeriemarktkette testet seit März 2026 einen UBTech Walker S2 in der Logistik am Standort Burgwedel – und investierte Monate in die Vorbereitung der Lagerinfrastruktur, bevor der Roboter seinen ersten Karton greifen durfte. Das ist normal, wenn ein Unternehmen sein Gebäude als Betriebssystem ernst nimmt.
Die KI braucht einen Rahmen, der Fehler abfängt
Monas Gummihandschuh-Exzess war kein Problem des Sprachmodells. Es war ein Problem der Architektur. Ein KI-Agent, der Bestellungen auslösen darf, braucht einen übergeordneten Kontrollrahmen: Welche Aktionen darf der Agent eigenständig ausführen? Ab welchem Betrag muss ein Mensch bestätigen? Was passiert, wenn eine Bestellung vom historischen Muster abweicht? Versteht er Stückzahlen und Verpackungseinheiten korrekt?
Diesen Kontrollrahmen nennt die Fachwelt Agent Harness – eine Architekturschicht aus Werkzeugen, Regeln, Kontext und Fehlerbehandlung, die aus einem leistungsfähigen Sprachmodell einen zuverlässigen Mitarbeiter macht. Das Modell selbst – ob Gemini, GPT oder ein anderes – ist austauschbar. Die Kontrollarchitektur darüber ist es nicht. Sie entscheidet, ob ein System zuverlässig arbeitet oder eskaliert, ohne dass jemand eingreift.
In der EU gelten andere Regeln
In Hongkong mag ein kamerabestückter Roboter in einem Neun-Quadratmeter-Laden rund um die Uhr filmen. In Deutschland sieht das anders aus. Seit Februar 2025 verbietet die EU-KI-Verordnung biometrische Echtzeit-Identifikation im öffentlichen Raum. Ab August 2026 gelten die vollständigen Hochrisiko-Pflichten für Systeme, die biometrische Daten verarbeiten – also auch für Kameras in einem Laden, die Gesichter analysieren.
Konkret heißt das: Jedes Unternehmen, das einen humanoiden Roboter mit Kamerasystem in einem kundenzugänglichen Bereich einsetzen will, braucht eine Datenschutz-Folgenabschätzung nach DSGVO, eine rechtskonforme Rechtsgrundlage und eine klare Antwort auf die Frage, was mit den erhobenen Daten passiert. Werden Gesichter gespeichert? Werden Bewegungsmuster analysiert? Aufsichtsbehörden haben 2025 mehrfach Bußgelder im fünf- bis sechsstelligen Bereich für unzulässige Videoüberwachung im Einzelhandel verhängt.
Sind humanoide Roboter die Lösung?
Die Frage ist nicht, ob humanoide Roboter in deutsche Filialen und Lager kommen. Rossmann testet bereits. 64 Prozent der deutschen Industrieunternehmen sehen laut Bitkom in Humanoiden einen Produktivitätshebel. Die Kosten fallen rasant – ein vollausgestatteter humanoider Roboter im Robot-as-a-Service-Modell liegt bei 2.000 bis 3.000 Dollar monatlich, deutlich unter den Gesamtkosten einer Vollzeitstelle im Schichtbetrieb.
Die relevante Frage ist eine andere: Ist Ihr Unternehmen bereit, einen solchen Agenten tatsächlich zu betreiben? Sind die Räumlichkeiten so aufbereitet, dass ein Roboter sich darin orientieren kann? Gibt es eine digitale Infrastruktur, die den KI-Agenten kontrolliert, statt nur laufen zu lassen? Und gibt es ein Datenschutzkonzept, das den Einsatz in der EU überhaupt erst rechtssicher macht?
Der Roboter ist gar nicht so sehr das Problem an der ganzen Sache. Die Infrastruktur – physisch, digital, ethisch – ist das eigentliche Problem. Und genau daran scheitern die meisten Projekte, bevor der Roboter seinen ersten Handgriff tut.
Physisch, digital, ethisch
Die Erfahrung zeigt ein wiederkehrendes Muster: Wer ein Robotikprojekt plant, beginnt meistens beim Roboter. Die Auswahl der Hardware, der Vergleich der Hersteller, die Faszination der Demonstration – das alles steht am Anfang. Die Frage, ob das Gebäude den Roboter überhaupt tragen kann, kommt zu spät oder gar nicht.
Wer über Automatisierung nachdenkt, beginnt bei der Datenstruktur und der Prozessarchitektur. Dann kommt das Gebäude und dann die KI-Kontrollebene mit Agent Harness, Leitplanken und Eskalationsprotokollen. Und dann erst der Roboter.
Dass wir dabei physische Gebäude-Arbeit mit KI-Architektur und Datenschutzberatung aus einer Hand verbinden, ist die Konsequenz aus der Erkenntnis, dass diese drei Schichten nicht getrennt funktionieren. Ein Robotikprojekt im Mittelstand scheitert, wenn drei verschiedene Dienstleister die physische, digitale und ethische Ebene isoliert bearbeiten – ohne die Schnittstellen zu kennen.
Fazit
Die Galbot-Filiale in Hongkong ist technisch beeindruckend. Als Blaupause für den deutschen Einzelhandel taugt sie nicht – weder regulatorisch noch infrastrukturell. Und das Stockholmer Café zeigt, was passiert, wenn ein KI-System ohne Kontrollarchitektur auf die Realität trifft.
Für Unternehmen, die sich ernsthaft mit Robotik beschäftigen, muss daher die Frage lauten: Was muss in unserem Gebäude, in unserer IT-Architektur und in unserem Datenschutzkonzept passieren, damit Automatisierung überhaupt funktionieren kann?
Wer diese Frage zuerst beantwortet, wird bereit sein, wenn die Technologie so weit ist. Wer sie überspringt, bestellt 3.000 Gummihandschuhe.



