Autor: Deep Web Tencent News
Während OpenClaw mit seiner Begeisterung für „Shrimp Farming“ und den Kontroversen um „Shrimp Killing“ zum Top-Trend im KI-Bereich wurde, konnten auch die führenden Smartphone-Hersteller, die sich seit langem auf KI an der Endgeräteseite konzentrieren, nicht mehr stillhalten und begannen, ihre eigenen Claw-Modelle zu entwickeln und zu „zähmen“.
Am 6. März startete der Xiaomi Mobile-Agent — Xiaomi miclaw — in einer kleinen geschlossenen Testphase per Einladungscode und wurde damit der erste inländische Smartphone-Hersteller, der eine interne Testversion des „Hummers“ anbietet. Danach kündigten Huawei, Honor, OPPO und andere ebenfalls interne Tests für ihre Claw-Modelle an.
Nach der offiziellen Ankündigung, dass Huawei den neuen OpenClaw-Modus für Xiaoyi eingeführt hat, veröffentlichte Huawei auch die Beta-Version von Xiaoyi Claw; Honor kündigte die „Honor Lobster Universe“ an, die das Aufziehen von Shrimp auf PC und Tablet unterstützt, mit zukünftiger Kompatibilität zu anderen Ökosystem-Geräten; OPPOs Design-Direktor Chen Xi zeigte auf sozialen Plattformen einige Funktionen von Xiaobu Claw und erklärte, dass „Xiaobu Claw noch Sicherheits- und andere Probleme lösen muss“.
Mit anderen Worten: Der Einstieg der Smartphone-Hersteller ins „Shrimp Farming“ befindet sich derzeit hauptsächlich in der Testphase. Es gibt noch keinen festen Zeitplan für eine großflächige Markteinführung.
Beispielsweise ist Xiaomi miclaw derzeit nur für eine kleine geschlossene Testgruppe für die Xiaomi 17-Serie, Xiaomi 15S Pro und Redmi K90-Serie verfügbar. Mit Einladungscode und System-Update kann die Xiaomi miclaw App genutzt werden. „Während der Testphase sind keine Gebühren geplant“, sagte Xiaomi-Partner und Präsident Lu Weibing.
Ein Brancheninsider verrät, dass „OpenClaw im Wesentlichen ein Open-Source-Framework ist, das eine Drittanbieter-Skill- und Plugin-Ökologie enthält und verschiedene große Modelle aufrufen kann. Für den durchschnittlichen Nutzer ist die Bereitstellung von OpenClaw sehr anspruchsvoll, aber für Smartphone-Hersteller ist es technisch machbar. Die eigentlichen Herausforderungen liegen bei der Rechteverwaltung, dem Schutz der Nutzerdaten und der Einhaltung gesetzlicher Vorschriften.“
„Die führenden Smartphone-Hersteller stehen vor Hunderten Millionen gewöhnlicher Nutzer. Jede KI-Funktion muss vor der Einführung gründlich getestet werden, um eine reife, sichere und stabile Erfahrung zu gewährleisten“, verrät ein Mitarbeiter eines Herstellers.
Große Modellanbieter sind begeistert vom Einsatz von „Lobster“, was man einfach als „Rechenleistung- Monetarisierung“ verstehen kann: Es geht darum, Agenten (Agenten) häufiger Modelle aufzurufen und komplexe Aufgaben auszuführen, wodurch mehr Tokens verbraucht werden und direkt API-Umsätze generiert werden.
Doch diese Logik ist in der Smartphone-Branche schwer umsetzbar. Nutzer, die Tausende oder Zehntausende Euro für ein Smartphone ausgeben, sind kaum bereit, für jede einzelne Aufgabe extra zu bezahlen. Da kein direkter Profit durch den Verkauf von Aufgaben möglich ist, warum investieren Top-Hersteller trotzdem in die interne Testversion des mobilen „Claw“?
Einer der Gründe ist, dass OpenClaw auf dem Weg ist, die ideale Form eines „Super-Assistenten“ zu erreichen, während sich die traditionelle Entwicklung vom passiven Sprachassistenten zu einem „persönlichen intelligenten Agent“ vollzieht.
Im Gegensatz zu früheren, nur reaktiv antwortenden Sprachassistenten ähnelt OpenClaw eher einem rund um die Uhr online verfügbaren „digitalen Mitarbeiter“, der erstmals den echten Nutzen der KI-Vertretung menschlicher Arbeit für den Durchschnittsnutzer greifbar macht.
Aus der zugrunde liegenden Logik von OpenClaw liegt sein Kernwert in der starken „Autonomie“. Es überschreitet die Grenzen des Chat-Fensters, solange man ihm die entsprechenden Skills (Fähigkeitspakete) und ausreichend Tokens gewährt, kann OpenClaw Nutzergewohnheiten und Aufgaben merken, eigenständig Schritte planen, Werkzeuge aufrufen und Software steuern, bis das Ergebnis geliefert wird.
Doch um diese „Autonomie“ aus der Cloud auf die begrenzte Fläche eines Smartphones zu bringen, reicht eine App-gestützte Lösung nicht aus. Es erfordert eine tiefgreifende, systematische Neugestaltung des Betriebssystems.
In der konkreten Umsetzung wählen Huawei Xiaoyi Claw und Xiaomi miclaw beide den Ansatz, als „System-Apps“ einzusteigen. Dabei werden ursprünglich verstreute Software-Funktionen, Systemrechte und sogar plattformübergreifende Fähigkeiten in Skills (Fähigkeitspakete) verpackt, die vom Agenten aufgerufen werden können, und durch eine selbstentwickelte Logik- und Ausführungs-Engine verbunden.
Beispielsweise integriert Xiaomi miclaw über 50 System-Tools und Ökosystem-Dienste, um eine geschlossene „ Wahrnehmung-Logik-Ausführung“-Schleife zu bilden. Bei Nutzeranweisungen zerlegt die Engine die Aufgaben eigenständig, sucht passende Werkzeuge, bestimmt Parameter und passt die Abläufe anhand der Ergebnisse an, bis die Aufgabe vollständig erledigt ist.
Huawei’s Xiaoyi Claw basiert direkt auf HarmonyOS. „Xiaoyi Claw verfügt über systemweite Rechte (keine Drittanbieter-Apps notwendig, direkte Nutzung der Systemfunktionen), Alltags- Szenarien-Kooperation (Smartphone, PC, Auto, Smart Home nahtlos verbunden) und Datenschutz-Isolierung (lokale Verarbeitung der Nutzerdaten)“, so ein Huawei-Insider.
Doch die Herausforderung, „Lobster“ auf Smartphones zu implementieren, geht weit über Technik und Ökosystem hinaus. Es erfordert eine sichere, regelkonforme Handhabung sensibler Daten, die Überwindung plattformübergreifender Barrieren und sogar eine Neugestaltung der Branchen-Gewinnverteilung.
„Der wichtigste Punkt bei der Implementierung von Lobster auf Nutzerhandys ist die Sicherheit der Informationen“, betont ein Hersteller-Mitarbeiter.
Diese Sicherheitsbedenken sind nicht unbegründet. Aufgrund der standardmäßig schwachen Sicherheitskonfigurationen von OpenClaw besteht die Gefahr, dass Angreifer die vollständige Kontrolle über das System erlangen. Bereits wurden Sicherheitsrisiken wie Prompt-Injection, Fehlbedienung und Schadsoftware-Plugins entdeckt.
Angesichts dieser Sicherheitsrisiken ist das Sicherheitsmanagement bei der großflächigen Einführung von „Lobster“ auf Smartphones eine unüberwindbare Grenze.
Beispielsweise hat Xiaomi miclaw alle Tools, die mit Transaktionen oder Zahlungen zu tun haben, auf Code-Ebene „gesperrt“, um zu verhindern, dass Agenten im Cloud-Backend eigenmächtig Zahlungen auslösen. Ohne explizite Nutzerbestätigung wie Fingerabdruck- oder Passworteingabe sind automatische Transaktionen ausgeschlossen, was das Risiko automatischer Abbuchungen effektiv ausschließt.
Das bottom-up Deployment eigener „Lobster“ auf Smartphones ist ein entscheidender Schritt in der Evolution vom „KI-Handy“ zum „KI-Phone“. Für Hersteller, die im KI-Boom schnell wachsen wollen, ist die größte Herausforderung die Kosten.
Lokale „Lobster“-Implementierung ist kein einfaches Software-Update, sondern erfordert Hardware-Upgrade bei Prozessoren, Speicher und anderen Komponenten. Die hohe Rechenleistung der großen Modelle bei Echtzeit-Inferenz stellt hohe Anforderungen an die NPU-Leistung des SoC, was die Spezifikationen von RAM und Speicherchips deutlich erhöht.
„Das Ausführen großer Modelle auf dem Smartphone ist durch Speicherplatz, Energieverbrauch und andere technische Faktoren eingeschränkt. Ein 1-Milliarden-Parameter-Modell benötigt etwa 1GB RAM, 7 Milliarden etwa 4GB, 13 Milliarden etwa 7GB“, so ein Leiter eines AI-Lösungszentrums eines Top-Herstellers.
Aktuell steigen die Preise für Speicherchips, was die Margen der Geräte weiter drückt. Noch schwerwiegender ist die laufende Nutzung der „Lobster“-Funktion nach Aktivierung: Jede Aufgabe verbraucht Tokens und Rechenleistung. Die Nachricht, dass man mit einem „Zweitausend-Euro-Handy“ keinen „Lobster“ mehr bezahlen könne, macht die Kosten direkt sichtbar.
„Bevor man ‚Lobster‘ nutzt, sollte man sich genau überlegen, wofür“, erklärt der Gründer eines MCN (Media-Content-Netzwerk). „In der Videoproduktion ist der Token-Verbrauch beim Schneiden und beim Generieren von Videos sehr unterschiedlich. Viele Anfänger verstehen nicht, was Lobster wirklich leisten kann.“
Er rechnet vor: „Unser Schneide-Setup läuft auf einem Mac mini4 mit OpenClaw. ‚Lobster‘ erstellt Skripte für lokale Hotspots, um Ladenbesuche zu filmen. Manche Szenen werden real gefilmt, andere mit KI (z.B. Seedance2.0 oder Sora2) generiert. Lobster steuert den Mac mini zum Schneiden und ruft Sora2-APIs auf. Manche Schritte sparen Geld, andere sind günstiger mit KI. Am Ende produzieren wir etwa 12 Original- und Mashup-Videos pro Tag, mit Token-Kosten von ca. 15 Yuan.“
„Das Kernproblem ist, die Token- und Rechenkosten mit den Gehältern für einfache Schnittarbeiten abzuwägen“, ergänzt er. „Man muss entscheiden, welche Aufgaben an ‚Lobster‘ gehen und welche manuell erledigt werden. Derzeit treiben viele Firmen ‚Lobster‘ nur zum Showoff, ohne echte Produktivität.“
Trotz 15 Yuan Token-Kosten pro Tag, was nicht viel erscheint, ist die große Nutzerbasis der Smartphone-Hersteller problematisch. Wenn Hunderte Millionen Nutzer an das Modell „Hardware kaufen, Service kostenlos“ gewöhnt sind, bleibt unklar, ob die Hersteller die enormen Rechen- und Token-Kosten langfristig tragen können.
„Zukünftig könnten Smartphone-Hersteller auf das Modell ‚Kauf des Handys inklusive Rechenleistung‘ setzen“, prognostiziert ein Insider. „Zum Beispiel beim Kauf eine bestimmte Menge kostenloser Tokens für einfache Aufgaben wie Berichte oder Ticketbuchungen. Für komplexe, rechenintensive Aufgaben wie Video-Generierung könnten separate Gebühren anfallen oder die Nutzer müssten die Mehrkosten selbst tragen.“