Der mythische GPT kann Ihr Traumauto nicht bauen

金色财经_

Nach der Explosion von ChatGPT ist das KI-Modell zu einem Brennpunkt für viele Technologieunternehmen geworden. Von Chat-Gesprächen über die Bildgenerierung bis hin zum Desktop-Büro scheint KI die übernatürliche Kraft zu haben, alles über Nacht zu untergraben.

Der Hype breitete sich auf die Automobilindustrie aus und die Praktiker begannen darüber nachzudenken: Ist es machbar, GPT Autos bauen zu lassen?

Einige Automobilhersteller kündigten an, dass sie die Technologie für Großmodelle einsetzen würden, während andere sagten, sie würden auf Großmodelle von Drittanbietern zugreifen, und einige Automobilhersteller beeilten sich, das automatische Fahrsystem mit dem Wort GPT herauszubringen.

Einige Praktizierende sagten Shentu, dass intelligentes Cockpit und automatisches Fahren die ersten Anwendungsszenarien großer Modelle sein könnten. Unter ihnen wird das autonome Fahren am meisten erwartet.

Autonomes Fahren ist ein extrem schwieriger Weg. Neben Technologiegiganten wie Google und Baidu haben sich eine Vielzahl talentierter Unternehmer dieser Aufgabe verschrieben und Milliarden von Dollar verbrannt, doch bisher konnten sie keine zufriedenstellenden Ergebnisse erzielen.

Das KI-Großmodell steigt in das automatische Fahren ein. Wird es dieses Mal anders sein?

Wie groß ist die Beziehung zwischen GPT und Autos?

GPT hat keine direkte Beziehung zu Autos an der Oberfläche, aber tatsächlich hat es eine tiefe Beziehung. Die Geschichte muss vor sechs Jahren beginnen.

Im Juni 2017 hat Musk, der Chef von Tesla, einen slowakischen Forscher von OpenAI abgeworben. Der Mann war Andrej Karpathy, der später Teslas KI-Direktor wurde.

Musk zeigte damals großes Interesse an künstlicher Intelligenz und war auch einer der Gründer von OpenAI. Kurz nach der Einstellung von Andrej Karpathy verließ Musk den Vorstand von OpenAI. Er glaubte, dass sowohl Tesla als auch OpenAI KI erforschten und es in Zukunft zu Interessenkonflikten kommen könnte.

Später schrieb Andrej Karpathy den Autopilot-Algorithmus in Tesla neu und entwickelte die reine visuelle Wahrnehmungstechnologie von BEV, die den Tesla-Autopiloten auf eine neue Stufe brachte. Und sein früherer Besitzer, OpenAI, setzte ganz auf allgemeine künstliche Intelligenz und entwickelte schließlich GPT.

Aus Produktsicht sind OpenAIs GPT und Teslas BEV völlig unterschiedliche Spezies. Aus Sicht der zugrunde liegenden Technologie basieren sie jedoch alle auf der Technologie der künstlichen Intelligenz, insbesondere auf der Anwendung des Google Transformer-Modells.

Transformer ist eine Deep-Learning-Architektur für neuronale Netzwerke, die 2017 von acht KI-Wissenschaftlern von Google vorgeschlagen wurde. Dies ist eine äußerst wichtige Erfindung in der Branche der künstlichen Intelligenz. Das „T“ im heute beliebten ChatGPT bezieht sich auf das Transformer-Modell.

Im Gegensatz zu den herkömmlichen neuronalen Netzwerken RNN und CNN verwendet Transformer den Selbstaufmerksamkeitsmechanismus, um die Verbindung und Korrelation verschiedener Elemente in der Sequenz zu ermitteln, und verfügt über gute Funktionen zur Verarbeitung von Zeitreihendaten. Dies ermöglicht eine herausragende Leistung bei Aufgaben wie maschineller Übersetzung, Textzusammenfassung und Fragen-Antwort-Systemen.

Daher wurde Transformer erstmals im Bereich NLP (Advanced Natural Language Processing) eingesetzt, um menschlichen Text und Sprache zu verstehen.

Vor dem Training auf dem Transformer-Modell hat OpenAI nach kontinuierlicher Feinabstimmung und Iteration nacheinander große Sprachtrainingsmodelle wie GPT-1, GPT-2, GPT-3 und GPT-4 eingeführt. ChatGPT ist ein Dialogroboter, der von OpenAI nach einer Feinabstimmung des GPT-3-Modells entwickelt wurde. Da es auf konversationelle Weise interagieren kann, ist es für normale Menschen einfach zu bedienen und es ist „intelligenter“ als Chatbots in der Vergangenheit, also glänzt es.

Grundsätzlich haben das GPT-Modell von ChatGPT, das LaMDA-Modell von Google und das Wenxin-Modell von Baidu alle denselben Ursprung.

Durch die Verwendung des Transformer-Modells für natürliche Sprache entstanden Chat-Anwendungen wie ChatGPT; auch der Einsatz in Computer Vision hat erstaunliche Ergebnisse erzielt. Der Pionier in dieser Hinsicht ist Tesla.

Andrej Karpathy war während seiner Amtszeit als KI-Direktor von Tesla für die Leitung des Computer-Vision-Teams für autonomes Fahren verantwortlich. Durch die Kombination des Transformer-Modells entwickelte Tesla erfolgreich die BEV-Technologie.

Der vollständige Name von BEV ist Bird’s Eye View, was eine Vogelperspektive bedeutet. Es kann die von der Kamera erfassten 2D-Bilder durch Spleißen in 3D-Bilder umwandeln und sie zur Verarbeitung gleichmäßig in den Blickwinkel umwandeln, wodurch eine „Gottesperspektive“ entsteht. Der Grund dafür ist, dass das Fahren in einem dreidimensionalen Raum stattfindet und die Menschen eine dreidimensionale Welt und kein zweidimensionales Bild sehen.

Diese brandneue Wahrnehmungslösung wird Andrej Karpathy am Tesla AI DAY im August 2021 demonstrieren. Aus diesem Grund zögerte Tesla nicht, den Autopilot-Algorithmus neu zu schreiben und die Infrastruktur für das Training tiefer neuronaler Netze neu aufzubauen.

Dies ist das erste Mal, dass die Großmodelltechnologie auf die autonome Fahrbranche angewendet wird.

Wenn wir heute zurückblicken, wird GPT zwar derzeit hauptsächlich im Bereich der Verarbeitung natürlicher Sprache eingesetzt, wir können GPT jedoch kein Auto fahren lassen, aber die KI-Großmodelltechnologie dahinter, insbesondere die Transformer-Architektur, fährt tatsächlich autonom. Feld angewendet.

Von der Verarbeitung natürlicher Sprache bis hin zu Computer Vision haben die beiden Bereiche die Modellierungsstruktur basierend auf der Transformer-Architektur vereinheitlicht, was die gemeinsame Modellierung erleichtert.

Und da sich das Verständnis von KI vertieft, ähneln Automobilunternehmen immer mehr Unternehmen der künstlichen Intelligenz. Neben Tesla kündigte auch Li Auto Anfang des Jahres seine Unternehmensvision an und behauptete, bis 2030 ein Unternehmen für künstliche Intelligenz zu werden. In diesem Jahr wird das städtische Navigationsassistenzsystem NOA auf den Markt gebracht. Die technische Unterstützung erfolgt durch das BEV-Wahrnehmungs- und Transformer-Modell.

Es scheint keinen Unterschied zu geben, ob man die KI mit Menschen sprechen lässt oder ob man die KI ein Auto fahren lässt, außer dass die Landungsszenarien der beiden unterschiedlich sind. Der Mensch ist immer voller Fantasie, wenn es darum geht, die zugrunde liegende Technologie auf bestimmte Produkte anzuwenden.

GPT lehrt diese Dinge über automatisches Fahren

Seit Anfang dieses Jahres haben die von GPT demonstrierten leistungsstarken Fähigkeiten die Außenwelt schockiert. Allgemeine künstliche Intelligenz ist kein Luftschloss mehr. Die Leute in der Branche des autonomen Fahrens begannen zu denken, dass die Anwendung generativer KI auf Sprachmodelle möglicherweise auf das autonome Fahren übertragen werden kann.

Im Wesentlichen ist ein Sprachmodell ein mathematisches Modell der menschlichen Sprache. Der Computer versteht die natürliche Sprache immer noch nicht, aber er verwandelt Sprachprobleme durch mathematische Modellierung in mathematische Probleme. Natürliche Sprache wird indirekt verstanden, indem man die Wahrscheinlichkeit vorhersagt, mit der das nächste Wort im Verlauf eines bestimmten Textes vorkommt.

Kann das große Modell beim Wechsel zur Fahrszene angesichts der aktuellen Verkehrsumgebung, einer Navigationskarte und der Fahrverhaltenshistorie eines Fahrers die nächste Fahraktion vorhersagen?

Yu Kai, der Gründer von Horizon, sagte auf dem Forum der 100 Elektrofahrzeuge im April dieses Jahres, dass ChatGPT ihn sehr inspiriert habe: „Wir werden weiterhin Big Data, größere Datenmengen, größere Modelle und unbeaufsichtigtes Lernen nutzen. Menschen versuchen es.“ fahren, so wie man aus einer großen Menge unbeaufsichtigten und unbeschrifteten natürlichen Texts lernt.“ Er argumentiert, dass die Abläufe der Fahrsteuerungen jedes Fahrers unseren Texten in natürlicher Sprache ähneln. Als nächstes möchte er ein großes Sprachmodell aufbauen, das zum autonomen Fahren zurückkehrt.

Theoretisch ist diese Idee machbar. KI verfügt bereits über die Fähigkeit zu lernen. Gemäß dem adaptiven Sprachmodell optimiert die Maschine weiterhin iterativ entsprechend dem Feedback des Benutzers, lernt die Gewohnheiten des Benutzers und verbessert dann das Modell. Das aktuelle ChatGPT nutzt diese Technologie. Dann ist es für die Maschine nicht schwierig, die Fahrgewohnheiten des Fahrers zu erlernen.

Der Schattenmodus von Tesla besteht darin, die Fahrdaten echter Fahrer dem maschinellen Lernen zuzuführen. Der Zweck des Trainings des Algorithmus wird durch den Vergleich des Verhaltens menschlicher Fahrer erreicht.

Nachdem GPT eine neue Runde des KI-Booms eingeleitet hat, besteht eine kognitive Auswirkung auf die Branche darin, dass durch die Vergrößerung der Parameterskala des Modells die Datenmenge exponentiell zunimmt, was dem sogenannten großen Modell entspricht. Nach Erreichen eines bestimmten kritischen Punkts , Models können plötzlich schlau sein.

In der Vergangenheit wurden die vom Modell während der Trainingsphase benötigten Daten manuell gekennzeichnet. Am Beispiel des autonomen Fahrens verwendet der Datenetikettierer eine große Anzahl von Bildern, um der Maschine zu kennzeichnen, was eine Katze ist, was ein Hund ist und wie viele Arten von Katzen und Hunden es gibt. Der Annotator ist wie der Lehrer der Maschine, der ihr immer wieder beibringt, die Welt zu verstehen.

Das Problem ist, was der Lehrer nicht gelehrt hat, kann die Maschine immer noch nicht. Ein typisches Beispiel ist, dass Tesla viele Male Autopilot-Unfälle hatte und das Fahrzeug einen großen Lastwagen traf, der umkippte, weil die Maschine ihn nicht erkennen konnte.

He Yuhua, der Gründungspartner von Hegao Capital, gab Shentu ein solches Beispiel: In Guangzhou gibt es im Sommer häufig Regentage, und in einigen Szenen mit gedämpftem Licht wird es eine große Anzahl fliegender Insekten in der Luft geben. Wenn ein Auto vorbeifährt, gehen die Lichter an und es können Tausende fliegender Insekten auf die Vorderseite des Autos treffen. In diesem Fall könnte das autonome Fahrwahrnehmungssystem des Fahrzeugs es mit einer Wand verwechseln.

Das automatische Fahrsystem kann nicht alle Eckfälle (Extremszenarien) ausschöpfen, was eine große Schwierigkeit bei seiner Entwicklung darstellt.

Was ChatGPT erfasst, sind die nicht markierten Daten des gesamten Netzwerks. Beim selbstüberwachten Lernen werden die Daten selbst als Überwachungssignal verwendet, anstatt sich auf von Menschen beschriftete Etiketten zu verlassen. Eines Tages entdeckten die Leute, dass das große Modell bei der Verarbeitung dieser Daten plötzlich die Fähigkeit besitzt, aus einer Instanz auf andere Fälle zu schließen.

Wenn also das große Modell des autonomen Fahrens auch unbeaufsichtigt menschliches Fahrverhalten erlernen kann, ohne dass ein „Lehrer“ zum Unterrichten erforderlich ist, bedeutet das dann, dass sich das System plötzlich verändert hat und zu einem „alten Fahrer“ geworden ist?

GPT „fahren“, ist nicht zuverlässig

Träume sind schön und der Weg zu ihrer Verwirklichung ist immer sehr schmal.

Damit ein KI-Modell ähnlich wie ChatGPT seine Leistungsfähigkeit im Bereich des autonomen Fahrens entfalten kann, müssen derzeit mindestens die folgenden Probleme gelöst werden.

Die erste ist die Datenquelle.

Die Datenquellen von ChatGPT sind sehr umfangreich, einschließlich Wikipedia, Büchern, Nachrichtenartikeln, wissenschaftlichen Zeitschriften usw., was den öffentlichen Daten des gesamten Netzwerks als Nahrung entspricht.

Autonomes Fahren ist anders. Die Fahrdaten des Fahrers und des Fahrzeugs werden nicht weitergegeben und viele davon betreffen den Datenschutz. Automobilhersteller und selbstfahrende Unternehmen arbeiten unabhängig voneinander, und die Daten werden vertraulich behandelt und nicht weitergegeben, was die Datenbeschaffung erschwert. Ohne Daten ist autonomes Fahren Wasser ohne Quelle.

He Zhiqiang, Präsident von Lenovo Venture Capital, sagte gegenüber Shentu, dass der Kern des autonomen Fahrens darin besteht, über Daten zu verfügen, und Daten seien für Trainingsmodelle sehr wichtig. OEMs wie BYD verfügen über Daten, aber ihre Algorithmen müssen noch verfeinert werden. Neuwagenhersteller wie „Wei Xiaoli“ sind gut in Algorithmen, aber ihre Autoverkäufe reichen nicht aus. Unternehmen, die sowohl über Daten als auch über Algorithmen verfügen, können große Modelle voll ausnutzen.

Der zweite Grund ist, dass die Computerbereitstellungsmethode des Systems begrenzt ist.

Yu Kai glaubt, dass OpenAI und ChatGPT in der Cloud rechnen und über eine ausreichende Energieversorgung, Stromversorgung und ein sehr gutes System verfügen. Wenn das Auto jedoch auf die Batterie und die Wärmeableitung des Autos angewiesen ist, dann ist dies die Herausforderung Großartig, was bedeutet, dass beim automatischen Fahren ein so großes Modell und eine so große Berechnung nicht verwendet werden können.

Der Verbrauch von Rechenleistung durch große Modelle hat dazu geführt, dass Cloud-Computing-Hersteller die ersten Akteure sind, die von dieser Welle des KI-Booms profitieren. Die Entwicklung des Cloud Computing durch große Unternehmen ebnet auch den Weg für große Modelle. Aber auf der Autoseite wird das ein Widerspruch sein.

Ein größeres Problem besteht darin, dass die Zuverlässigkeit großer Modelle nicht überprüft wurde.

Leute, die ChatGPT verwendet haben, wissen, dass ChatGPT manchmal Unsinn redet, manchmal richtig und manchmal falsch. In der Branche ist dies als „Tendenz zur Halluzination“ bekannt, die Tendenz, unwirkliche Inhalte zu produzieren, die keinerlei Herkunft haben. Große Models erfinden Dinge, ohne sich um deren Wahrhaftigkeit und Genauigkeit zu kümmern.

Chatten kann Unsinn sein, automatisches Fahren jedoch nicht. Das Ergebnis einer falschen Ausgabe kann fatal sein.

„ChatGPT hat große Fortschritte gemacht, aber das automatische Fahren ist noch nicht angekommen, da das automatische Fahren, insbesondere das unbemannte Fahren, möglicherweise eine Null-Fehlertoleranz-Rate aufweist, was eine Frage von Leben und Tod ist“, sagte Yu Kai.

Long Zhiyong, der einst COO eines KI-Start-up-Unternehmens im Silicon Valley war, glaubt, dass Unkontrollierbarkeit, Unvorhersehbarkeit und Unzuverlässigkeit die größten Bedrohungen für die Kommerzialisierung großer Modelle darstellen. Eine typische Manifestation ist, dass das große Modell zu Halluzinationen neigt.

Nun ist es für das automatische Fahrsystem nicht realistisch, zu lernen, auszuwählen und zu unterscheiden und die optimale Lösung stabil auszugeben.

Ein Insider eines Unternehmens für künstliche Intelligenz sagte gegenüber Shentu: „Es gibt tatsächlich viele Durchbrüche in der visuellen Wahrnehmung auf Algorithmusebene. Aber die Szene des Autos ist zu anspruchsvoll. Ich persönlich glaube nicht, dass es kurzfristig einen großen Durchbruch geben wird.“ . Sie können auf die besonderen Bewegungen des Sla achten.“

Allerdings gibt es in der Technologiebranche in letzter Zeit den Trend, dass große und kleine Unternehmen einen Blick auf die Hotspots von GPT werfen möchten. Einige Autohersteller haben angekündigt, GPT-ähnliche Technologie einzusetzen, und eine Reihe cooler Konzepte verwirren die Leute.

Beispielsweise hat ein Unternehmen für autonomes Fahren unter einem traditionellen Automobilhersteller ein großes generatives Modell für autonomes Fahren veröffentlicht, das als „das erste in der Branche“ bezeichnet wird und dieses Modell zum Trainieren autonomen Fahrens verwendet.

Ein Investor, der sich schon lange mit der Smart-Car-Strecke beschäftigt, fragte einen Branchenführer, was er von dem Modell halte, und die andere Partei antwortete mit vier Worten: „TM-Unsinn.“

„Es ist nur ein PR-Akt.“ Der Investor kommentierte Shentu.

Wird das autonome Fahren gestürzt und neu gestartet?

Angetrieben von Tesla und der in diesem Jahr aufkommenden KI-Welle nähert sich die Branche des autonomen Fahrens allmählich der Richtung großer Modelle, großer Rechenleistung und großer Datenmengen.

Die Auswirkungen großer Modelle auf das autonome Fahren sind noch nicht drastisch genug, doch Menschen mit einem ausgeprägten Geruchssinn zeigen eine Ambivalenz.

Genau wie damals, als Tesla Transformer nutzte, um Multikameradaten vom Bildraum in den BEV-Raum zu konvertieren, zögerte das Unternehmen nicht, die ursprüngliche Architektur zu stürzen und den Algorithmus neu zu schreiben. Der Einsatz großer Modelle kann jetzt auch dazu führen, dass der ursprüngliche automatische Fahralgorithmus gestürzt und neu gestartet wird.

He Zhiqiang glaubt, dass große Modelle einen großen Einfluss auf das autonome Fahren haben werden. Früher wurden viele kleine Modelle für das autonome Fahren verwendet, aber jetzt ist es ein großes Modell geworden, und es kann notwendig sein, es noch einmal zu machen. Die Branche des autonomen Fahrens wird neu strukturiert.

Zhao Dongxiang, Direktor für autonomes Fahren bei einem KI-Chip-Unternehmen, sagte gegenüber Shentu, dass die umfassende End-to-End-Änderung darauf hinauslaufe, alles noch einmal zu machen.

Das Mischen ist eine Chance für Neueinsteiger und eine Bedrohung für Führungskräfte. Die Geschichte des Überholens in einer Kurve spielt sich oft in einer Zeit schnellen technologischen Wandels ab. Im Zeitalter der schnellen Technologie können die versunkenen Kosten umso höher sein, je mehr in die alte Route investiert wird, und desto schwieriger ist es, eine Trendwende herbeizuführen. Für OEMs oder Unternehmen für autonomes Fahren müssen bei der Einführung einer neuen Technologie nicht nur die Auswirkungen, sondern auch die Kosten berücksichtigt werden.

Zhao Dongxiang sagte, dass es zum jetzigen Zeitpunkt bedeutungslos sei, den technischen Weg des automatischen Fahrens zu ändern. „Jetzt sind die technischen Fähigkeiten der Branche nicht schlecht. Jeder hat so viel Geld ausgegeben und das schon so lange gemacht. Wenn ja.“ Es gibt keine wesentliche Verbesserung, es besteht keine Motivation zur Veränderung.“

Am AI DAY Ende letzten Jahres hat Tesla das BEV zu einem Belegungsnetzwerk (Occupancy Network) aufgerüstet und die Generalisierungsfähigkeit weiter verbessert. Durch die Belegung des Netzwerks kann das Autopilot-Wahrnehmungssystem von Tesla beurteilen, ob es diesem ausweichen muss, ohne zu wissen, welches Objekt es sieht, und so weitere Long-Tail-Probleme lösen.

Unabhängig von der Art der technischen Route unterliegt sie derzeit schnellen Änderungen und Iterationen. Die kleinen Modelle der Vergangenheit könnten durch große Modelle ersetzt werden, und die heutigen großen Modelle könnten in Zukunft auch durch einige neue Arten ersetzt werden.

Aber auf jeden Fall ist die Praxis, Hotspots zu reiben und Spielereien zu machen, dem technischen Fortschritt nicht förderlich. „Es ist eine schlechte Angewohnheit, der Hitze zu folgen, und es ist nützlich, Produkte auf bodenständige Weise herzustellen“, sagte Zhao Dongxiang.

Die wahre „Königsbombe“ des autonomen Fahrens lässt auf sich warten. Was wir tun müssen, ist, vor jeder Runde des technologischen Wandels Ehrfurcht zu bewahren. Der mythische GPT kann Ihr Traumauto nicht bauen, aber es haben zumindest Veränderungen stattgefunden.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare