เป็นเทคโนโลยีไฮเทคที่เติบโตที่สุดในประวัติศาสตร์มนุษย์ โมเดลขนาดใหญ่ได้ดึงดูดความสนใจของทุกคน เว็บ 3 ซึ่งเป็นสิ่งที่เพิ่งเกิดขึ้นเมื่อวานนี้ก็ถูกท้าทานทางกฎหมายมากขึ้น แต่เมื่อพูดถึงเทคโนโลยีที่แตกต่างอย่างสิ้นเชิง ไม่มีการแทนที่กันระหว่างทั้งสอง ผู้ที่รับผิดชอบทีม “AI+Crypto Studio” บนเกาะ All Things - นายเทียน ฮ่องเฟย จะพูดคุยกับคุณเกี่ยวกับปัญหาที่พบในการพัฒนาโมเดลขนาดใหญ่และว่า บริษัทในด้านเว็บ 3 มุ่งมั่นที่จะแก้ปัญหาเหล่านี้
ตามทุกคนทราบกันดีว่าวงการอินเทอร์เน็ตได้เข้าสู่ระยะของออลิโกโปลีหลังจากปี 2015 และประเทศต่าง ๆ ทั่วโลกได้ดำเนินการตรวจสอบการกดขายของบริษัทพลัตฟอร์ม การเกิดขึ้นของโมเดลขนาดใหญ่ยิ่งทำให้ตำแหน่งของออลิโกโปลีมีความเป็นอโลโกโปรลีมากขึ้น โมเดลขนาดใหญ่รวมไปถึงอัลกอริทึม พลังคำนวณ และข้อมูล:
ด้วยผลลัพธ์ที่ได้ ยุค Big Model มีการควบคุมที่สำคัญมากกว่าที่เคยเป็นมาก่อน และโลกในอนาคตจะมีแนวโน้มที่จะถูกควบคุมโดยกลุ่มเล็กหรือแม้กระทั่งคอมพิวเตอร์เพียงเครื่องเดียว ( แม้ในโลก Web3 ที่ไม่มีการควบคุมจากศูนย์ End Game ที่พลวัตของ Vitalik สำหรับ Ethereum ก็จะถูกดำเนินการโดยเครื่องจักรขนาดใหญ่นอกเหนือจากบล็อก )
นอกจากนี้ บริษัท OpenAI ที่พัฒนา ChatGPT มีเพียงไม่กี่คนในทีมหลัก ๆ เนื่องจากเหตุผลต่าง ๆ อัลกอริทึมของ ChatGPT ยังไม่ได้เปิดเผยแบบโอเพน จนถึงตอนนี้ ธรรมชาติขององค์กรไม่แสวงหากำไรการประยุกต์ใช้ที่หลากหลายของ ChatGPT ได้เปลี่ยนแปลงชีวิตของมนุษย์ การปรับเปลี่ยนบางอย่างของโมเดล ChatGPT จะมีผลกระทบอย่างมากต่อมนุษย์ ในทางตรงกันข้ามกับหลักการของ Google ที่ไม่ทำความชั่วร้าย ChatGPT มีผลกระทบลึก ๆ ต่อคน
ดังนั้นความน่าเชื่อถือในการคำนวณของโมเดลจะกลายเป็นประเด็นสำคัญ แม้ว่า OpenAI สามารถดำเนินการเป็นองค์กรไม่แสวงหาผลกำไร การควบคุมพลังโดยบุคคลบางรายก็ยังมีผลกระทบที่เลวร้ายมากมาย (ในทวีความต่างกัน Ethereum End Game ที่เสนอโดย Vitalik ถูกสร้างขึ้นโดยเครื่องจะรักษาความโปร่งใสผ่านการตรวจสอบได้อย่างง่ายดายโดยสาธารณชน)
ในขณะเดียวกัน ยังมีปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่: ขาดกำลังคำนวณ ข้อมูลการฝึกที่มีพร้อมก็กำลังจะหมด และการแบ่งปันโมเดล ตามสถิติ ก่อนปี 2021 ปัญหาในอุตสาหกรรมปัญญาประดิษฐ์คือขาดข้อมูล และบริษัทดีพลีนนิ่งทั้งหมดกำลังมองหาข้อมูลในอุตสาหกรรมแนวตั้ง และหลังจากโมเดลขนาดใหญ่ ขาดกำลังคำนวณกลายเป็นอุปสรรค
การพัฒนาโมเดลขนาดใหญ่ถูกแบ่งออกเป็นหลายขั้นตอน: การเก็บข้อมูล การประมวลผลข้อมูล การฝึกโมเดล การปรับปรุงโมเดล และการสืบค้นการคำนวณการใช้งาน จากขั้นตอนเหล่านี้เราจะอธิบายอย่างสั้นเรื่องการมีส่วนร่วมของบล็อกเชนในโมเดลขนาดใหญ่และวิธีการต่อต้านความเสียหายจากความ-concentration มากเกินไปของโมเดลขนาดใหญ่
โดยเฉพาะ
พลังงานคำนวณเป็นปัจจัยการผลิตที่จำเป็นสำหรับโมเดลขนาดใหญ่ และเป็นปัจจัยการผลิตที่แพงที่สุดในปัจจุบัน ถึงขนาดที่ สตาร์ทอัพที่เพิ่งระดมทุนได้จะต้องโอน 80% ของทุนของพวกเขาไปยัง NVIDIA เพื่อซื้อ GPU บริษัทที่ผลิตโมเดลขนาดใหญ่ของตนเองต้องใช้เงินอย่างน้อย 50 ล้านเหรียญเพื่อสร้างศูนย์ข้อมูลของตนเอง ในขณะที่ สตาร์ทอัพขนาดเล็กต้องซื้อบริการคอมพิวเตอร์คลาวด์ที่แพง
อย่างไรก็ตาม ความนิยมในระยะสั้นของโมเดลขนาดใหญ่และการใช้ทรัพยากรคอมพิวเตอร์โดยโมเดลขนาดใหญ่เองได้เกินกว่าความสามารถในการจัดหาของ NVIDIA ตามสถิติ ความต้องการในด้านพลังการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้นสองเท่าทุกๆ หลายเดือน ระหว่างปี 2012 ถึง 2018 ความต้องการในด้านพลังการคำนวณเพิ่มขึ้นถึง 300,000 เท่า และค่าใช้จ่ายในการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้น 31 เท่าทุกปี
สำหรับบริษัทอินเทอร์เน็ตจีน พวกเขาต้องเผชิญกับการขัดข้องจากสหรัฐต่อ GPU ระดับสูง สามารถบอกได้ว่าค่าฝึกอบรมที่มากมายเป็นเหตุผลหลักที่เทคโนโลยีโมเดลใหญ่ถูกควบคุมโดยผู้เรียนเพียงเพียงไม่กี่คน
ดังนั้นวิธีการแก้ปัญหาพลังการคำนวณของโมเดลขนาดใหญ่ผ่านบล็อกเชนคืออะไรครับ?
การพิจารณาถึงการผลิตโมเดลขนาดใหญ่ มันสามารถแบ่งออกเป็นการฝึกโมเดลขนาดใหญ่ การปรับปรุงแก้ไขอย่างละเอียดและการคำนวณการสืบค้นของผู้ใช้ แม้ว่าการฝึกโมเดลขนาดใหญ่จะเป็นที่รู้จักว่าเป็นค่าใช้จ่ายที่สูง แต่เวอร์ชันของโมเดลขนาดใหญ่เพียงเพียงต้องสร้างขึ้นมาเพียงครั้งเดียว ในส่วนมากของเวลา สำหรับผู้ใช้บริการโมเดลขนาดใหญ่ การคำนวณการสืบค้นเท่านั้นที่จำเป็น ตามสถิติของ AWS ก็ยืนยันว่า 80% ของพลังการคำนวณจริงๆถูกใช้ไปในการคำนวณการสืบค้น
การฝึกอบรมของโมเดลขนาดใหญ่ต้องใช้ความสามารถในการสื่อสารที่เร็วระหว่าง GPU แต่ไม่สามารถทำเสร็จบนเครือข่ายได้ (นอกจากว่าคุณจะเลือกแลกเวลาให้ต่ออายุเพื่อลดต้นทุน). แต่การคำนวณการอ่านค่าทำได้บน GPU เดียว. การปรับแต่งละเอียดจะขึ้นอยู่กับโมเดลขนาดใหญ่ที่ได้รับและข้อมูลที่มีคุณภาพ เพราะฉะนั้นจึงต้องใช้ทรัพยากรคำนวณน้อยกว่าการฝึกอบรมโมเดลขนาดใหญ่มากๆ
เมื่อพูดถึงการเรนเดอร์กราฟิกเป็นที่ชัดเจนว่า GPU ของผู้บริโภคทํางานได้ดีกว่า GPU ขององค์กรและไม่ได้ใช้งานเกือบตลอดเวลา ตั้งแต่มหาวิทยาลัยแคลิฟอร์เนียเบิร์กลีย์เปิดตัว SETI เพื่อค้นหามนุษย์ต่างดาวในปี 1999 และ Grid Computing ได้รับความนิยมในปี 2000 มีสถาปัตยกรรมทางเทคนิคบางอย่างที่ใช้ทรัพยากรคอมพิวเตอร์ที่ไม่ได้ใช้งานเพื่อทํางานร่วมกันเพื่อทํางานคอมพิวเตอร์ขนาดใหญ่ให้เสร็จ ก่อนการเกิดขึ้นของบล็อกเชนความร่วมมือเหล่านี้มักจะมุ่งเน้นไปที่งานทางวิทยาศาสตร์และอาศัยความกระตือรือร้นและการมีส่วนร่วมด้านสวัสดิการสาธารณะของผู้เข้าร่วม ตอนนี้ใช้เทคโนโลยีบล็อกเชนแอปพลิเคชันที่หลากหลายสามารถจูงใจผ่านโทเค็น
เช่นเดียวกับโครงการคลาวด์คอมพิวติ้งแบบกระจายอํานาจ Akash เครือข่ายคอมพิวเตอร์ทั่วไปได้รับการจัดตั้งขึ้นและผู้ใช้สามารถปรับใช้โมเดลแมชชีนเลิร์นนิงสําหรับการคํานวณเหตุผลและการแสดงภาพ นอกจากนี้ยังมีโครงการ AI ที่ใช้บล็อกเชนเช่น Bittensor, Modulus Lab, Giza และ ChainML ซึ่งทั้งหมดนี้มุ่งเป้าไปที่การคํานวณการอนุมานแบบสอบถาม
โปรโตคอลการคำนวณ AI บล็อกเชน Gensyn และแพลตฟอร์ม AI แบบสร้างสรรค์โอเพนซอร์ส Together มุ่งมั่นที่จะสร้างเครือข่ายการคำนวณที่จำกัดที่บริการการฝึกโมเดลขนาดใหญ่
ความท้าทาย: สำหรับเครือข่ายการคำนวณแบบกระจาย ความยากลำบากไม่ได้อยู่เฉพาะ อย่างเครื่องคอมพิวเตอร์ที่มีความเร็วต่ำและเครือข่ายการสื่อสารที่ไม่เชื่อถือได้ ความไม่สามารถในการซิงโครไนซ์สถานะการคำนวณ การจัดการกับสภาพแวดล้อมการคำนวณประเภท GPU หลายแบบ แต่ยังต้องจัดการกับกระตุ้นเศรษฐกิจ การโกงของผู้เข้าร่วม การพิสูจน์ภาระงาน ความปลอดภัย การป้องกันความเป็นส่วนตัว และการโจมตีแอนติสแปม
อัลกอริทึมหลักของโมเดลขนาดใหญ่ การเรียนรู้แบบเสริม (RLHF) ต้องการความมีส่วนร่วมของมนุษย์ในการปรับปรุงการฝึกอบรมเพื่อแก้ไขข้อผิดพลาดและกำจัดความลำเอียงและข้อมูลที่เป็นอันตราย OpenAI ใช้ RLHF ในการปรับปรุง GPT3 เพื่อสร้าง ChatGPT ในขั้นตอนนี้ OpenAI พบว่ามีผู้เชี่ยวชาญจากกลุ่ม Facebook และจ่ายค่าแรงแก่คนงานเคนย่า 2 ดอลลาร์ต่อชั่วโมง การฝึกอบรมเพื่อปรับปรุงในบางครั้งต้องการความมีส่วนร่วมของผู้เชี่ยวชาญด้านข้อมูลจากสาขาที่เฉพาะเจาะจง และการนำไปใช้งานสามารถรวมกับวิธีการสร้างสติ๊กเกอร์เพื่อส่งเสริมการมีส่วนร่วมของชุมชนได้อย่างเต็มที่
อุตสาหกรรมระบบพื้นฐานทางกายภาพที่ไม่มีการกำหนด (DePINs) ใช้โทเค็นเพื่อกระตุ้นผู้คนให้แบ่งปันข้อมูลจริง ๆ แบบ real-time จากโลกทางกายตามเซ็นเซอร์สำหรับการฝึกโมเดลต่าง ๆ รวมถึง: React รวบรวมข้อมูลการใช้พลังงาน, DIMO รวบรวมข้อมูลการขับขี่รถ, WeatherXM รวบรวมข้อมูลอากาศ, และ Hivemapper รวบรวมข้อมูลแผนที่ผ่านการกระตุ้นโทเค็นเพื่อกระตุ้นผู้คนให้ทำเครื่องหมายป้ายจราจรและช่วยให้อัลกอริทึมการเรียนรู้ของ RLHF ของตนปรับปรุงความแม่นยำ
ในขณะเดียวกันเมื่อพารามิเตอร์ของโมเดลขนาดใหญ่เพิ่มขึ้นข้อมูลสาธารณะที่มีอยู่จะหมดลงภายในปี 2030 และความคืบหน้าอย่างต่อเนื่องของโมเดลขนาดใหญ่จะต้องพึ่งพาข้อมูลส่วนตัว จํานวนข้อมูลส่วนตัวเป็น 10 เท่าของข้อมูลสาธารณะ แต่กระจัดกระจายอยู่ในมือขององค์กรและบุคคลและเป็นส่วนตัวและเป็นความลับในธรรมชาติทําให้ยากต่อการแสวงหาประโยชน์ ภาวะที่กลืนไม่เข้าคายไม่ออกสองครั้งเกิดขึ้น ในอีกด้านหนึ่งโมเดลขนาดใหญ่ต้องการข้อมูล แต่แม้ว่าฝ่ายที่มีข้อมูลต้องการโมเดลขนาดใหญ่ แต่ก็ไม่ต้องการส่งมอบข้อมูลให้กับโมเดลขนาดใหญ่ ปัญหาคู่นี้สามารถแก้ไขได้ด้วยเทคโนโลยีในสาขาบล็อกเชน
สำหรับโมเดลการอ่านแบบโอเพนซอร์ส โดยเนื่องจากว่าต้องใช้ทรัพยากรคำนวณน้อยกว่า จึงสามารถดาวน์โหลดโมเดลไปยังส่วนข้อมูลเพื่อดำเนินการ สำหรับโมเดลที่ไม่สาธารณะหรือโมเดลขนาดใหญ่ ต้องทำการตกความไว้ก่อนและอัปโหลดไปยังส่วนจบของโมเดล วิธีการตกความไว้รวมถึงข้อมูลสังเคราะห์และพิสูจน์ความรู้ศูนย์
ไม้มีส่วนไหนว่าโมเดลถูกดาวน์โหลดไปที่ด้านข้อมูลหรือว่าข้อมูลถูกอัปโหลดไปที่ด้านโมเดล ปัญหาเกี่ยวกับอำนาจจำเป็นต้องแก้ไขเพื่อป้องกันการโกงโมเดลหรือข้อมูล
ท้าทาย: หรือ ถึงแม้ว่าการกระตุ้นโทเค็นของ Web3 สามารถช่วยในการแก้ไขปัญหานี้ ปัญหาการโกงกลับต้องถูกแก้ไข
ในชุมชน Civitai แห่งนี้ โลกของแพลตฟอร์มการแบ่งปันโมเดลการวาด AI ที่ใหญ่ที่สุดในโลก ผู้คนแบ่งปันโมเดลและสามารถคัดลอกโมเดลได้ง่าย และปรับเปลี่ยนโมเดลเพื่อสร้างโมเดลที่ตอบสนองตามความต้องการของตนเองได้อย่างง่ายดาย
Bittensor, โครงการบล็อกเชน AI แห่งรุ่นใหม่ที่เปิดเป็นโอเพนซอร์สและมีความเห็นร่วม ได้ออกแบบรูปแบบของโมเดลที่กระตุ้นโทเคน โดยอ้างอิงจากกลไกความร่วมมือของผู้เชี่ยวชาญหลายคน โดยร่วมกันสร้างโมเดลในการแก้ปัญหาและสนับสนุนการจำแนกองค์ความรู้ ซึ่งสามารถแบ่งปันระหว่างโมเดล ข้อมูล การฝึกอบรมที่เร่งด่วน ซึ่งมุ่งเน้นการให้โอกาสแก่ธุรกิจรุ่นใหม่มากมายในการเข้าร่วมโมเดลขนาดใหญ่
เป็นเครือข่ายรวมสำหรับบริการออฟเชน เช่น การอัตโนมัติ ออรัคเทล และ AI ร่วม ออโตโนลัส ออกแบบกรอบความร่วมมือสำหรับตัวแทนเพื่อเดินทางสู่การตกลงผ่าน Tendermint
ท้าทาย: การฝึกอบรมของโมเดลมากมายยังต้องการการสื่อสารมากมาย และความเชื่อถือได้และประสิทธิภาพทางเวลาของการฝึกอบรมแบบกระจายยังเป็นอุปสรรคที่ใหญ่
ในการร่วมมือกับที่กล่าวถึงข้างต้นว่า Web3 สามารถใช้เพื่อแก้ไขบางปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่ การผสมผสานของแรงกระทบสองสิ่งสำคัญจะส่งผลให้เกิดประยุกต์ใช้ที่น่าสนใจบ้าง
เร็ว ๆ นี้ศิลปิน NFT ใช้ทักษะเพื่อดำเนินการ ChatGPT โดยไม่มีความรู้ในการเขียนโปรแกรมเพื่อเปิดตัวสัญญาอัจฉริยะของตัวเองและออกโทเค็น Turboner ศิลปินใช้ YouTube เพื่อบันทึกรายการสร้างของเขาเป็นเวลา 1 สัปดาห์ และทำให้ทุกคนได้รับแรงบันดาลใจที่จะใช้ ChatGPT มาร่วมสร้างสัญญาอัจฉริยะ
การพัฒนาโมเดลขนาดใหญ่ได้ปรับปรุงความฉลาดของผู้ช่วยอัจฉริยะอย่างมากและเมื่อรวมกับการชําระเงินที่เข้ารหัสผู้ช่วยอัจฉริยะจะสามารถประสานงานทรัพยากรได้มากขึ้นและทํางานร่วมกันมากขึ้นในตลาดผู้ช่วยอัจฉริยะ AutoGPT แสดงให้เห็นถึงการพึ่งพาบัตรเครดิตที่ผู้ใช้จัดหาให้และเขาสามารถช่วยให้ผู้ใช้ซื้อทรัพยากรการประมวลผลแบบคลาวด์และการจองเที่ยวบินโดยอัตโนมัติ แต่ถูก จํากัด ด้วยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ และความสามารถของ AutoGPT ถูก จํากัด อย่างรุนแรงโดยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ การออกแบบ Multi Agent System (MAS) รวมถึง Contract Net Protocol รวมถึงการทํางานร่วมกันของผู้ช่วยอัจฉริยะหลายคนในตลาดเปิดและหากได้รับการสนับสนุนจากโทเค็นการทํางานร่วมกันดังกล่าวจะทําลายการทํางานร่วมกันที่ จํากัด บนพื้นฐานของความไว้วางใจและกลายเป็นความร่วมมือขนาดใหญ่ตามเศรษฐกิจตลาดเช่นเดียวกับที่สังคมมนุษย์ย้ายจากสังคมดั้งเดิมไปสู่สังคมการเงิน
การประยุกต์ใช้เทคโนโลยี zkp (Zero Knowledge Proof) ในบล็อกเชนแบ่งออกเป็นสองประเภท หนึ่งคือการแก้ปัญหาประสิทธิภาพของบล็อกเชนโดยการถ่ายโอนข้อกําหนดการประมวลผลไปยัง off-chain จากนั้นไปยังการรับรองแบบ on-chain ผ่าน zkp ประเภทที่สองใช้เพื่อปกป้องความเป็นส่วนตัวของธุรกรรม การประยุกต์ใช้ zkp ในรุ่นขนาดใหญ่รวมถึงการคํานวณแบบจําลองที่เชื่อถือได้ (เพื่อพิสูจน์ความสอดคล้องและความถูกต้องของการคํานวณแบบจําลอง) และการคํานวณความเป็นส่วนตัวของข้อมูลการฝึกอบรม ในสภาพแวดล้อมแบบกระจายอํานาจผู้ให้บริการของโมเดลจําเป็นต้องพิสูจน์ให้ลูกค้าเห็นว่าโมเดลที่ขายเป็นโมเดลที่สัญญาไว้กับลูกค้าโดยไม่ต้องตัดมุม สําหรับคู่ค้าข้อมูลการฝึกอบรมพวกเขาจําเป็นต้องมีส่วนร่วมในการฝึกอบรมหรือใช้แบบจําลองบนสมมติฐานของการปกป้องความเป็นส่วนตัวของตนเอง . แม้ว่า zkp จะมีความเป็นไปได้อยู่บ้าง แต่ก็ยังมีความท้าทายมากมาย และโซลูชันต่างๆ เช่น การประมวลผลแบบโฮโมมอร์ฟิกและการประมวลผลความเป็นส่วนตัวแบบรวมศูนย์ยังไม่บรรลุนิติภาวะ
นอกจากมีโรงเรียนที่กล่าวถึงข้างต้น ยังมีโรงเรียนอีกหนึ่งโรงเรียนที่ไม่ได้รับความสนใจอย่างแพร่หลายเนื่องจากขาดของสิทธิแรงจูงใช้โทเเคนและการใช้งานแอปพลิเคชันบล็อกเชนแบบมินิมอลิสต์
สถาปัตยกรรมที่ใช้ BEC มีความคล้ายคลึงกับแนวคิดของ Web5 ที่ Jack Dorsey กล่าวถึงและ Solid โดย Tim Berners-Lee ในหลายด้าน
พวกเขาคิดว่าทั้งหมด
เมื่อโหนดนี้สอดคล้องกับแต่ละคนและควบคุมโดยแต่ละจัดเก็บข้อมูลส่วนบุคคลและโหลดโมเดลขนาดใหญ่ตัวแทนอัจฉริยะส่วนบุคคล (ตัวแทน) ส่วนบุคคลที่ได้รับการคุ้มครองความเป็นส่วนตัว 100% สามารถฝึกอบรมได้ Dr. Gong Ting หุ้นส่วนผู้ก่อตั้งชาวจีนของ SIG เปรียบเทียบโหนดส่วนตัวในอนาคตกับเมฆส่วนตัวเหนือศีรษะของ Olaf ใน "Frozen" ที่ติดตามเขาเสมอ
ในทางนี้ อวาตาร์ใน Metaverse จะไม่เป็นรูปภาพที่ควบคุมโดยแป้นพิมพ์อีกต่อไป แต่เป็นตัวแทนที่มีวิญญาณ เขาสามารถศึกษาข่าวออนไลน์ ประมวลผลอีเมล และแม้กระทั้งตอบกลับข้อความแชทสังคมของคุณโดยอัตโนมัติ 24 ชั่วโมงต่อวัน (สำหรับแฟนสาวที่ดื้อ คุณอาจต้องมีวิธีตรวจสอบว่าแฟนหนุ่มของคุณกำลังใช้ตัวแทนในการจัดการกับคุณในอนาคต) เมื่อตัวแทนของคุณต้องการทักษะใหม่ เหมือนกับการติดตั้งแอปบนโทรศัพท์มือถือ คุณสามารถติดตั้งแอปใหม่ในโหนดของคุณ
ในประวัติศาสตร์ ด้วยการแพลตฟอร์มาไลเซชันของการพัฒนาของอินเทอร์เน็ต แม้ว่าเวลาสำหรับการเกิดของบริษัทยูนิคอร์นจะกลายเป็นเวลาสั้นลงทุกครั้ง แต่มันกลับกลายเป็นที่เสียหายต่อการพัฒนาของสตาร์ตอัพ
ด้วยแพลตฟอร์มการกระจายเนื้อหาที่มีประสิทธิภาพที่ Google และ Facebook ให้บริการ โดยที่ YouTube ซึ่งเกิดขึ้นในปี 2005 ถูกซื้อโดย Google ในราคา 1.6 พันล้านเหรียญสหรัฐเพียงหนึ่งปีต่อมา
พร้อมกับแพลตฟอร์มการกระจายแอปพลิเคชันที่มีประสิทธิภาพของ Apple App Store Instagram ได้ถูกก่อตั้งขึ้นในปี 2012 โดยมีคนทั้งหมดเพียง 10 คนเท่านั้น และได้ถูก Facebook เข้าซื้อในปี 2012 ด้วยมูลค่า 1 พันล้านดอลลาร์สหรัฐ
ด้วยความสนับสนุนจากโมเดลขนาดใหญ่ ChatGPT บริษัท Midjourney ที่มีเพียง 11 คน ได้รายได้ประมาณ 100 ล้าน ดอลลาร์สหรัฐต่อปี และ OpenAI ซึ่งมีไม่เกิน 100 คน มีมูลค่าเกิน 20 พันล้าน ดอลลาร์สหรัฐ
บริษัท แพลตฟอร์มอินเทอร์เน็ตกําลังมีประสิทธิภาพมากขึ้นเรื่อย ๆ และการเกิดขึ้นของโมเดลขนาดใหญ่ไม่ได้เปลี่ยนรูปแบบที่มีอยู่ของอินเทอร์เน็ตที่ถูกผูกขาดโดยองค์กรขนาดใหญ่ องค์ประกอบทั้งสามของโมเดลขนาดใหญ่อัลกอริทึมข้อมูลและพลังการประมวลผลยังคงผูกขาดโดยองค์กรขนาดใหญ่ บริษัท สตาร์ทอัพไม่มีความสามารถในการคิดค้นโมเดลขนาดใหญ่และไม่มีความแข็งแกร่งทางการเงินในการฝึกอบรมโมเดลขนาดใหญ่ พวกเขาสามารถมุ่งเน้นไปที่การประยุกต์ใช้โมเดลขนาดใหญ่ในแนวตั้งเท่านั้น แม้ว่าโมเดลขนาดใหญ่ดูเหมือนจะส่งเสริมความนิยมของความรู้ แต่พลังที่แท้จริงถูกควบคุมโดยคนไม่เกิน 100 คนในโลกที่มีความสามารถในการผลิตแบบจําลอง
หากโมเดลขนาดใหญ่แทรกซึมเข้าไปในทุกแง่มุมของชีวิตของผู้คนในอนาคตและคุณถาม ChatGPT เกี่ยวกับอาหารประจําวันสุขภาพอีเมลงานของคุณและจดหมายทนายความของคุณในทางทฤษฎีผู้ที่เชี่ยวชาญโมเดลขนาดใหญ่จะต้องแอบเปลี่ยนพารามิเตอร์บางอย่างเท่านั้น มันสามารถส่งผลกระทบอย่างมากต่อชีวิตของผู้คนนับไม่ถ้วน การว่างงานบางอย่างที่เกิดจากโมเดลขนาดใหญ่อาจได้รับการแก้ไขผ่าน UBI หรือ Worldcoin แต่ผลที่ตามมาของความเป็นไปได้ของความชั่วร้ายที่เกิดจากโมเดลขนาดใหญ่ที่ถูกควบคุมโดยคนไม่กี่คนนั้นร้ายแรงกว่า นี่คือความตั้งใจเดิมของ OpenAI แม้ว่า OpenAI จะแก้ปัญหาที่ขับเคลื่อนด้วยผลกําไรด้วยวิธีการที่ไม่แสวงหาผลกําไร แต่จะแก้ปัญหาที่ขับเคลื่อนด้วยพลังงานได้อย่างไร? เห็นได้ชัดว่าโมเดลขนาดใหญ่ฝึกโมเดลความรู้อย่างรวดเร็วโดยใช้ความรู้ที่มนุษย์สะสมมานานหลายทศวรรษและแบ่งปันได้อย่างอิสระบนอินเทอร์เน็ต แต่โมเดลนี้ถูกควบคุมโดยคนจํานวนน้อยมาก
株式
内容
เป็นเทคโนโลยีไฮเทคที่เติบโตที่สุดในประวัติศาสตร์มนุษย์ โมเดลขนาดใหญ่ได้ดึงดูดความสนใจของทุกคน เว็บ 3 ซึ่งเป็นสิ่งที่เพิ่งเกิดขึ้นเมื่อวานนี้ก็ถูกท้าทานทางกฎหมายมากขึ้น แต่เมื่อพูดถึงเทคโนโลยีที่แตกต่างอย่างสิ้นเชิง ไม่มีการแทนที่กันระหว่างทั้งสอง ผู้ที่รับผิดชอบทีม “AI+Crypto Studio” บนเกาะ All Things - นายเทียน ฮ่องเฟย จะพูดคุยกับคุณเกี่ยวกับปัญหาที่พบในการพัฒนาโมเดลขนาดใหญ่และว่า บริษัทในด้านเว็บ 3 มุ่งมั่นที่จะแก้ปัญหาเหล่านี้
ตามทุกคนทราบกันดีว่าวงการอินเทอร์เน็ตได้เข้าสู่ระยะของออลิโกโปลีหลังจากปี 2015 และประเทศต่าง ๆ ทั่วโลกได้ดำเนินการตรวจสอบการกดขายของบริษัทพลัตฟอร์ม การเกิดขึ้นของโมเดลขนาดใหญ่ยิ่งทำให้ตำแหน่งของออลิโกโปลีมีความเป็นอโลโกโปรลีมากขึ้น โมเดลขนาดใหญ่รวมไปถึงอัลกอริทึม พลังคำนวณ และข้อมูล:
ด้วยผลลัพธ์ที่ได้ ยุค Big Model มีการควบคุมที่สำคัญมากกว่าที่เคยเป็นมาก่อน และโลกในอนาคตจะมีแนวโน้มที่จะถูกควบคุมโดยกลุ่มเล็กหรือแม้กระทั่งคอมพิวเตอร์เพียงเครื่องเดียว ( แม้ในโลก Web3 ที่ไม่มีการควบคุมจากศูนย์ End Game ที่พลวัตของ Vitalik สำหรับ Ethereum ก็จะถูกดำเนินการโดยเครื่องจักรขนาดใหญ่นอกเหนือจากบล็อก )
นอกจากนี้ บริษัท OpenAI ที่พัฒนา ChatGPT มีเพียงไม่กี่คนในทีมหลัก ๆ เนื่องจากเหตุผลต่าง ๆ อัลกอริทึมของ ChatGPT ยังไม่ได้เปิดเผยแบบโอเพน จนถึงตอนนี้ ธรรมชาติขององค์กรไม่แสวงหากำไรการประยุกต์ใช้ที่หลากหลายของ ChatGPT ได้เปลี่ยนแปลงชีวิตของมนุษย์ การปรับเปลี่ยนบางอย่างของโมเดล ChatGPT จะมีผลกระทบอย่างมากต่อมนุษย์ ในทางตรงกันข้ามกับหลักการของ Google ที่ไม่ทำความชั่วร้าย ChatGPT มีผลกระทบลึก ๆ ต่อคน
ดังนั้นความน่าเชื่อถือในการคำนวณของโมเดลจะกลายเป็นประเด็นสำคัญ แม้ว่า OpenAI สามารถดำเนินการเป็นองค์กรไม่แสวงหาผลกำไร การควบคุมพลังโดยบุคคลบางรายก็ยังมีผลกระทบที่เลวร้ายมากมาย (ในทวีความต่างกัน Ethereum End Game ที่เสนอโดย Vitalik ถูกสร้างขึ้นโดยเครื่องจะรักษาความโปร่งใสผ่านการตรวจสอบได้อย่างง่ายดายโดยสาธารณชน)
ในขณะเดียวกัน ยังมีปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่: ขาดกำลังคำนวณ ข้อมูลการฝึกที่มีพร้อมก็กำลังจะหมด และการแบ่งปันโมเดล ตามสถิติ ก่อนปี 2021 ปัญหาในอุตสาหกรรมปัญญาประดิษฐ์คือขาดข้อมูล และบริษัทดีพลีนนิ่งทั้งหมดกำลังมองหาข้อมูลในอุตสาหกรรมแนวตั้ง และหลังจากโมเดลขนาดใหญ่ ขาดกำลังคำนวณกลายเป็นอุปสรรค
การพัฒนาโมเดลขนาดใหญ่ถูกแบ่งออกเป็นหลายขั้นตอน: การเก็บข้อมูล การประมวลผลข้อมูล การฝึกโมเดล การปรับปรุงโมเดล และการสืบค้นการคำนวณการใช้งาน จากขั้นตอนเหล่านี้เราจะอธิบายอย่างสั้นเรื่องการมีส่วนร่วมของบล็อกเชนในโมเดลขนาดใหญ่และวิธีการต่อต้านความเสียหายจากความ-concentration มากเกินไปของโมเดลขนาดใหญ่
โดยเฉพาะ
พลังงานคำนวณเป็นปัจจัยการผลิตที่จำเป็นสำหรับโมเดลขนาดใหญ่ และเป็นปัจจัยการผลิตที่แพงที่สุดในปัจจุบัน ถึงขนาดที่ สตาร์ทอัพที่เพิ่งระดมทุนได้จะต้องโอน 80% ของทุนของพวกเขาไปยัง NVIDIA เพื่อซื้อ GPU บริษัทที่ผลิตโมเดลขนาดใหญ่ของตนเองต้องใช้เงินอย่างน้อย 50 ล้านเหรียญเพื่อสร้างศูนย์ข้อมูลของตนเอง ในขณะที่ สตาร์ทอัพขนาดเล็กต้องซื้อบริการคอมพิวเตอร์คลาวด์ที่แพง
อย่างไรก็ตาม ความนิยมในระยะสั้นของโมเดลขนาดใหญ่และการใช้ทรัพยากรคอมพิวเตอร์โดยโมเดลขนาดใหญ่เองได้เกินกว่าความสามารถในการจัดหาของ NVIDIA ตามสถิติ ความต้องการในด้านพลังการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้นสองเท่าทุกๆ หลายเดือน ระหว่างปี 2012 ถึง 2018 ความต้องการในด้านพลังการคำนวณเพิ่มขึ้นถึง 300,000 เท่า และค่าใช้จ่ายในการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้น 31 เท่าทุกปี
สำหรับบริษัทอินเทอร์เน็ตจีน พวกเขาต้องเผชิญกับการขัดข้องจากสหรัฐต่อ GPU ระดับสูง สามารถบอกได้ว่าค่าฝึกอบรมที่มากมายเป็นเหตุผลหลักที่เทคโนโลยีโมเดลใหญ่ถูกควบคุมโดยผู้เรียนเพียงเพียงไม่กี่คน
ดังนั้นวิธีการแก้ปัญหาพลังการคำนวณของโมเดลขนาดใหญ่ผ่านบล็อกเชนคืออะไรครับ?
การพิจารณาถึงการผลิตโมเดลขนาดใหญ่ มันสามารถแบ่งออกเป็นการฝึกโมเดลขนาดใหญ่ การปรับปรุงแก้ไขอย่างละเอียดและการคำนวณการสืบค้นของผู้ใช้ แม้ว่าการฝึกโมเดลขนาดใหญ่จะเป็นที่รู้จักว่าเป็นค่าใช้จ่ายที่สูง แต่เวอร์ชันของโมเดลขนาดใหญ่เพียงเพียงต้องสร้างขึ้นมาเพียงครั้งเดียว ในส่วนมากของเวลา สำหรับผู้ใช้บริการโมเดลขนาดใหญ่ การคำนวณการสืบค้นเท่านั้นที่จำเป็น ตามสถิติของ AWS ก็ยืนยันว่า 80% ของพลังการคำนวณจริงๆถูกใช้ไปในการคำนวณการสืบค้น
การฝึกอบรมของโมเดลขนาดใหญ่ต้องใช้ความสามารถในการสื่อสารที่เร็วระหว่าง GPU แต่ไม่สามารถทำเสร็จบนเครือข่ายได้ (นอกจากว่าคุณจะเลือกแลกเวลาให้ต่ออายุเพื่อลดต้นทุน). แต่การคำนวณการอ่านค่าทำได้บน GPU เดียว. การปรับแต่งละเอียดจะขึ้นอยู่กับโมเดลขนาดใหญ่ที่ได้รับและข้อมูลที่มีคุณภาพ เพราะฉะนั้นจึงต้องใช้ทรัพยากรคำนวณน้อยกว่าการฝึกอบรมโมเดลขนาดใหญ่มากๆ
เมื่อพูดถึงการเรนเดอร์กราฟิกเป็นที่ชัดเจนว่า GPU ของผู้บริโภคทํางานได้ดีกว่า GPU ขององค์กรและไม่ได้ใช้งานเกือบตลอดเวลา ตั้งแต่มหาวิทยาลัยแคลิฟอร์เนียเบิร์กลีย์เปิดตัว SETI เพื่อค้นหามนุษย์ต่างดาวในปี 1999 และ Grid Computing ได้รับความนิยมในปี 2000 มีสถาปัตยกรรมทางเทคนิคบางอย่างที่ใช้ทรัพยากรคอมพิวเตอร์ที่ไม่ได้ใช้งานเพื่อทํางานร่วมกันเพื่อทํางานคอมพิวเตอร์ขนาดใหญ่ให้เสร็จ ก่อนการเกิดขึ้นของบล็อกเชนความร่วมมือเหล่านี้มักจะมุ่งเน้นไปที่งานทางวิทยาศาสตร์และอาศัยความกระตือรือร้นและการมีส่วนร่วมด้านสวัสดิการสาธารณะของผู้เข้าร่วม ตอนนี้ใช้เทคโนโลยีบล็อกเชนแอปพลิเคชันที่หลากหลายสามารถจูงใจผ่านโทเค็น
เช่นเดียวกับโครงการคลาวด์คอมพิวติ้งแบบกระจายอํานาจ Akash เครือข่ายคอมพิวเตอร์ทั่วไปได้รับการจัดตั้งขึ้นและผู้ใช้สามารถปรับใช้โมเดลแมชชีนเลิร์นนิงสําหรับการคํานวณเหตุผลและการแสดงภาพ นอกจากนี้ยังมีโครงการ AI ที่ใช้บล็อกเชนเช่น Bittensor, Modulus Lab, Giza และ ChainML ซึ่งทั้งหมดนี้มุ่งเป้าไปที่การคํานวณการอนุมานแบบสอบถาม
โปรโตคอลการคำนวณ AI บล็อกเชน Gensyn และแพลตฟอร์ม AI แบบสร้างสรรค์โอเพนซอร์ส Together มุ่งมั่นที่จะสร้างเครือข่ายการคำนวณที่จำกัดที่บริการการฝึกโมเดลขนาดใหญ่
ความท้าทาย: สำหรับเครือข่ายการคำนวณแบบกระจาย ความยากลำบากไม่ได้อยู่เฉพาะ อย่างเครื่องคอมพิวเตอร์ที่มีความเร็วต่ำและเครือข่ายการสื่อสารที่ไม่เชื่อถือได้ ความไม่สามารถในการซิงโครไนซ์สถานะการคำนวณ การจัดการกับสภาพแวดล้อมการคำนวณประเภท GPU หลายแบบ แต่ยังต้องจัดการกับกระตุ้นเศรษฐกิจ การโกงของผู้เข้าร่วม การพิสูจน์ภาระงาน ความปลอดภัย การป้องกันความเป็นส่วนตัว และการโจมตีแอนติสแปม
อัลกอริทึมหลักของโมเดลขนาดใหญ่ การเรียนรู้แบบเสริม (RLHF) ต้องการความมีส่วนร่วมของมนุษย์ในการปรับปรุงการฝึกอบรมเพื่อแก้ไขข้อผิดพลาดและกำจัดความลำเอียงและข้อมูลที่เป็นอันตราย OpenAI ใช้ RLHF ในการปรับปรุง GPT3 เพื่อสร้าง ChatGPT ในขั้นตอนนี้ OpenAI พบว่ามีผู้เชี่ยวชาญจากกลุ่ม Facebook และจ่ายค่าแรงแก่คนงานเคนย่า 2 ดอลลาร์ต่อชั่วโมง การฝึกอบรมเพื่อปรับปรุงในบางครั้งต้องการความมีส่วนร่วมของผู้เชี่ยวชาญด้านข้อมูลจากสาขาที่เฉพาะเจาะจง และการนำไปใช้งานสามารถรวมกับวิธีการสร้างสติ๊กเกอร์เพื่อส่งเสริมการมีส่วนร่วมของชุมชนได้อย่างเต็มที่
อุตสาหกรรมระบบพื้นฐานทางกายภาพที่ไม่มีการกำหนด (DePINs) ใช้โทเค็นเพื่อกระตุ้นผู้คนให้แบ่งปันข้อมูลจริง ๆ แบบ real-time จากโลกทางกายตามเซ็นเซอร์สำหรับการฝึกโมเดลต่าง ๆ รวมถึง: React รวบรวมข้อมูลการใช้พลังงาน, DIMO รวบรวมข้อมูลการขับขี่รถ, WeatherXM รวบรวมข้อมูลอากาศ, และ Hivemapper รวบรวมข้อมูลแผนที่ผ่านการกระตุ้นโทเค็นเพื่อกระตุ้นผู้คนให้ทำเครื่องหมายป้ายจราจรและช่วยให้อัลกอริทึมการเรียนรู้ของ RLHF ของตนปรับปรุงความแม่นยำ
ในขณะเดียวกันเมื่อพารามิเตอร์ของโมเดลขนาดใหญ่เพิ่มขึ้นข้อมูลสาธารณะที่มีอยู่จะหมดลงภายในปี 2030 และความคืบหน้าอย่างต่อเนื่องของโมเดลขนาดใหญ่จะต้องพึ่งพาข้อมูลส่วนตัว จํานวนข้อมูลส่วนตัวเป็น 10 เท่าของข้อมูลสาธารณะ แต่กระจัดกระจายอยู่ในมือขององค์กรและบุคคลและเป็นส่วนตัวและเป็นความลับในธรรมชาติทําให้ยากต่อการแสวงหาประโยชน์ ภาวะที่กลืนไม่เข้าคายไม่ออกสองครั้งเกิดขึ้น ในอีกด้านหนึ่งโมเดลขนาดใหญ่ต้องการข้อมูล แต่แม้ว่าฝ่ายที่มีข้อมูลต้องการโมเดลขนาดใหญ่ แต่ก็ไม่ต้องการส่งมอบข้อมูลให้กับโมเดลขนาดใหญ่ ปัญหาคู่นี้สามารถแก้ไขได้ด้วยเทคโนโลยีในสาขาบล็อกเชน
สำหรับโมเดลการอ่านแบบโอเพนซอร์ส โดยเนื่องจากว่าต้องใช้ทรัพยากรคำนวณน้อยกว่า จึงสามารถดาวน์โหลดโมเดลไปยังส่วนข้อมูลเพื่อดำเนินการ สำหรับโมเดลที่ไม่สาธารณะหรือโมเดลขนาดใหญ่ ต้องทำการตกความไว้ก่อนและอัปโหลดไปยังส่วนจบของโมเดล วิธีการตกความไว้รวมถึงข้อมูลสังเคราะห์และพิสูจน์ความรู้ศูนย์
ไม้มีส่วนไหนว่าโมเดลถูกดาวน์โหลดไปที่ด้านข้อมูลหรือว่าข้อมูลถูกอัปโหลดไปที่ด้านโมเดล ปัญหาเกี่ยวกับอำนาจจำเป็นต้องแก้ไขเพื่อป้องกันการโกงโมเดลหรือข้อมูล
ท้าทาย: หรือ ถึงแม้ว่าการกระตุ้นโทเค็นของ Web3 สามารถช่วยในการแก้ไขปัญหานี้ ปัญหาการโกงกลับต้องถูกแก้ไข
ในชุมชน Civitai แห่งนี้ โลกของแพลตฟอร์มการแบ่งปันโมเดลการวาด AI ที่ใหญ่ที่สุดในโลก ผู้คนแบ่งปันโมเดลและสามารถคัดลอกโมเดลได้ง่าย และปรับเปลี่ยนโมเดลเพื่อสร้างโมเดลที่ตอบสนองตามความต้องการของตนเองได้อย่างง่ายดาย
Bittensor, โครงการบล็อกเชน AI แห่งรุ่นใหม่ที่เปิดเป็นโอเพนซอร์สและมีความเห็นร่วม ได้ออกแบบรูปแบบของโมเดลที่กระตุ้นโทเคน โดยอ้างอิงจากกลไกความร่วมมือของผู้เชี่ยวชาญหลายคน โดยร่วมกันสร้างโมเดลในการแก้ปัญหาและสนับสนุนการจำแนกองค์ความรู้ ซึ่งสามารถแบ่งปันระหว่างโมเดล ข้อมูล การฝึกอบรมที่เร่งด่วน ซึ่งมุ่งเน้นการให้โอกาสแก่ธุรกิจรุ่นใหม่มากมายในการเข้าร่วมโมเดลขนาดใหญ่
เป็นเครือข่ายรวมสำหรับบริการออฟเชน เช่น การอัตโนมัติ ออรัคเทล และ AI ร่วม ออโตโนลัส ออกแบบกรอบความร่วมมือสำหรับตัวแทนเพื่อเดินทางสู่การตกลงผ่าน Tendermint
ท้าทาย: การฝึกอบรมของโมเดลมากมายยังต้องการการสื่อสารมากมาย และความเชื่อถือได้และประสิทธิภาพทางเวลาของการฝึกอบรมแบบกระจายยังเป็นอุปสรรคที่ใหญ่
ในการร่วมมือกับที่กล่าวถึงข้างต้นว่า Web3 สามารถใช้เพื่อแก้ไขบางปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่ การผสมผสานของแรงกระทบสองสิ่งสำคัญจะส่งผลให้เกิดประยุกต์ใช้ที่น่าสนใจบ้าง
เร็ว ๆ นี้ศิลปิน NFT ใช้ทักษะเพื่อดำเนินการ ChatGPT โดยไม่มีความรู้ในการเขียนโปรแกรมเพื่อเปิดตัวสัญญาอัจฉริยะของตัวเองและออกโทเค็น Turboner ศิลปินใช้ YouTube เพื่อบันทึกรายการสร้างของเขาเป็นเวลา 1 สัปดาห์ และทำให้ทุกคนได้รับแรงบันดาลใจที่จะใช้ ChatGPT มาร่วมสร้างสัญญาอัจฉริยะ
การพัฒนาโมเดลขนาดใหญ่ได้ปรับปรุงความฉลาดของผู้ช่วยอัจฉริยะอย่างมากและเมื่อรวมกับการชําระเงินที่เข้ารหัสผู้ช่วยอัจฉริยะจะสามารถประสานงานทรัพยากรได้มากขึ้นและทํางานร่วมกันมากขึ้นในตลาดผู้ช่วยอัจฉริยะ AutoGPT แสดงให้เห็นถึงการพึ่งพาบัตรเครดิตที่ผู้ใช้จัดหาให้และเขาสามารถช่วยให้ผู้ใช้ซื้อทรัพยากรการประมวลผลแบบคลาวด์และการจองเที่ยวบินโดยอัตโนมัติ แต่ถูก จํากัด ด้วยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ และความสามารถของ AutoGPT ถูก จํากัด อย่างรุนแรงโดยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ การออกแบบ Multi Agent System (MAS) รวมถึง Contract Net Protocol รวมถึงการทํางานร่วมกันของผู้ช่วยอัจฉริยะหลายคนในตลาดเปิดและหากได้รับการสนับสนุนจากโทเค็นการทํางานร่วมกันดังกล่าวจะทําลายการทํางานร่วมกันที่ จํากัด บนพื้นฐานของความไว้วางใจและกลายเป็นความร่วมมือขนาดใหญ่ตามเศรษฐกิจตลาดเช่นเดียวกับที่สังคมมนุษย์ย้ายจากสังคมดั้งเดิมไปสู่สังคมการเงิน
การประยุกต์ใช้เทคโนโลยี zkp (Zero Knowledge Proof) ในบล็อกเชนแบ่งออกเป็นสองประเภท หนึ่งคือการแก้ปัญหาประสิทธิภาพของบล็อกเชนโดยการถ่ายโอนข้อกําหนดการประมวลผลไปยัง off-chain จากนั้นไปยังการรับรองแบบ on-chain ผ่าน zkp ประเภทที่สองใช้เพื่อปกป้องความเป็นส่วนตัวของธุรกรรม การประยุกต์ใช้ zkp ในรุ่นขนาดใหญ่รวมถึงการคํานวณแบบจําลองที่เชื่อถือได้ (เพื่อพิสูจน์ความสอดคล้องและความถูกต้องของการคํานวณแบบจําลอง) และการคํานวณความเป็นส่วนตัวของข้อมูลการฝึกอบรม ในสภาพแวดล้อมแบบกระจายอํานาจผู้ให้บริการของโมเดลจําเป็นต้องพิสูจน์ให้ลูกค้าเห็นว่าโมเดลที่ขายเป็นโมเดลที่สัญญาไว้กับลูกค้าโดยไม่ต้องตัดมุม สําหรับคู่ค้าข้อมูลการฝึกอบรมพวกเขาจําเป็นต้องมีส่วนร่วมในการฝึกอบรมหรือใช้แบบจําลองบนสมมติฐานของการปกป้องความเป็นส่วนตัวของตนเอง . แม้ว่า zkp จะมีความเป็นไปได้อยู่บ้าง แต่ก็ยังมีความท้าทายมากมาย และโซลูชันต่างๆ เช่น การประมวลผลแบบโฮโมมอร์ฟิกและการประมวลผลความเป็นส่วนตัวแบบรวมศูนย์ยังไม่บรรลุนิติภาวะ
นอกจากมีโรงเรียนที่กล่าวถึงข้างต้น ยังมีโรงเรียนอีกหนึ่งโรงเรียนที่ไม่ได้รับความสนใจอย่างแพร่หลายเนื่องจากขาดของสิทธิแรงจูงใช้โทเเคนและการใช้งานแอปพลิเคชันบล็อกเชนแบบมินิมอลิสต์
สถาปัตยกรรมที่ใช้ BEC มีความคล้ายคลึงกับแนวคิดของ Web5 ที่ Jack Dorsey กล่าวถึงและ Solid โดย Tim Berners-Lee ในหลายด้าน
พวกเขาคิดว่าทั้งหมด
เมื่อโหนดนี้สอดคล้องกับแต่ละคนและควบคุมโดยแต่ละจัดเก็บข้อมูลส่วนบุคคลและโหลดโมเดลขนาดใหญ่ตัวแทนอัจฉริยะส่วนบุคคล (ตัวแทน) ส่วนบุคคลที่ได้รับการคุ้มครองความเป็นส่วนตัว 100% สามารถฝึกอบรมได้ Dr. Gong Ting หุ้นส่วนผู้ก่อตั้งชาวจีนของ SIG เปรียบเทียบโหนดส่วนตัวในอนาคตกับเมฆส่วนตัวเหนือศีรษะของ Olaf ใน "Frozen" ที่ติดตามเขาเสมอ
ในทางนี้ อวาตาร์ใน Metaverse จะไม่เป็นรูปภาพที่ควบคุมโดยแป้นพิมพ์อีกต่อไป แต่เป็นตัวแทนที่มีวิญญาณ เขาสามารถศึกษาข่าวออนไลน์ ประมวลผลอีเมล และแม้กระทั้งตอบกลับข้อความแชทสังคมของคุณโดยอัตโนมัติ 24 ชั่วโมงต่อวัน (สำหรับแฟนสาวที่ดื้อ คุณอาจต้องมีวิธีตรวจสอบว่าแฟนหนุ่มของคุณกำลังใช้ตัวแทนในการจัดการกับคุณในอนาคต) เมื่อตัวแทนของคุณต้องการทักษะใหม่ เหมือนกับการติดตั้งแอปบนโทรศัพท์มือถือ คุณสามารถติดตั้งแอปใหม่ในโหนดของคุณ
ในประวัติศาสตร์ ด้วยการแพลตฟอร์มาไลเซชันของการพัฒนาของอินเทอร์เน็ต แม้ว่าเวลาสำหรับการเกิดของบริษัทยูนิคอร์นจะกลายเป็นเวลาสั้นลงทุกครั้ง แต่มันกลับกลายเป็นที่เสียหายต่อการพัฒนาของสตาร์ตอัพ
ด้วยแพลตฟอร์มการกระจายเนื้อหาที่มีประสิทธิภาพที่ Google และ Facebook ให้บริการ โดยที่ YouTube ซึ่งเกิดขึ้นในปี 2005 ถูกซื้อโดย Google ในราคา 1.6 พันล้านเหรียญสหรัฐเพียงหนึ่งปีต่อมา
พร้อมกับแพลตฟอร์มการกระจายแอปพลิเคชันที่มีประสิทธิภาพของ Apple App Store Instagram ได้ถูกก่อตั้งขึ้นในปี 2012 โดยมีคนทั้งหมดเพียง 10 คนเท่านั้น และได้ถูก Facebook เข้าซื้อในปี 2012 ด้วยมูลค่า 1 พันล้านดอลลาร์สหรัฐ
ด้วยความสนับสนุนจากโมเดลขนาดใหญ่ ChatGPT บริษัท Midjourney ที่มีเพียง 11 คน ได้รายได้ประมาณ 100 ล้าน ดอลลาร์สหรัฐต่อปี และ OpenAI ซึ่งมีไม่เกิน 100 คน มีมูลค่าเกิน 20 พันล้าน ดอลลาร์สหรัฐ
บริษัท แพลตฟอร์มอินเทอร์เน็ตกําลังมีประสิทธิภาพมากขึ้นเรื่อย ๆ และการเกิดขึ้นของโมเดลขนาดใหญ่ไม่ได้เปลี่ยนรูปแบบที่มีอยู่ของอินเทอร์เน็ตที่ถูกผูกขาดโดยองค์กรขนาดใหญ่ องค์ประกอบทั้งสามของโมเดลขนาดใหญ่อัลกอริทึมข้อมูลและพลังการประมวลผลยังคงผูกขาดโดยองค์กรขนาดใหญ่ บริษัท สตาร์ทอัพไม่มีความสามารถในการคิดค้นโมเดลขนาดใหญ่และไม่มีความแข็งแกร่งทางการเงินในการฝึกอบรมโมเดลขนาดใหญ่ พวกเขาสามารถมุ่งเน้นไปที่การประยุกต์ใช้โมเดลขนาดใหญ่ในแนวตั้งเท่านั้น แม้ว่าโมเดลขนาดใหญ่ดูเหมือนจะส่งเสริมความนิยมของความรู้ แต่พลังที่แท้จริงถูกควบคุมโดยคนไม่เกิน 100 คนในโลกที่มีความสามารถในการผลิตแบบจําลอง
หากโมเดลขนาดใหญ่แทรกซึมเข้าไปในทุกแง่มุมของชีวิตของผู้คนในอนาคตและคุณถาม ChatGPT เกี่ยวกับอาหารประจําวันสุขภาพอีเมลงานของคุณและจดหมายทนายความของคุณในทางทฤษฎีผู้ที่เชี่ยวชาญโมเดลขนาดใหญ่จะต้องแอบเปลี่ยนพารามิเตอร์บางอย่างเท่านั้น มันสามารถส่งผลกระทบอย่างมากต่อชีวิตของผู้คนนับไม่ถ้วน การว่างงานบางอย่างที่เกิดจากโมเดลขนาดใหญ่อาจได้รับการแก้ไขผ่าน UBI หรือ Worldcoin แต่ผลที่ตามมาของความเป็นไปได้ของความชั่วร้ายที่เกิดจากโมเดลขนาดใหญ่ที่ถูกควบคุมโดยคนไม่กี่คนนั้นร้ายแรงกว่า นี่คือความตั้งใจเดิมของ OpenAI แม้ว่า OpenAI จะแก้ปัญหาที่ขับเคลื่อนด้วยผลกําไรด้วยวิธีการที่ไม่แสวงหาผลกําไร แต่จะแก้ปัญหาที่ขับเคลื่อนด้วยพลังงานได้อย่างไร? เห็นได้ชัดว่าโมเดลขนาดใหญ่ฝึกโมเดลความรู้อย่างรวดเร็วโดยใช้ความรู้ที่มนุษย์สะสมมานานหลายทศวรรษและแบ่งปันได้อย่างอิสระบนอินเทอร์เน็ต แต่โมเดลนี้ถูกควบคุมโดยคนจํานวนน้อยมาก