ล้อข้อมูลหรือตัวอย่างซ้ํา? AI ทางกาย ถึงเวลาบอกลาการบูชาชั่วโมงแล้ว

2026/06/28 00:05
🌐th

หุ่นยนต์ยังคงทํางานเป็นชั่วโมง แต่สิ่งที่พวกเขาต้องการจริงๆ คือตัวอย่างใหม่

ล้อข้อมูลหรือตัวอย่างซ้ํา? AI ทางกาย ถึงเวลาบอกลาการบูชาชั่วโมงแล้ว
TL; DR
• นักหุ่นยนต์ อนิเมช การ์ก ตั้งคําถามเกี่ยวกับอุตสาหกรรม 'การใช้ชั่วโมงปฏิบัติการระยะไกล' เพื่อเป็นตัวบ่งชี้ความสามารถ。
• ค่า ใช้ จ่าย ใน การ เก็บ ข้อมูล ของ หุ่น ยนต์ สูง มาก บ่อย ครั้ง ได้ มา จาก ภาพ ที่ แคบ และ การ ทํา ซ้ํา ตัว อย่าง ก็ แพง ขึ้น อย่าง รวด เร็ว。
• อาจ มี ความ หมาย มาก กว่า นั้น คือ ความ ล้ม เหลว ของ หาง ระยะ ยาว, การ รายงาน การ ปฏิบัติ ภารกิจ และ ตัว อย่าง เชิง นิยาย แทน ที่ จะ ใช้ เวลา ทั้ง หมด。

Aimimish Garg อดีตบัณฑิตด้านหุ่นยนต์ที่มหาวิทยาลัยโตรอนโต และปัจจุบันในจอร์เจีย เปรียบเทียบการแข่งขันข้อมูลอย่างฉลาด。

สิ่งที่เขาต้องการท้าทาย คือเรื่องราวการเงินที่เพิ่มขึ้นเรื่อย ๆ หุ่นยนต์สามารถสร้างแผ่นพับข้อมูล สําหรับนักลงทุน นี่ไม่ใช่สํานวนทางวิชาการ โครงสร้างค่าใช้จ่าย ความเร็วเชิงพาณิชย์ และอุปสรรคสําหรับบริษัทฉลาด มักจะถูกห่อด้วยคําว่า "แหวนปิด" ถ้าจํานวนชั่วโมงสะสมไม่ได้มีค่าเท่ากับ ความก้าวหน้าในแบบจําลองที่มีประสิทธิภาพ ตลาดก็ต้องมองหา สินทรัพย์ของบริษัทเหล่านี้。

"ชั่วโมงดาต้า" อาจจะเป็นความเชื่องมงายของอุตสาหกรรมหุ่นยนต์

แกร์กยืมคําเปรียบเทียบคลาสสิกจากเงินบอล 2002 ทีมกีฬาโอคแลนด์ชนะ 103 เกม โดยเป็นหนึ่งในทีมที่ได้รับเงินน้อยของพันธมิตร ไม่ได้ซื้อผู้เล่นที่แพงมากขึ้น แต่พบว่าตลาดคํานวณผิด ขณะที่หน่วยสอดแนม เห็นมูลค่าการจู่โจม การลักขโมยและตําแหน่ง ตัวบ่งชี้ที่อธิบายความสามารถ ของทีมคือ อัตราการใช้。

ใน ทัศนะ ของ เขา เอไอ อาจ มี ลักษณะ คล้าย ๆ กัน. อุตสาหกรรมนี้จดจําข้อมูล ที่มีความสําคัญต่อโมเดลหุ่นยนต์สากล แต่มันง่ายที่จะเห็น ตัวบ่งชี้ที่มองเห็นได้มากที่สุด。

ความ สามารถ ของ หุ่น ยนต์ และ ข้อ ความ ต่าง กัน. โมเดลภาษาขนาดใหญ่ สามารถได้ข้อความจํานวนมหาศาล จากอินเทอร์เน็ต โค้ดแบงค์ หนังสือ และเว็บเพจ โมเดลหุ่นยนต์ต้องการข้อมูล การโต้ตอบทางกายภาพ การตอบรับของการกระทําและการเปลี่ยนแปลงสิ่งแวดล้อม และทุกชั่วโมงของข้อมูลที่ถูกต้อง。

หุ่นยนต์ Ken Goldberg ใช้คําว่า "หมวกข้อมูลจํานวน 100,000 ปี" เพื่ออธิบายช่องว่างระหว่างหุ่นยนต์และขนาดของอินเตอร์เน็ต ข้อมูล AI ยิ่ง กว่า นั้น ข้อ ความ และ ภาพ ที่ ได้ รับ จาก การ ฝึก แบบ จําลอง ภาษา ภาพ ใน สมัย เดียว กัน ถ้า เปลี่ยน มา อ่าน หรือ ดู เวลา ของ มนุษย์ ก็ เทียบ ได้ กับ เวลา ประมาณ 100,000 ปี ขณะ ที่ หุ่น ยนต์ ขาด ข้อมูล ที่ มี การ ตอบ สนอง จริง ๆ ขนาด เดียว กัน. แทนที่จะกําหนดขีดจํากัดที่แน่นอนสําหรับโมเดลหุ่นยนต์นี้ เป็นเครื่องเตือนให้อุตสาหกรรมรู้ว่าโลกแห่งความเป็นจริง ไม่สามารถบันทึกข้อมูลด้วยค่าใช้จ่ายต่ําเท่ากับข้อความเว็บ。

นี่คือเหตุผลว่าทําไมแกร์กจึงต่อต้านการโทรคมนาคมของโรงงาน ในขณะที่มันจริงที่จํานวนของการดําเนินการระยะไกลด้วยตนเองจํานวนมาก สามารถผลิตตัวอย่างการอบรมที่มีประสิทธิภาพในการดําเนินการ ถ้า บริษัท การประเมินข้อมูลเพียงในจํานวนชั่วโมงทั้งหมด กองทุนอาจจะไหล。

ข้อมูลสามประเภท ซื้อบางอย่างที่แตกต่าง

ในการจัดหมวดหมู่การ์ก ข้อมูลเอไอทางกายภาพ แบ่งออกเป็นสามประเภท คือ การสังเกตข้อมูล การแทรกแซงข้อมูลและการใช้ มันอาจมีประโยชน์ แต่ค่าใช้จ่าย ข้อจํากัด และความหนาแน่นของข้อมูล มีความหลากหลาย。

อย่างแรกคือข้อมูลสังเกต เช่น บุคคลแรกหรือบุคคลที่สามในวิดีโอ มันมีข้อได้เปรียบในการเป็น คนต่ํา และมีพื้นฐานกว้างขวาง ช่วยให้นางแบบเข้าใจวัตถุ อวกาศ ผลลัพท์ เป็น ที่ ชัด แจ้ง ด้วย ว่า หุ่น ยนต์ สามารถ มอง เห็น สิ่ง ที่ เกิด ขึ้น กับ ผู้ คน หรือ วัตถุ แต่ มัน ไม่ จําเป็น ต้อง รู้ ว่า หุ่น ยนต์ ควร ทํา อะไร ใน สภาพ ที่ กําหนด ไว้。

ประเภทที่สองคือ การแทรกแซงข้อมูล การปฏิบัติการระยะไกล การสอนและการแทรกแซงด้วยมือ ข้อมูลประเภทนี้ตรงต่อการฝึกด้วยหุ่นยนต์มากกว่า เนื่องจากมันมีห่วงโซ่ของ "สิ่งที่ควรดู ค่าใช้จ่ายคือ การซื้อเส้นทางที่มีคุณภาพสูง และค่าใช้จ่ายของมนุษย์และอุปกรณ์ จะแทบจะไม่ลดลงอย่างรวดเร็วเป็นข้อมูลซอฟต์แวร์。

ประเภทที่สามคือข้อมูลเชิงปฏิบัติ ข้อมูลการโทรคมนาคมที่สร้างขึ้นโดยหุ่นยนต์ เมื่อมันทํางานในการตั้งค่าเชิงพาณิชย์ที่แท้จริง หุ่นยนต์ทํางาน หาเงิน ผลิตข้อมูลการฝึก แต่นี่คือกับดักทางสถิติ。

ฉากแรกของหุ่นยนต์ทุกวันนี้ ก็มักจะเป็นตัวแปรที่น้อยที่สุดด้วย กระบวนการที่คงที่ที่สุด และมีประสิทธิภาพมากที่สุด เช่น การจัดเก็บอย่างสูง ข้อมูล การ ผลิต ดัง กล่าว อาจ มี มาก แต่ อาจ ค่อน ข้าง แคบ และ ซ้ํา แล้ว ซ้ํา อีก. เมื่อโมเดลเรียนรู้รูปแบบท้องถิ่น ข้อมูลเพิ่มเติมที่ตามมาทุกชั่วโมงของการดําเนินงาน。

ข้อมูลการทํางานไม่ได้ขาดค่า สิ่ง ที่ มี ค่า จริง ๆ มัก จะ ไม่ ใช่ “ภารกิจ ธรรมดา ๆ ” จํานวน มาก มาย แต่ เป็น การ ล้ม เหลว, ขัด จังหวะ, วัตถุ ผิด ปกติ, สภาพ ชายแดน และ สิ่ง รบกวน ที่ หา ยาก. ปัญหาคือตัวอย่างหางยาวเหล่านี้ จะไม่เสถียรที่จังหวะที่ต้องการของ บริษัท และจะพบ, หน้าจอและการตั้งค่าที่ค่าใช้จ่ายสูง。

ข้อมูลมากขึ้นมีประโยชน์ แต่ตัวอย่างซ้ําจะแพงเร็วๆนี้

แกร์ก ระมัดระวัง มาก ขึ้น ใน การ ใช้ กฎ การ วัด แบบ ภาษา: การ เพิ่ม ข้อมูล มัก จะ ทํา ให้ การ สูญ เสีย รุ่น ลด ลง แต่ การ ตอบ กลับ ลด ลง. ถ้าตัวอย่างนั้นถูกทําซ้ํา, เกือบเลียนแบบ, หรือมาจากการกระจายตัวที่แคบเท่ากัน, ความช่วยเหลือของข้อมูลเพิ่มเติม จะลดลงอย่างรวดเร็ว。

มันตรงตามสัญชาตญาณมากกว่า หุ่น ยนต์ จะ เรียน รู้ ที่ จะ หยิบ ห่อ ของ ที่ ยึด ติด ไว้ จาก ชั้น เก็บ และ คํา สอน หลาย พัน ข้อ แรก ความ ล้ม เหลว และ การ แก้ไข อาจ มี ค่า มาก. เมื่อการกระทํา วัตถุ แสงและเส้นทาง ถูกรวบรวม ครั้งแล้วครั้งเล่า ข้อมูลเพิ่มเติมจะเป็นเหมือน。

ประสบการณ์ คล้าย ๆ กัน มี อยู่ แล้ว ใน การ ฝึก สอน แบบ จําลอง ภาษา: การ เลียน แบบ และ การ เลียน แบบ ข้อมูล อย่าง ใกล้ ชิด อาจ ทํา ให้ งบ การ ฝึก เสีย ไป และ การ เลียน แบบ มาก เกิน ไป ก็ อาจ ทํา ให้ การ ทํา แบบ ทั่ว ไป เสีย ไป ด้วย. การ์กไม่ได้ใส่ข้อสรุปเหล่านี้โดยตรงในการฝึกหุ่นยนต์ แต่ใช้พวกเขาในการอธิบายทิศทาง: ค่าของข้อมูลไม่สามารถวัดได้เฉพาะในคํา quantative。

สําหรับ AI ด้านกายภาพ ความหลากหลายมีความหมายอย่างน้อย 2 อย่าง อย่างแรกคือ การแสดงอุปกรณ์มากขึ้น พื้นที่ วัสดุ แสง การป้องกัน และการดําเนินงาน อย่างที่สองก็คือ การหลีกเลี่ยงว่าโมเดลนี้ทําหน้าที่ได้ดี ในการกระจายงานที่ครอบคลุมมากเกินไป และสถานการณ์ที่แตกต่างไปเล็กน้อยจะล้มเหลว。

คดีล้มเหลวในระยะยาว จึงเป็นคดีสําคัญ โลกทางกายภาพจริงไม่ได้กระจายออกไปอย่างไม่เท่ากัน และความผิดปกติของความถี่ต่ํามักจะกําหนดความง่ายเชิงพาณิชย์: วัตถุนั้นด้านเดียว, แพคเกจนั้นบิดเบี้ยว ตัวอย่างที่ทําดีกว่าในตัวอย่างทั่วไป และถ้าเหตุการณ์หางเหล่านี้ไม่เกิดขึ้น การใช้งานก็ยังคงล่าช้า。

การขับเคลื่อนของล้ออยู่ในตําแหน่ง

ความท้าทายที่แท้จริงของบทความนี้ คือเส้นทางการค้าทั่วไปของบริษัทฉลาด ๆ คือ การนําหุ่นยนต์ไปใช้ในฉากที่แคบๆ。

การ์กเรียกเส้นทางแบบนี้ว่า "วิธีการเปลี่ยนเส้นทาง" มันพยายามลดค่าใช้จ่ายในการเก็บข้อมูลบริสุทธิ์ โดยการวางหุ่นยนต์ในการผลิตเชิงพาณิชย์ เพื่อให้รายได้ดําเนินการชดเชยค่าใช้จ่ายของข้อมูล เส้น ทาง นี้ ฟัง ดู มี ประสิทธิภาพ กว่า การ สร้าง โรง งาน ผ่าตัด อัน ห่าง ไกล。

อย่าง ไร ก็ ตาม มี ข้อ สันนิษฐาน ที่ ว่า ข้อมูล จาก ฉาก การ ค้า สมัย แรก ๆ ต้อง เป็น สิ่ง ใหม่ และ หลาก หลาย มาก พอ ที่ จะ ช่วย ให้ รุ่น รุ่น ต่าง ๆ อพยพ ไป ทํา งาน มาก ขึ้น. ข้อมูลจะอิ่มตัวอย่างรวดเร็ว ถ้าฉากนี้ถูกนําไปใช้ในภารกิจแคบๆ ที่มีความผันผวนต่ํา เอ็นโทรปีต่ํา และวิศวกรรมทนทาน บริษัทไม่ได้มีแนวโน้มจะได้รับ ใบปลิวทั่วไป แต่ชุดของโปรเจกต์ที่ปรับแต่งแล้ว。

นี่เกี่ยวข้องกับค่าใช้จ่ายสองประเภท ประการ แรก การ ย้าย ไป ยัง ฉาก ใหม่ ทุก ครั้ง เกี่ยว ข้อง กับ การ ปรับ ตัว ทาง ด้าน สิ่ง แวด ล้อม, กระบวนการ ปรับ ตัว, ความ ล้ม เหลว และ กลไก ความ ปลอด ภัย. ประการที่สอง ถ้าเครื่องมือนี้ยังไม่บรรลุสมดุลของ รายได้และการสูญเสีย การปรับขนาดอาจจะไม่จําเป็นต้องอยู่ในรูปแบบ ของการเก็บข้อมูลต่ํา หรือการแลกเปลี่ยนของการสูญเสีย。

ฉะนั้น การ ใช้ ประโยชน์ ตั้ง แต่ อายุ ยัง น้อย จึง ไม่ ใช่ เรื่อง ไร้ ประโยชน์ แต่ ต้อง ดู ให้ ใกล้ ชิด ยิ่ง ขึ้น: มัน นํา มา สู่ ภารกิจ ใหม่ รวม ทั้ง ความ ล้ม เหลว และ ตัว อย่าง ที่ ไม่ ธรรมดา มาก มาย ไม่ ว่า จะ สามารถ ย้าย ไป สู่ สถานการณ์ อื่น ๆ ได้ หรือ ไม่ และ มี การ ปรับ ปรุง จําลอง มาก น้อย แค่ ไหน ต่อ ไป สําหรับ แต่ ละ คน หลัง จาก การ ปรับ ปรุง เครื่อง มือ, การ บํารุง รักษา, และ ค่า ใช้ จ่าย ร่วม กัน。

เรื่องประมาณการไม่ได้แค่ถามว่าเราประหยัดเวลาไปกี่ชั่วโมง

การ์กให้ข้อเสนอแนะว่า อย่าหยุดเก็บข้อมูล แต่ให้เปลี่ยนค่าประเมิน เวลาปฏิบัติการที่ควบคุมได้ ชั่วโมงปฏิบัติการระยะไกลและทางเดินรถ สามารถถูกใช้เป็นตัวบ่งชี้การทํางานได้ แต่ไม่ควรเทียบโดยตรงกับความก้าวหน้าของแบบจําลอง。

คําถามอื่น ๆ รวมไปถึงเมื่อข้อมูลสําหรับภารกิจเดียวจะอิ่มตัว ค่าใช้จ่ายวิศวกรรมจะจําเป็นสําหรับภารกิจเพิ่มเติม。

การ จัด หา เงิน ทุน จะ แตก ต่าง กัน ไป ตาม ข้อมูล สาม ชนิด. ข้อมูลเชิงรุกควรจัดลําดับความสําคัญ การไล่ตามจุดต่ําสุด ความหลากหลาย และข่าวกว้าง ซึ่งควรจะใช้ในการขยายขอบเขตความจุฐาน เมื่อการดําเนินงานและข้อมูลการสอนในระยะไกล มีความอิ่มตัวในภารกิจเดียว งบประมาณควรถูกโอนไปสู่งานอื่นแทนการดําเนินการต่อไป ข้อมูลที่ใช้ไปควรจะเน้นกับการเลือกที่ล้มเหลว, เงื่อนไขกรอบ และตัวอย่างการสลายตัว, การทิ้งบันทึกการทํางานทั่วไป จํานวนมากมายที่มีความหนาแน่นต่ํา。

ชุดของมุมมองนี้ มีผลกระทบจริงๆ ต่อการเล่าเรื่องเชิงกายภาพ บริษัท ที่ มี หุ่น ยนต์ มาก ขึ้น ชั่วโมง ปฏิบัติ การ ที่ ยาว กว่า และ มี รีโมท ขนาด ใหญ่ กว่า ไม่ ได้ เป็น อุปสรรค แบบ ที่ แข็ง แรง กว่า โดย อัตโนมัติ. ความสามารถในการทําซ้ําอาจเป็นเรื่องยากมากขึ้น โดยการค้นหาข้อมูลที่มีคุณภาพสูงในระยะยาวอย่างต่อเนื่อง พิจารณาเมื่อชนิดของข้อมูลเฉพาะกลายเป็นความอิ่มตัว。

อย่างไรก็ตาม นี่ยังคงเป็นมุมมองแบบแบ่งประเภท และไม่ใช่ข้อสรุปของอุตสาหกรรม หุ่นยนต์โมเดลสร้างประโยชน์จากแบบจําลองภาษาที่คล้ายคลึงกันหรือไม่ ไม่ว่าจะเป็นข้อมูลเชิงปฏิบัติ จะสามารถสร้างข้อมูลใหม่。

ข้อเตือนใจของแกร์กตกอยู่บนประเด็นที่เจาะจงกว่า: ตัวชี้วัดทางกายภาพของ AI "Goldball Indicator" อาจไม่ใช่ชั่วโมงข้อมูล แต่เป็นตัวอย่างนิยายของแต่ละดอลลาร์ สําหรับบริษัทหุ่นยนต์ที่ยังคงใช้ข้อมูลในการเล่าเรื่อง ในที่สุดตลาดก็ขึ้นอยู่ ไม่ขึ้นอยู่กับว่า พวกเขาจะวิ่งได้นานแค่ไหน。

QQlink

Tiada pintu belakang kripto, tiada kompromi. Platform sosial dan kewangan terdesentralisasi berasaskan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Pasukan R&D QQlink. Hak Cipta Terpelihara.