データ ホイールか繰り返しサンプルか。 物理的なAIは「時事参拝」に善意を言う時です

2026/06/28 00:02
🌐ja

ロボットはまだ作業時間ですが、本当に必要なものは新しいサンプルです

データ ホイールか繰り返しサンプルか。 物理的なAIは「時事参拝」に善意を言う時です
TL;DR
• ロボリストのAnimesh Gargはモデル機能表示器として遠隔操作時間の企業のsの使用を質問しました。
• ロボティックデータ収集の費用は高く、展開データは狭い場面から頻繁に来、繰り返しサンプルはすぐに高くなります。
• より多くの価値は、合計実行時間ではなく、長い尾の故障、ミッションカバレッジ、新規サンプルであってもよいです。

トロント大学の元ロボット学者であるAnimesh Garg氏、現在ジョージア州の大学で、野球史上「Goldball」の瞬間にスマートデータコンテストを比較し、物理AIのマネーボールを題材とした記事で。

チャレンジしたいのは、フィンシングのより一般的な物語です:ロボティクスは、よりリモート操作、よりリアルな展開や、運用のより多くの時間でデータフライヤーを形成することができます。 投資家にとっては、これは学術的な歴史ではありません。 コスト構造、商用化スピード、スマート企業向けのモデルバリアは「データクローズリング」という言葉でよく包まれています。 累積時間数が有効なモデルの進捗量がない場合、市場はこれらの企業のデータ資産を調べる必要があります。

「データ時間」は、ロボット産業の迷路であってもよい

ガーグはマネーボールから古典的なアナログを借りました。 2002年、オークランド・スポーツ・チームは、より高価な選手を購入しないように、アライアンスの低賃金チームの一つで103ゲームを獲得しましたが、市場がプレイヤーを誤って発見しました。 伝統的なスカウト値のストライキレート、素晴らしさと位置、チームの「スコアする能力」を説明する指標はエントリー率です。

自分の視点で、物理AIは同様のステージでできている。 業界は、汎用ロボットモデルに不可欠としてデータを認識していますが、最も重要視されている指標は見やすくなっています。蓄積された遠隔操作時間、指示軌跡の数、デプロイされたロボットの数、生産シーンの動作時間。

ロボットやテキストデータの利用可能性は異なります。 大規模な言語モデルは、インターネット、コードバンク、書籍、Webページから低コストのテキストを大量に取得することができ、ボトルネックは、コンピューティング、クリーニング、トレーニングの効率からます。 ロボティックモデルは、身体的相互作用、行動や環境の変化に対するフィードバック、そして、対応する機器、マンパワー、サイト、センサー、故障処理、安全コストなど、さまざまなデータを現実に作成します。

ロボリストのKen Goldbergは、「10万年のデータキャップ」という用語で、ロボティクスとインターネット、AIデータのサイズのギャップを記述しました。 より正確には、人間の読書や閲覧時間に変換すると、現代的な大きな視覚的な言語モデルのトレーニングによって消費されるテキストと画像データは10万年程度に相当しますが、ロボットは同じサイズの実際のインタラクティブなデータが欠けています。 ロボットモデルの精密なしきい値を設定するよりも、これは、実際の世界インタラクティブなデータがWebテキストと同じ低コストでキャプチャできない業界へのリマインダーです。

「甘い工場テレワーク」の物語に反対する理由です。 多くの手動リモート操作がアクション集中型のトレーニングサンプルを生成できるのは事実ですが、同社は時間の総数でのみデータを評価する場合、資金は、失敗率を最も減らすことができる場面ではなく、重複、困難、低情報のサンプルに流すことができます。

3種類のデータが異なるものを購入します

Garg の分類では、物理 AI のデータは、観察データ、介入データ、展開データの 3 つのカテゴリに広く分けられます。 それらは有用かもしれませんが、費用、制約および情報密度は広く変わります。

第一人・第3人映像などの観察データです。 物体、空間、行動結果、環境分布を理解するためのモデルを支援し、低コストかつ広範囲なものであることの利点があります。 また、モデルが人や物体に何が起こるかを見ることができることは明らかですが、必ずしも特定の状態でロボットが何をすべきかは必ずしも分かりません。

2 番目のカテゴリは、介入データ、すなわちリモート操作、教え、手動の介入生成状態に作用する軌跡です。 このタイプのデータは、ロボットのトレーニングにもっと直接的です。それは「見るもの、移動する方法、そして」の後に何をするかのチェーンが含まれているからです。 コストは、すべての高品質のトラックを購入し、人間と機器のコストは、ソフトウェアデータとして迅速に低下する。

3番目のカテゴリは、実際の商用設定で動作するときに、ロボットによって生成されたテレメトリーデータなど、展開データです。 ロボットの働き、お金を作る、訓練データを生成する、商用ホイールとして近いように聞こえます。 しかし、ここでは統計トラップです。

今日の最初のロボティックシーンは、通常、最小限の変数、最も固定されたプロセスと最も管理可能で、高度に構造化されたストレージ、植物または単一のミッション環境などです。 そのような生産データ量が大きいかもしれませんが、比較的狭くて反復されることがあります。 モデルがローカルパターンを学習したら、追加の作業時間ごとに続く追加情報が減少します。

デプロイメントデータは価値がないわけではありません。 本当に貴重なことは、多くの場合、通常の「成功ミッション」ではなく、むしろ失敗、ジャム、異常なオブジェクト、境界条件とまれな障害の多くではありません。 問題は、これらの長尾サンプルが、会社の所望のペースで安定化されないことであり、より高いコストで見つかり、選別され、リセットされるということです。

より多くのデータは便利ですが、すぐにサンプルを繰り返します

ガーグは、言語モデルのスケーリング法の描画においてより慎重である:データの増加は通常、モデルの損失の減少につながるが、リターンの減少につながる。 サンプルが重複している場合, ほぼ重複, または同じ狭い分布から来る, 追加データの助けは、より迅速により小さくなります。

より直感的です。 ロボットは、固定棚から固定包装をつかむことを学び、何千もの教え、失敗、修正は非常に貴重であることができます。 アクション、オブジェクト、ライト、パスが何度も何度も収集されると、既に学習してきたローカルエクスペリエンスを再現するような追加データが増えています。

既に言語モデリングのトレーニングに存在する同様の経験:データの重複とクローズの重複は、トレーニングの予算を無駄にすることができ、過剰な重複は、また、汎用性を損なうことができます。 Gargは、これらの結論をロボットの訓練に直接入れなかったが、その方向を説明するために使用した:データの値は量的条件でのみ測定することができなかったが、また、サンプルの異なる点で測定することができなかった。

物理的なAIにとって、多様性は少なくとも2つの意味を持っています。 まずは、より物体、空間、素材、光、シールド、操作方法などを展示することです。 2 番目は、モデルが単純化されたタスクディストリビューションでうまく機能していることを避け、少し異なるシナリオが失敗することを意味します。

長尾の故障ケースは極めて重要です。 実質の物理的な世界は均等に配られず、低周波異常はしばしば商業ユーザビリティを決定します: オブジェクトは片面であり、パッケージは変形し、表面は反射的であり、グリップスライド、人は突然関与しています、センサーは欠落し、地上の摩擦変化。 従来のサンプルではモデルが良くなったし、これらのテールイベントが対処されていない場合は、いくつかの故障で展開が遅れる。

ホイールの展開は現場にあります

この記事の本当の課題は、スマート企業の一般的な商品化ルートです。ロボットを狭いシーンに展開し、人間のリモート・テイクオーバーでユーザビリティを確保し、生産データを収集し、より強力なモデルを訓練し、より多くのシーンを開くためのものです。

Gargは、このタイプのパスを「neo-integrator」アプローチと呼びます。 商用生産でロボットを配置することにより、純粋なデータ収集のコストを円滑にし、運用収益はデータのコストを相殺します。 このルートは、遠隔操作プラントの建設よりも効率的です。

しかしながら、初期の商用シナリオからのデータが十分に新しく、多様になっていて、モデルがよりタスクに移行できるようになるという前提があります。 低分散性、低エントロピー、堅牢なエンジニアリングで狭いミッションに展開されると、データがすぐに飽和します。 同社は、一般的な機能フライヤーを受信する可能性が高いが、継続的な統合、メンテナンス、異常な治療を必要とするプロジェクトのカスタマイズされたセットを受け取ることができません。

コストは2種類あります。 まず、環境の適応、プロセスの適応、障害、および安全メカニズムを含む新しいシーンに移動します。 第二に、展開自体がまだ利益と損失の残高を達成していない場合、スケールアップは、低コストのデータ収集の形態や、多数の低強度のサンプルの損失の交換では必ずしもそうではないかもしれません。

そのため、初期の展開は役に立たないですが、より詳しく見てみる必要があります。新しいミッションカバレッジと、他のシナリオに移動できるかどうか、そして、ハードウェア、マンパワー、メンテナンスおよび統合コストの控除後、モデルの改良が各ドルに行われているか、多くの失敗と異常なサンプルをもたらします。

評価の物語は、保存した時間数だけ尋ねることができません

Garg は、データの収集を停止し、評価校正を交換しない提案をしました。 累積時間、遠隔操作時間および軌跡は操作上の表示器として使用することができますが、モデル進歩と直接equatedべきではないです。

単一のミッションのデータが飽和されると、エンジニアリングの統合コストは、追加のミッションに必要な量、さまざまなシーンとアクションクラスターがデータによってカバーされる方法、生産データの多くは、実際に配布されたドリフトと異常なサンプルであり、デプロイメントストリームの慣習的な成功セグメントがモデルを継続するのではなく、フィルタリングされるべきでしょう。

資本金の配分は3種類のデータにより異なります。 観測データは、低コスト、多様、および広範なカバレッジの追求を優先すべきである。これは、ベースキャパシティ境界を拡大するために使用されるべきである。 コストの高いリモート操作と教育データが単一のミッションで飽和している場合、予算は同じアクションを繰り返すのではなく、より多くのタスクにリダイレクトされるべきです。 デプロイメントデータは、故障した境界条件と分散サンプルの選択に焦点を当て、大量の定期的な動作記録を低情報密度で破棄する必要があります。

この一連のビューは、物理AI評価の物語に実質的な影響を与えています。 より多くのロボットを持つ会社、より長い営業時間とより大きいリモート・オペレータはより強いモデル障壁を自動表わしません。 特定のタイプのデータが飽和し、より低いコストでより多くのタスク分布をカバーするときに判断し、高値、長期データを継続的に見つけることによって、複製する能力がより困難である可能性があります。

しかし、これは依然として配分の観点であり、業界の結論ではありません。 ロボティックモデルは、同様の言語モデルのスケールメリットを生成するかどうか、デプロイメントデータは特定の高次元のシナリオで連続的に新しい情報を生成することができるかどうか、そしてミッション間の移行の効率性は、より空的な結果に依存します。

Gargのリマインダーは、より具体的な問題に陥ります。物理AIの「ゴールドボールインジケータ」はデータ時間ではないかもしれませんが、各ドルの新しいサンプル。 データを使用してストーリーを伝えようとしているロボット企業にとって、最終的には、累積的に実行する期間ではなく、生成した情報量は大きく異なります。

QQlink

ไม่มีแบ็คดอร์เข้ารหัสลับ ไม่มีการประนีประนอม แพลตฟอร์มโซเชียลและการเงินแบบกระจายอำนาจที่ใช้เทคโนโลยีบล็อกเชน คืนความเป็นส่วนตัวและเสรีภาพให้กับผู้ใช้

© 2024 ทีมวิจัยและพัฒนา QQlink สงวนลิขสิทธิ์