AI Day 2022: FSD の簡素化

ブログ

ホームページホームページ / ブログ / AI Day 2022: FSD の簡素化

Nov 18, 2023

AI Day 2022: FSD の簡素化

Stasera Tesla ha tenuto il suo evento AI Day 2022 a Palo Alto, in California.

テスラは今夜早くカリフォルニア州パロアルトで AI Day 2022 イベントを開催し、AI の世界での最新開発について詳しく説明しました。 議論の一部は完全自動運転(FSD)を中心に行われました。 イーロン・マスク氏はイベント前に、非常に技術的な内容になるだろうと警告していたが、期待を裏切らなかった。

ここでは、概念を単純化しながら、テスラの AI Day 2022 の完全自動運転セクションを見ていきます。

テスラは数字から議論を始めた。 Tesla はこれまでに 281 の異なるトレーニング モデルを含む 35 のリリースを作成しました。 さらに興味深いのは、プル リクエストの合計 (コードがマージされた合計回数) 18,659 です。

FSD ベータ版は合計 480 万のデータセットを使用しました。

その後、テスラは、Tesla AI Day 2022 の完全自動運転セグメント内のさまざまなトピックをどのようにカバーするかを示すフローチャートに進みました。自動ラベル付けされたデータ、シミュレートされたデータ、またはデータ エンジンからのトレーニング データは、さまざまなデータにフィードされます。計画に進むニューラル ネットワーク。

それぞれについては、カンファレンスの後半でさらに詳しく取り上げられました。

JavaScriptを有効にしてください

このニューラルネットワークはギャップ制御などを決定します。 交差点を左折しているところを想像してください。 横を歩いている歩行者がいます。 車はいつ行っても安全ですか? 計画を立てることは意思決定を行うことだと考えてください (他にもたくさんのことがありますが、簡略化して説明します)。

テスラは「インタラクション検索」と呼ばれるものを使用しています。 レーン、占有率 (レーン内で何が起こっているか)、その他の移動物体を調べます。 ニューラル ネットワークの最初の層はレーンを調べます。 レーンはどんな感じですか?

次に、障害のないシード (レーンを占有しているのは誰か) を分岐 (調べ) し、レーン内のインタラクションに分岐します。 歩行者や物体。

次に、あなたが介入する可能性がどのくらいあるかを計画します。 衝突しないかなどのチェックが発生します。 データに矛盾はありませんか?

このネットワークは、縁石、車、道路上の瓦礫、そして物事がどこへ向かうのかについての一般的な予測を把握します。 このネットワークは、基本的なオブジェクト ネットワークだけを使用するのではなく、走行可能なサーフェスを作成します。 車が走れるところ。

標準の RGB ではなく、生の写真を含むカメラ画像を使用します。 写真から特徴を抽出し、空間特徴を備えた 3D モジュールを作成します。 その後、最終出力のために「デコンボリューション」が行われます。 Tesla はより高解像度の出力を望んでいたため、「Queryable Outputs」と 2D 画像で 3D 環境を作成できる「NeRF」を使用しています。

Tesla は自動ラベル付きデータセットも使用します。 毎秒 400,000 件のビデオがキャプチャされます。 カスタム Pytorch (非常に人気のある機械学習フレームワーク) 拡張機能を使用して、データはトレーニングのためにストレージから GPU に送られます。 (私はハードウェアには詳しくありません)。 彼らはグラウンドトゥルースで検証します。

交差点の反対側にあるものが見えない場合があるため、予測を使用する必要があります。 入力データを提供する「ビジョン コンポーネント」があります。 テスラは地図コンポーネントを追加します。 地形情報を付加した道路地図データです。 彼らは、それが HD マップではないことに注意しました。 そのため、たとえば、車線がいつ終わるかを前もって知ることができません。 次に Tesla は、「言語」コンポーネントと呼ばれるものを追加します。 3D空間上の車線位置です。 言語コンポーネントには、指定された 3D 空間内のすべてのレーンをマッピングする予測グリッドがあります。 セグメントの終わりまで何度も繰り返し実行されます。 特にあなたとテスラが道路をはっきりと見えない可能性があるため、この車線予測が必要です。 予測が必要です。

Tesla は現在、交差点キャッシュが 1 日あたり 500k に制限されています (データ ストレージ制限)。 彼らは 10 億の交差点に到達したいと考えています。 明らかに、彼らの目標と限界を計算することはできません。 現在は、2020 年のアプローチよりもスケーリングが良く、ラベル付けが高速な「再構築」を使用しています。 彼らは、計画のほぼすべてのタスクに自動ラベラーを使用しています。 暗闇、雨、霧など、さまざまな気象条件でも自動ラベル付けを行います。

現実世界のデータを取得することが難しい状況があります。 ここでシミュレーションが使用されます。 ビデオ ゲームでシーンを作成し、そのデータを使用して運転中に発生する不明瞭な問題を解決するのに似ていると想像してください。 Tesla がこれらのシミュレーションを作成するために使用する手順は次のとおりです。

これらはすべて自動で行われ、5 分以内にセットアップできます。 これにより、テスラはマテリアルの交換や位置の変更を行うことができ、無限の数のシーンを作成して新しいグラウンド トゥルースを作成できます。 新しいフローを作成して予測を行い、現実世界からは作成できないデータを作成します。

運転中に困難なケースがあります。 Tesla はテストビデオを使用して評価セットを構築できます。 彼らは、実際に取り組んでいることに遭遇したテスラの運転から特定のデータを収集できます。 次に、トレーニング、修正、テストを行います。

すべての詳細が必要な場合は、以下の AI Day 2022 プレゼンテーションをご覧ください。 FSD に関するセクションは 58 分のマークから始まります。