AIのトップ研究者からのアドバイス:あなたもAIに取り組んでいると聞きましたが、この4つの落とし穴にはまらないように!

AIのトップ研究者からのアドバイス:あなたもAIに取り組んでいると聞きましたが、この4つの落とし穴にはまらないように!

人工知能の人気が高まってきており、人工知能分野でビジネスを始めたい人も増えてきています。しかし、人工知能分野でビジネスを始める際には注意すべき点がたくさんあります。最近、かつてcomma.aiでジョージ・ホッツ氏とともに無人運転車の開発に携わったエダー・サンタナ氏が、人工知能をさらに深く探求したい起業家に向けて特に4つの貴重な提案を記した記事を書きました。それでは見てみましょう。

[[189091]]

機械学習は非常に人気があるため、AI そのものと間違われることが多く、これはさらに人気の高いディープラーニングの場合に特に当てはまります。良いニュースは、スタートアップ チームが資金を受け取ったか、チームの予算が承認され、ディープラーニング分野への旅を始めようとしていることです。

これまで、Keras や Imagenet などの人工知能テクノロジーの楽しさを実感してきました。これは素晴らしいことです。しかし、実際にビジネスで人工知能を実践し始めるには、考慮すべきことがいくつかあります。

次に、昨年初めに comma.ai で George Hotz と自動運転に取り組んでいたときに実際に起こったいくつかの例を挙げて、私のアドバイスを説明します。


助けて、AI!どこに行けばいいですか?

1. データとエンジニアを分断しない

ディープラーニングはデータファーストの科学です。あなたのチームやスタートアップの目的は、このデータを意味のあるものにすることです。考えてみてください。言葉に意味を持たせない限り、AI ビットコイン チャットボットを開発することはできません。画像や動画などを理解しない限り、次の Snapchat Stories スタイルの自動マルチメディア コラージュを構築することはできません。

データ処理を仕事の中核にする必要があります。この点については必ず良い仕事をしてください。たとえば、データセットを準備して読み込むのに「15 分しかかからない」と考えている場合、より優れたモデル アーキテクチャを発見したり、Tensorflow コードにバグを見つけたりしたときに、その 15 分間待たなければなりません。

ルールは簡単です。データセットをバージョン管理し、一度前処理して何度でも使用できます。 Celery や Luigi などのツールは、役に立つでしょう。

大規模なチームで作業していて、チーム内のすべてのタスクをクラスターに送信する必要がある場合は、モデルのトレーニング用に従業員にデータを一括で提供するデータ ソリューションを検討する必要があります。モデルに脆弱性があることが既にわかっている場合は、変更を加える前にデータセット全体が読み込まれるまでチーム メンバーに待機させないでください。

簡単に言うと、comma.ai はおそらく世界で 2 番目か 3 番目に大きい運転データセットを保有しています。 comma.ai の初期の頃は、運転モデル​​をトレーニングするには、700 GB を超えるメモリを搭載した大型マシンに何時間ものビデオをロードする必要がありました。ジョージはトレーニングのためにさらにデータが必要になるたびに、すぐに 100 GB のメモリを追加しました。私が参加した主な理由は、このモデルのより優れたバージョンを開発するためでしたが、データがロードされるまで 15 分も待つつもりはありませんでした。代わりに、シンプルな ZMQ サーバー オープン ソース プロジェクトからいくつかのコンテンツを入手しました。これからは、心配するデータがなくなり、トレーニングの規模を拡大し、より安価なマシンを使用できるようになります。現在、モデルのトレーニングに対する唯一の制限は、GPU とその開発者です。

2. 視覚化できるものから始める

ディープラーニングの場合、幸運なことに、Tensorboard、最近リリースされた Visdom、その他のツールを利用して結果を視覚化することができます。一般的にデータ サイエンスは、視覚化によってあらゆる段階で遭遇する問題に適切に対処できるようになるため、視覚化主導型開発に最も適していると私は考えています。 JavaScript の愛好家でない限り、便利な視覚化を実現するために必ずしも d3.js を学ぶ必要はありません。

ちょっとした話ですが、退職面談中に、エンジニアとして生産性を高める方法についてジョージにアドバイスを求めました (信じてください、彼は私が今まで会った中で最も生産性の高い人です。私は彼から学ぶ機会をすべて利用します)。彼のアドバイスは、まず自分がやっていることを視覚化できるものを作るというものでした。ジョージ自身もかつてこれをやりました。さらに、George のすべての IPython ノートブックにはスライド ウィジェットがあり、プロトタイプ作成中にパラメーターが結果にどのように影響するかをすばやく表示できます。

3. 検証/ハードケースデータセットを早めに定義する

「データの準備」の不安から解放していただくために、楽しい視覚化を二の次にしました。しかし、タイプライターに突っ走る猿のように、ニューラル ネットワークにランダムにレイヤーを追加してしまうことを避けたいのであれば、進捗状況を測定する方法を学ぶ必要があります。

優れた成果物とより相関する指標は何か、追跡すべきデータは何かを自問してください。

これは単に「残りのデータの 10% をランダムに検証する」という範囲を超えている可能性があります。検証済みデータベース*** は、製品と同じ統計特性を持ちます。同じ製品を使用して、困難なケース、エッジケース、さらには失敗したケースを追跡し、将来の検証セットを作成することもできます。したがって、検証セットは進化していく可能性があり、トレーニング セットと同様にバージョン管理する必要があります。

簡単に言うと、自動運転の場合、運転中に車両を手動で制御しなければならない瞬間が、難しいケースであり、検証セットであることがわかりました。しかし、最も正確な検証テストは、経験豊富な制御エンジニアを路上に派遣し、自動運転システムの品質を正確に判断することです。この業界にいるなら、エンジニアを引き抜くためにテスラに行くべきです(冗談です)。

4. 早期の拡大が初期段階のスタートアップの失敗の主な原因である

このアドバイスを聞いて、「私に教えようとしないで。私はあなたよりもスタートアップの話をたくさん聞いているから」と言うかもしれません。確かにそうですが、ここで新しいのは、GPU とハードウェアのトレーニングを従業員と同じ要素として考慮する必要があるということです。必要以上に雇用/購入すると、余分なリソースを整理するのに多大な労力を費やすことになります。クラスターの管理は難しい場合があり、ディープラーニング向けの大規模 HPC はそれ自体が研究テーマです。

ここでの私のアドバイスは、新しい GPU の購入を検討する前に、すべての GPU が十分に活用されていることを確認する必要があるということです。 Google と同じくらいの生産性と収益性を実現できれば、Google と同じくらい贅沢にお金を使うことは確かに可能です。

チームと会社が十分に大きい場合は、インフラストラクチャの作業を行う人材の採用を真剣に検討してください。ハードウェア スタッフの 10 倍の研究者を雇用し、彼らに待たせると、最良のシナリオは彼らが独自のインフラストラクチャを構築することであり、最悪のシナリオは彼らが単に辞めてしまうことです。これは絶対にあなたが見たい状況ではありません。

ちょっとした話ですが、ある時、GPU をすべて実行しないままオフィスを離れたとき、Niel (Comma のモバイル アプリ担当副社長) が私に非常にがっかりした表情を向け、そのせいで私は「アイドル状態の GPU 恐怖症」に陥ってしまいました。これは今日では非常に一般的な問題になっています。

そうです!人工知能の分野で働くことは、やりがいがあり、楽しいです。アセットと視覚化をどのように処理するかをよく検討すれば、問題は解決します。

<<:  リカレントニューラルネットワークの父:未来のロボットはアリを見るように人間を見るだろう

>>:  機械学習への8つのステップ

ブログ    

推薦する

5年後に最もホットなものは何でしょうか? 2025 年のトップ 10 トレンド: ゼロ検索時代の到来

[[273076]]ファーウェイは8月8日、世界産業展望GIV@2025を発表し、次のように予測した...

AI倫理の夜明け

平等な代表から AI 法制へ AI の倫理基準を改善するには、テクノロジーにおける平等な代表と、EU...

私の国における人工知能の発展に対する最大の圧力は、基礎理論と独自のアルゴリズムです。

業界では、人工知能はこれまで2世代を経てきたと一般的に考えられています。第一世代の人工知能は知識主導...

...

「AI論文のオープンソースコードの義務化に反対する理由」

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能が将来の経済と社会に与える影響を理解する方法

[[353152]]人工知能は新興の破壊的技術として、科学技術革命と産業変化によって蓄積された膨大な...

ロボットは期待低下の谷間にあるのか?何が問題ですか?

[[204226]]今年4月、クアルコムのグローバル副社長兼クアルコムベンチャーズのマネージングデ...

Raspberry Pi の「リス対策アーティファクト」が Reddit で人気に。13 行のコードで AI があなたの代わりに食べ物を守れる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ジェフ・ディーンらの新しい研究:言語モデルを別の視点から見る:規模が十分でなければ発見されない

近年、言語モデルは自然言語処理 (NLP) に革命的な影響を与えています。パラメータなどの言語モデル...

第16回(2017年)中国政府ウェブサイトパフォーマンス評価結果発表および経験交流会議が北京で成功裏に開催されました。

2017年11月17日、中国情報産業発展センターの指導の下、中国ソフトウェア評価センターが主催し、...

GPT-4が化学者になる! USTC などが初の「科学リスク」ベンチマークと SciGuard ビッグモデルを発表

「我々の実験は制御不能になった!これは我々の世界の終わりだ!」 - デイ・アフター・トゥモローSF映...

自動運転:「乗っ取り」という言葉を恐れるのをやめよう

編集者注:過去2年間、ロボタクシーの公共運行は中国の多くの場所で開花しました。これらのロボタクシーに...

人工知能のインダストリー4.0指標8つ

インダストリー 4.0 における AI イニシアチブの主要な運用指標と主要業績評価指標 (KPI) ...

ウォータールー大学はヒートマップ回帰を放棄し、複数人の姿勢推定のための新しい方法を提案した。

[[436983]]キーポイント推定は、画像内の関心ポイントを特定するコンピューター ビジョン タ...

音声合成のためのディープフィードフォワードシーケンシャルメモリネットワーク

まとめディープフィードフォワードシーケンスメモリネットワークに基づく音声合成システムを提案します。こ...