FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

FacebookがFaissオープンソースリソースライブラリをリリース。精度と効率をトレードすることが機械学習の発展方向となるのか?

[51CTO.com クイック翻訳] 機械学習の分野では、データセット内の類似性を実現するために使用されるクラスタリングや類似性検索などの手法は、通常、実装が困難です。最大 1 億枚の画像の内容を比較し、どの画像が類似しているかを調べたい場合、これは間違いなく非常に複雑な作業になります。実際、最も難しいのは複数のプロセッサにわたるスケーリングです。

[[185030]]

Facebook の AI 研究部門 (FAIR) は最近、Faiss と呼ばれる一連の興味深いソリューションをリリースしました。これは C++ で記述され、Python にバインドされたオープンソースのリソース ライブラリで、静止画像やビデオなどの大規模なデータ セット内の類似コンテンツを検索するために使用できます。

また、大規模なマルチ GPU 環境でアルゴリズムを同時に実行するためのより優れた方法を模索する、成長を続ける機械学習ソリューションのクラスを表しています。

干し草の山から針を見つける磁石

FAIRは2月末に発表した論文の中で、プロジェクトの内容と目的について説明した。研究開発の課題は、GPU 上で類似性検索や「k 選択」アルゴリズムを実行する方法だけではなく、メモリ容量よりもはるかに大きいデータセット (テラバイト レベルのビデオなど) を処理しながら、複数の GPU 間での同時操作を効率的に実装する方法です。

Faiss の利点は検索データそのものではなく、圧縮された表現形式にあります。これにより、精度レベルの限られた部分を犠牲にすることで、桁違い、あるいはそれ以上の大幅なストレージ効率の向上が実現されます。これを MP3 と比較すると、MP3 は「非可逆」圧縮形式ですが、その効果はほとんどのリスナーにとって完全に許容できるものです。同様に、Faiss はいわゆる PQ (積量子化) エンコード メカニズムを使用して、複数の GPU 間でワークロードを効率的に分割します。

論文で言及されている例の 1 つは、Yahoo の Flickr Creative Commons から 1 億枚の画像データセットを検索するというものです。ファイス氏は、赤い花と黄色い花の 2 つの画像を撮影し、それらを使用して、それらの画像の間にある一連の類似画像を探しました。 4 つの NVIDIA Titan X GPU を含むハードウェア セットのサポートにより、1 億枚の画像の類似性検索プロセスに合計 35 分かかりました。

FAIR は、Faiss は「従来の最先端 GPU よりも 8.5 倍高速」であると主張し、その結論を裏付けるいくつかのベンチマークを提供しています。 FAIR は、k 選択アルゴリズムの速度を 2 つの既存の GPU と比較したところ、Faiss アルゴリズムの方が高速であるだけでなく、GPU の最大利用可能メモリ帯域幅をより有効に活用できることを指摘しました。

FAIR はまた、Faiss のもう 1 つの大きな利点は、エンドツーエンドの検索時間、つまりデータの PQ バージョンの構築に必要な時間と、実際に検索を実行するために必要な時間であると紹介しました。競合ソリューションではテスト用の PQ 画像データ セットの構築に数日かかりますが、Faiss は「約半日」で「高品質」の画像を作成することができました。

スピードアップ

効率性を向上させるために精度をわずかに犠牲にする FAIR が採用した戦略は、機械学習の第一世代で広く受け入れられました。

これらのアクセラレーション ソリューションの多くは、NVIDIA Titan などのハイエンド ハードウェアに適用できるだけでなく、スマートフォンの GPU などのローエンド ハードウェアもサポートしています。 Google の TensorFlow ディープラーニング システムは最近アップグレードされ、スマートフォン クラスの GPU を使用して画像認識処理を実行できるようになりました。

精度と効率をトレードオフするこのアルゴリズム手法のもう 1 つの長期的な利点は、ローカル デバイス (高速だが不正確) とリモート バックエンド (より正確だがより多くの処理能力が必要) の間でワークロードを分散できることです。ネットワーク接続がある場合、ローカル デバイスが分類を担当し、より強力な処理リソースを備えたバックエンドが詳細な認識を実行します。

Faiss プロジェクトから得られた重要な教訓は、高並行性ハードウェアを使用して機械学習機能を完全に実現する方法を探るには、まだやるべきことがたくさんあるということです。

原題: Facebook の新しい機械学習フレームワークは精度よりも効率性を重視

原作者: Serdar Yegulalp

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

ホットなニュースをもっと知りたい方は、51CTO の「テクノロジーニュースモーニングレポート」コラムをご覧ください。

<<:  クレジットカード詐欺を防ぐために、機械学習アルゴリズムがあなたの身元を認識します

>>:  IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

ブログ    
ブログ    
ブログ    

推薦する

...

CVPR 自動運転チャレンジで優勝したのはどのようなソリューションでしょうか?

道路は複雑で、車両の種類も多様で、歩行者も密集しています。これが都市部の道路交通の現状であり、自動運...

2050年に「電子的不死」は達成されるのか?計画が鍵

海外メディアの報道によると、有名な未来学者イアン・ピアソン博士は最近、今後数十年以内に、人間は思考と...

...

EU諸国の4分の1がAIによるサイバーセキュリティ管理を望んでいる

予想外かもしれませんが、消費者のかなりの部分は、サイバーセキュリティを生身のサイバーセキュリティ専門...

深層学習におけるチューリング賞受賞後のベンジオ氏の研究の核心は何ですか?因果表現学習

最近発表された論文で、チューリング賞受賞者のヨシュア・ベンジオ氏らは、チームの現在の研究の焦点である...

インテリジェントAIのサポートにより、Xiaomi YoupinはYESOUL Wild Beast高反発腹筋ホイールをクラウドファンディング

YESOUL高反発腹筋ローラーは、1月7日よりXiaomi Youpinでクラウドファンディングで販...

AI 生成コードを使ってみませんか?人気のコパイロットの「リスク評価」を実施した人がいた

[[412069]]最近、GitHub は、人工知能を使用してコードを合成するモデルを生成する Co...

【ビッグガイがやってくるエピソード11】ITマネージャーの自己認識とコミュニケーション管理

[51CTO.com からのオリジナル記事] IT 部門のステータスが一向に向上しないのはなぜか、上...

アイデアから実装まで、2018 年の 13 の驚くべき新しい NLP 研究

2018 年には、自然言語処理の分野で多くの刺激的なアイデアやツールが生まれました。概念的な視点から...

ロボットシェフはトマト入りスクランブルエッグ9品を試食した後、味覚マップを描いた。

5月7日のZhidongxiによると、英国ケンブリッジ大学の研究者らは最近、シェフの調理過程を模倣...

...

質問で機械学習を学ぶ: 機械学習とは何ですか?

機械学習は受け入れるのが難しいものです。事件があったらいいな、じゃあ行こうよ〜 Q: 機械学習とは何...

確かな情報です! AIテクノロジーアーキテクチャソリューションの実現可能性を判断するのに役立つ3つの重要な要素

近年、人工知能は急速に発展しており、コンピュータービジョンや自然言語処理の分野で画期的な変化をもたら...

中国初の真のAI入力方式が発表され、未来の入力方式を革新する

入力がキーボードに別れを告げ、音声、表現、動作が入力方法になると、どのような魔法のような体験になるの...