Facebook Research、ディープラーニングを容易にする3つの新しいフレームワークを公開

Facebook Research、ディープラーニングを容易にする3つの新しいフレームワークを公開

[[318012]]

Microsoft、Google、Facebook、Amazon、Uber などのテクノロジー大手の研究部門が、人工知能 (AI) の分野におけるオープンソース フレームワークに最も積極的に貢献していることをご存知ですか?

彼らの貢献は、社内ソリューションで大規模にテストされたスタックと、研究室から生まれた非常に先進的なアイデアを組み合わせたものです。世界最大のテクノロジー企業がオープンソースのディープラーニングに積極的に貢献していることは喜ばしいことですが、データ サイエンティストがこの分野の新しい開発についていくのは困難です。本日の記事では、Facebook Artificial Intelligence Research (FAIR) が先月オープンソース化した 3 つの新しいバージョンについて説明します。

急速な成長傾向を考えると、これはどのような影響を与えるでしょうか?

FAIR は、ディープラーニングの分野における研究やオープンソース フレームワークに定期的に貢献しています。 PyTorch から ONNX まで、FAIR チームはディープラーニング アプリケーションの使いやすさの向上に多大な貢献をしてきました。過去数週間で、FAIR は 3 つの新しいオープン ソース フレームワークをファミリーに追加しました。

ポリゲーム

Polygames は、セルフプレイを通じてディープラーニング ネットワークをトレーニングするためのオープン ソースの研究フレームワークです。 Polygames は有名な「ゼロ学習」コンセプトに基づいており、エージェントは事前に設定されたトレーニングなしで、環境と対話することで環境を習得できます。

一見すると、Polygames は Alpha Zero や ELF OpenGo などの他のゲーム学習フレームワークと似ているように見えますが、FAIR スタックにも独自の貢献があります。まず、Polygames は、Hex、Havannah、Minishogi、Connect6、Minesweeper、Mastermind、EinStein wurfelt nicht!、Nogo、Othello など、より広範な戦略ゲームをサポートしています。これらは、研究者にディープラーニング ネットワークをテストするためのより広範な環境を提供します。

さらに、Polygames は、ディープ ニューラル ネットワークとモンテ カルロ ツリー検索法を組み合わせた巧妙なアーキテクチャにより、ゼロ学習の従来の概念を拡張します。このアーキテクチャにより、ネットワークをより多くのタスクや環境に一般化できるようになります。 Polygames フレームワークの予期せぬ利点は、エージェントに神経可塑性を生み出すことです。 Polygames のモデルはプログレッシブです。フレームワークには、新しいレイヤーやチャネルを追加したり、カーネル幅を増やしたりするためのスクリプトが付属しています。また、ウォームスタート トレーニングが可能で、トレーニングしながらニューラル ネットワークを成長させることができます。

プログラミング モデルの観点から見ると、Polygames はゲームを含むライブラリと、ゲームを実装する単一ファイル API を提供します。開発者エクスペリエンスは PyTorch に基づいているため、簡単に始めることができます。

FAIR チームは、ゲーム Hex19 でエリートの人間プレイヤーに勝つなど、Polygames でいくつかのマイルストーンを達成しました。 1940年代に詩人、数学者のピート・ハイン、ジョン・ナッシュ、経済学者によって開発されたこのゲームは、ゲームに関する従来の人間の思考プロセスの一部に挑戦するものである。ルールは簡単です。空のセルを黒と白で順番に塗りつぶします。北と南をつなげば黒人が勝ち、西と東をつなげば白人が勝ちます。パイルールによりゲームはより公平になります。2 番目の動きで、2 番目のプレーヤーは色を交換することを決定できます。

このゲームが難しいのは、つながりゲームであるため、報酬がローカル基準ではなくグローバル基準に基づいているためです。

一連の実験で、Polygames は Hex ゲームで人間のトッププレイヤーに勝利しました。結果は下の図に示されています。ここでは、人間のプレイヤーが白いチェスの駒を操作しています。最初の画像は六角形の開口部を示しています。ゲームの第 2 フェーズでは、人間 (白) が勝利しているように見えます。2 つの堅固なグループが東と西に接続し、互いに近くに接続しています。しかし、Polygames はこれを逆転させ、かなり複雑な中心的場所を作り出すことに成功しました。 Polygames は 2 つの可能なパスのうちの 1 つを使用したため、勝利の組み合わせが見つかり、ポジションが展開されました。

Polygames が GitHub でオープンソース化されました

翻訳

PyTorch3D は、3D 環境でディープラーニング ネットワークをトレーニングするためのフレームワークです。現実的な環境で動作する必要がある視覚インテリジェンス システムは多数あるにもかかわらず、3D 環境でそのようなエージェントをトレーニングするためのツールとフレームワークは依然として非常に限られています。 PyTorch3D は、PyTorch を使用した 3D ディープラーニングを容易にするために設計された独自の機能を備えた、高度にモジュール化され最適化されたライブラリです。 PyTorch3D は、高速で微分可能な 3D データ用の一般的に使用される 3D 演算子と損失関数のセットを提供するほか、研究者がこれらの関数を最先端のディープラーニング システムに即座にインポートできるようにするモジュール式の微分可能レンダリング API も提供します。

PyTorch3D は、複雑な屋内空間の画像から完全な 3D オブジェクトの再構築を可能にする FAIR の MeshR-CNN など、3D ディープラーニングにおける最近のいくつかのマイルストーンを活用しています。このフレームワークは、オブジェクトの理解を 3 次元にまで押し上げる、高度に最適化された 2D 認識ライブラリである Detectron2 も使用します。 PyTorch3D の回転と 3D 変換を処理する機能は、注釈の少ないトレーニング データを使用して画像と 3D 形状の関連性を学習する新しい方法である C3DPO の作成にも中心的な役割を果たしました。

PyTorch3D の主な貢献は次のとおりです。

  • 三角形メッシュを保存および操作するためのデータ構造: PyTorch3D は、メッシュと呼ばれるデータ構造に 3D 表現を保存します。このデータ構造により、研究者は、基礎となるグリッド データをさまざまなビューにすばやく変換し、データを最も効率的に表す演算子と一致させることが容易になります。
  • 三角形メッシュでの効率的な操作: PyTorch3D には、3D データ用のいくつかの一般的な演算子と損失関数を最適化するための一連の操作が含まれており、異種のバッチ入力をサポートしています。つまり、研究者やエンジニアは、新しいプロジェクトの開始時にオペレーターを再作成したり使用したりすることなく、PyTorch3D にオペレーターをインポートして、より迅速に実験できるようになります。
  • 微分可能メッシュ レンダラー: PyTorch3D には、モジュール式の微分可能レンダラーが含まれています。レンダラーは構成可能なユニットで構成されており、ユーザーはレンダラーを簡単に拡張してカスタム照明や影の効果をサポートできます。

PyTorch3DはGitHubで入手可能です

ハイプロット

高次元データの探索は、ディープラーニング アプリケーションの課題の 1 つです。 HiPlot は、AI 研究者が高次元データ内の相関関係とパターンを発見し、並列プロットやその他のグラフィカルな手段を使用して情報を表現するのに役立つインタラクティブな視覚化ツールです。 HiPlot は、高次元データを視覚化およびフィルタリングするための便利な方法である並列プロットと呼ばれる手法を使用します。

機能的な観点から見ると、HiPlot は他の視覚化ツールに比べていくつかの利点があります。

  • インタラクティブ性: HiPlot では、並列プロットはインタラクティブであるため、さまざまなシナリオで簡単に視覚化できます。たとえば、1 つまたは複数の軸に沿った範囲または値の取得に重点を置いたり、別の軸に基づいて配色を設定したり、軸を並べ替えたり削除したり、特定のデータ選択を抽出したりできます。
  • シンプルさ: Hiplot を使用するには、数行のコードだけが必要です。 「Hiplot」コマンドを使用してサーバーを使用すると、指定された URL を介してサーバーにアクセスし、実験を視覚化、管理、共有することができます。
  • 集団ベースのトレーニングの視覚化: HiPlot は、異なるデータ ポイント間のエッジを持つ XY プロットで集団ベースのトレーニング実験を視覚化する簡単な方法を提供します。このタイプの視覚化は、ディープラーニングの実験では非常に一般的です。

HiplotはGitHubで入手可能

Facebook の FAIR チームは、ディープラーニングのさまざまな分野で革新を続け、オープンソース コミュニティに積極的に貢献しています。 PyTorch3D、Polygames、HiPlot は、ディープラーニング アプリケーションを簡素化することを目的とした、FAIR からの比較的新しい貢献です。

今後のさらなる進歩を楽しみにしています!

<<:  5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

>>:  180の大学が「人工知能」の専攻を追加し、人工知能は大人気です!

ブログ    
ブログ    

推薦する

...

Jitu: 5秒でNeRFをトレーニングしましょう!オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能とプライバシーの議論: AIの透明性の長所と短所を理解する

AI がますます多くの業界で採用されるようになるにつれ、AI のユーザーは、実用性を効果的に維持しな...

...

マイクロソフトは低コストのAIモデルを見つけるために多方面に賭けている

マイクロソフトはOpenAI LPの半分以下を所有していると言われているが、それでもパワーは劣るがよ...

アルゴリズムから離れた「ジレンマ」に直面し、専門家はシナリオベースの洗練されたガバナンスの実行を提案している。

アルゴリズムは人間の行動に基づいて「ロックイン効果」を生み出します。この法律では、ユーザーにパーソナ...

...

Python の高レベル自然言語処理ライブラリである SpaCy は、世界最速の構文解析ツールとして知られています。

spaCy は、最先端の研究に基づいて構築され、実際の製品での使用のためにゼロから設計された、Py...

香水アートとAIが出会うとき

[51CTO.com 速訳] 香水は依然として人工物とみなされており、「スーパーな鼻」を持つトップマ...

機械学習感情分析ツールのトップ 5 (スタートアップ)

感情分析または意味分析は、構造化されていないテキスト内の感情や意見を識別するプロセスです。テキストは...

機械に漢字の一画一画の謎を理解させるにはどうすればいいでしょうか?

[[227335]]背景インテリジェントな顧客サービスから機械翻訳、テキスト要約の生成からユーザー...

Yunqi CapitalのChen Yu氏:AI投資家を惹きつけてターゲットにする方法

[51CTO.comより引用] 2017年7月21日から22日まで、51CTO主催の人工知能をテーマ...

キッシンジャー:今やAIは人間が世界を理解するための第3の方法となっている

2023年、ChatGPTは人工知能に対する世界的な注目を集めました。科学界、知識人界、産業界は、A...

Kaggle で競争する方法、全プロセスを解説

導入Kaggle は機械学習のコンペティションで最も有名なウェブサイトです。 Kaggle コンテス...

人工知能の登場により、一人暮らしの高齢者の介護は難しくなくなり、高齢者介護はテクノロジーの時代に入った

[[389635]]私の国では高齢化が進み、高齢者介護は長い間、社会全体で広く関心を集めるテーマとな...