新しいAIプログラミング言語はディープラーニングを超える

新しいAIプログラミング言語はディープラーニングを超える

MIT の研究者チームは、人工知能の分野を初心者にとってよりアクセスしやすいものにするとともに、専門家がこの分野を発展させるのを支援することに取り組んでいます。

今週のプログラミング言語の設計と実装に関する会議で、研究者らは「Gen」と呼ばれる新しい確率的プログラミング システムについて説明しました。ユーザーは、方程式を扱ったり、高性能なコードを手作業で記述したりすることなく、コンピューター ビジョン、ロボット工学、統計学など、AI テクノロジが適用される複数の分野のモデルとアルゴリズムを記述できます。 GEN を使用すると、専門の研究者は、これまでは実行不可能だった複雑なモデルや推論アルゴリズム (予測タスク用) を作成することもできます。

たとえば、研究者らは論文の中で、短い GEN プログラムで 3D ボディのポーズを推測できることを実証しています。これは、自律システム、人間とコンピューターの相互作用、拡張現実に応用される難しいコンピューター ビジョン推論タスクです。プログラムの裏側には、グラフ描画、ディープラーニング、確率シミュレーションを実行するコンポーネントが含まれています。これらのさまざまな技術を組み合わせることで、以前のシステムよりも高い精度と速度でタスクを実行できます。

研究者らは、GEN はシンプルなので、初心者から専門家まで誰でも簡単に使用できると述べています。 「この研究の動機の1つは、コンピューターサイエンスや数学の学位がそれほど高くない人でも自動化されたAIを利用しやすくすることです」と、電気工学およびコンピューターサイエンス学部の博士課程の学生で筆頭著者のマルコ・クスマノ・タウンナー氏は述べた。 「生産性も向上させたいと考えています。つまり、専門家が AI システムを迅速に反復して構築しやすくなるということです。」

研究者らはまた、データ内の根本的なパターンを分析、説明、予測するために専門家が通常使用する複雑な統計モデルを自動的に生成する別の GEN プログラムを使用して、GEN がデータ分析を簡素化できることを実証しました。研究者によるこれまでの研究を基に、ユーザーは数行のコードを記述するだけで、金融動向、航空旅行、投票パターン、病気の蔓延などの傾向に関する洞察を明らかにできます。これは、正確な予測を行うために大量の手作業によるコーディングを必要とした以前のシステムとは対照的です。

「GEN は、コンピューター ビジョンとデータ サイエンスの非常に異なるタイプの例をカバーし、最先端のパフォーマンスを提供できる、柔軟性、自動化、効率性に優れた初のシステムです」と、確率的コンピューティング プロジェクトを率いる脳認知科学部の研究者、Vikash K. Mansinghka 氏 (2005 年卒業、2009 年卒業、2009 年博士号取得) は述べています。

Cusumano-Towner 氏と Mansinghka 氏とともにこの論文を執筆したのは、2015 年卒業予定の Feras Saad 氏、2016 年卒業予定の SM 氏、および Alexander K. Lew 氏です。2 人とも大学院生で、CSAIL の確率的コンピューティング プログラムのメンバーです。

世界最高

2015 年に Google は、初心者や専門家が多くの数学を必要とせずに機械学習システムを自動的に生成できるようにするアプリケーション プログラミング インターフェース (API) のオープン ソース ライブラリである TensorFlow をリリースしました。現在広く使用されているこのプラットフォームは、人工知能のいくつかの側面の民主化に貢献しています。しかし、自動化され効率的である一方で、AI の幅広い可能性と比較すると高価で限界のあるディープラーニング モデルに焦点が絞られています。

現在、統計モデルや確率モデル、シミュレーション エンジンなど、他の多くの AI 技術が使用されています。他の確率的プログラミング システムの中には、幅広い AI 技術をカバーできるほど柔軟性が高いものもありますが、効率的に動作しません。

研究者たちは、自動化、柔軟性、スピードといったあらゆる面の最良の部分をひとつに組み合わせようとしています。 「これが実現すれば、TensorFlow がディープラーニングで行ったように、より幅広いモデリングおよび推論アルゴリズムの民主化に貢献できるかもしれません」とマンシンカー氏は語った。

確率的 AI では、推論アルゴリズムがデータに対して動作し、確率を継続的に調整して、新しいデータに基づいて予測を行います。これを行うと、最終的には、新しいデータに対して予測を行う方法を説明するモデルが生成されます。

研究者らは、以前の確率的プログラミング システムで使用されていた概念を基に、MIT で開発された汎用プログラミング言語である Julia にいくつかのカスタム モデリング言語を統合しました。各モデリング言語は、異なるタイプの AI モデリング アプローチに最適化されており、より汎用的になっています。 GEN は、最適化、変分推論、特定の確率的手法、ディープラーニングなどのさまざまな手法を使用して、推論タスク用の高レベルのインフラストラクチャも提供します。これとは別に、研究者らは実装を効率的に実行するためにいくつかの調整も行いました。

研究室の外

外部のユーザーはすでに、AI 研究に GEN を使用する方法を見つけています。たとえば、Intel は MIT と協力して、ロボット工学や拡張現実システムで使用される深度センサーで GEN を使用して 3D ポーズ推定を実行しています。 MIT リンカーン研究所も、人道救助や災害救助のための航空ロボット技術に GEN を適用するための協力を行っています。

GEN は、MIT の Intelligence Quest Initiative による野心的な AI プロジェクトで使用され始めています。たとえば、GEN は MIT-IBM Watson AI Lab プロジェクトや、18 か月児のレベルで人間の常識をシミュレートすることを目的とした国防高等研究計画局の進行中の Machine Common Sense プロジェクトの中心となっています。マンシンカ氏はこのプロジェクトの主任研究者の一人です。

「GEN にとって、研究者がさまざまな AI 技術のグループを簡単に統合できたのは初めてのことです。人々が何が可能かを発見するのは興味深いことです」とマンシンカ氏は語った。

「確率的プログラミングは、ディープラーニングの登場以来、AIの最前線で最も有望な分野の一つです」と、ウーバーの主任科学者兼AI担当副社長で、この研究には関わっていないケンブリッジ大学の教授、ズービン・ガフラマニ氏は述べた。「GENはこの分野における大きな進歩であり、確率的推論に基づくAIシステムのスケーラブルで実用的な実装に役立つでしょう。」

グーグルの研究ディレクター、ピーター・ノーヴィグ氏もこの研究には関わっていないが、この研究を称賛した。 「[GEN] により、問題解決者は確率的プログラミングを使用できるため、問題に対してより原則的なアプローチを取ることができますが、確率的プログラミング システムの設計者の選択に制約されることはありません」と彼は述べました。「汎用プログラミング言語が成功するのは、プログラマーの作業を容易にし、またプログラマーが新しい問題を効率的に解決するまったく新しいものを作成できるようにするためです。」 GEN は確率的プログラミングに対しても同様のことを行います。 「

GEN のソースコードは公開されており、Strange Loop や JuliaCon などの今後のオープンソース開発者カンファレンスでデモンストレーションされる予定です。この研究は DARPA によって部分的に支援されました。

<<:  ニューラル機械翻訳のための談話レベルの単一言語修正モデル

>>:  イアン・マッシンガム:AWSはモノのインターネットと人工知能への投資を継続

ブログ    
ブログ    

推薦する

OpenAIも996に取り組んでいますか?元従業員が告白:コード貢献度4位、6日間勤務することが多かった

AI 業界の人なら、OpenAI が先進的な技術と高い給与で AI 業界のリーダーであることは知って...

役に立つヒント | 複数の事前トレーニング済みビジョンモデルの転移学習

この記事では、Keras Tensorflow 抽象ライブラリに基づく転移学習アルゴリズム モデルを...

5G+自動運転車の時代において、Car OSの主導権を握るのは誰でしょうか?

「人間の情報に対する欲求は、原始人の食欲に似ています。食物から摂取するカロリーは欲求を満たすことが...

...

...

Meta AIは、ImageNetの事前トレーニングを超えて、小規模データセット向けの自己教師付き事前トレーニングであるSplitMaskを提案しています。

現在、コンピューター ビジョン ニューラル ネットワークは高度にパラメータ化されています。通常、数千...

エージェントは人間のように協力し、「グループチャット」を通じて情報を交換することができます。

インテリジェントエージェントにも「標準マニュアル」が必要です。 MetaGPTと呼ばれる研究では、イ...

視覚慣性走行距離計のIMU事前統合モデルについてお話しましょう

エンジニアリングの実践では、単に視覚オドメトリ (VO) を使用するのではなく、視覚と IMU を組...

AIエージェントを実装するには? 6 枚の写真 4090 Magic Llama2: タスクを分割して 1 つのコマンドで関数を呼び出す

AIエージェントは今話題になっています。OpenAIの応用研究ディレクターであるLilian Wen...

誰でも使えるディープラーニング: 3 つの主要な自動化ディープラーニング プラットフォームの紹介

ディープラーニング技術は複雑で、ゼロから開発するのが難しい場合が多いですが、Microsoft の ...

トラフィックを30%削減し、鮮明度を向上: MITが新しいAIビデオキャッシュアルゴリズムを提案

オンラインビデオの読み込み速度と鮮明さに対する人々の要求は常に尽きることがありません。最近、マサチュ...

...

2020年までに、iPhoneでは画面指紋認証と顔認証が共存するようになるかもしれない

数日後には、2019 年の新しい iPhone シリーズが登場します。iPhone が Face I...

AI導入から最大限の価値を引き出す方法

[[344258]]業界をリードする組織を対象とした調査では、世界中の組織の大多数 (91.6%) ...

...