MITは液体のような動的変化に適応できるLiquid機械学習システムを提案

MITは液体のような動的変化に適応できるLiquid機械学習システムを提案

自動運転などの多くの重要なアプリケーションでは、データはリアルタイムかつ動的であり、予期しない状況が時々発生する可能性があります。この問題を効率的に解決するために、MIT の研究者は生物学的ニューロンにヒントを得た新しいニューラル ネットワークを設計し、理論的な証明と実験的な検証を通じてニューラル ネットワークの有効性を実証しました。関連するコードも公開されています。

MIT の研究者たちは、トレーニング段階で学習するだけでなく、継続的に適応する新しいタイプのニューラル ネットワークを開発しました。この柔軟なアルゴリズムは、基礎となる数式を「液体」のように変更して、新しい入力データに継続的に適応できるため、「Liquid」ネットワークと名付けられました。この進歩は、医療診断や自動運転など、動的に変化するデータに基づく意思決定タスクに役立つ可能性があります。

論文アドレス: https://arxiv.org/pdf/2006.04439.pdf

コードアドレス: https://github.com/raminmh/liquid_time_constant_networks

「これは将来のロボット制御、自然言語処理、ビデオ処理、あらゆる形式の時系列データ処理への道となる可能性がある」と研究の主執筆者であるラミン・ハサニ氏は述べた。「これは本当に大きな可能性を秘めている」

この研究論文は、AAAI 2021 カンファレンスの選定論文の 1 つです。

ハサニ氏は、時系列データはどこにでもあるだけでなく、世界を理解する上で重要かつ不可欠なものだと述べた。 「現実世界はシーケンスで成り立っています。それが私たちが物事を認識する方法です。画像を認識するのではなく、画像のシーケンスを認識します」と彼は言いました。「つまり、時系列データが実際に私たちの現実を創り出しているのです。」

[[382710]]

彼は、ビデオ処理、金融データ、医療診断アプリケーションはすべて時系列に関係しており、私たちの社会にとって非常に重要であると指摘しました。絶えず変化するこれらのデータ ストリームを予測することは困難です。しかし、このデータをリアルタイムで分析し、将来の行動を予測することができれば、自動運転などの技術開発を大きく促進することができます。

ハサニ氏のような研究者は、現実世界のシステムの変化に適応できるニューラル ネットワークを設計しました。ニューラル ネットワークの設計は生物の脳にヒントを得たもので、ハサニ氏によると、彼らのニューラル ネットワークの設計は線虫 C. elegans から直接ヒントを得たものだという。 「その神経系はわずか302個のニューロンで構成されているが、予想以上に複雑なダイナミクスを生み出すことができる」と彼は語った。

ハサニ氏は、線虫C.エレガンスのニューロンがどのように発火し、電気インパルスを介して互いに通信するかを注意深く観察することで、ニューラルネットワークをコード化した。ニューラル ネットワークの構築に使用する方程式では、ネストされた一連の微分方程式の結果に基づいて、パラメーターが時間の経過とともに変化する可能性があります。

アルゴリズム 1: 集約常微分方程式 (ODE) 解決アルゴリズムによって実装された液体時間定数 (LTC) 再帰型ニューラル ネットワーク。ここで、θ はパラメーター空間であり、f は任意の活性化関数です。

アルゴリズム 2: 時間経過によるバックプロパゲーション (BPTT) による LTC のトレーニング。

この柔軟性が鍵となります。トレーニング段階の後、ほとんどのニューラル ネットワークの動作は固定され、入力データ ストリームの変化に適応することが難しくなります。ハサニ氏は、リキッド・ネットワークの流動性により、自動運転車のカメラの視界を遮る豪雨など、予期せぬデータやノイズの多いデータに対しても耐性が増すと述べた。 「つまり、より堅牢なのです。」

ハサニ氏は、ネットワークの柔軟性にはもう一つの大きな利点があると付け加えた。「説明もより容易になるのです。」

Hasani 氏は、Liquid ネットワークは他のニューラル ネットワークによくある扱いにくさを回避していると述べています。 「ニューロンが物事を表現する方法を変えるだけで、他の方法では探索できないレベルの複雑さを探索できます。」ハサニ氏が行った変更は、微分方程式を使用することでした。この小さいながらも非常に代表的なニューロン集団のおかげで、ネットワークの意思決定プロセスの「ブラックボックス」を覗き込み、ネットワークが特定の特性を持つ理由を診断することが容易になります。

「モデル自体は非常に表現力豊かです」とハサニ氏は述べ、エンジニアがLiquid Networkのパフォーマンスを理解し、改善するのに役立つとしている。

図 1: 表現力は軌跡の長さで測定されます。静的ディープ ネットワークの軌跡の潜在空間は、入力が隠れ層を通過するにつれて複雑になります。

図 2: 異なる活性化関数を使用した軌跡の長さ、LTC によって測定された表現力。

Hasani 氏のネットワークは、さまざまなテストで優れたパフォーマンスを発揮しました。大気化学から交通パターンの分析に至るまでのさまざまなタスクにおいて、提案された方法は、将来の値を予測する上で他の最先端の時系列アルゴリズムよりも数パーセント優れています。さらに、ネットワークのサイズが小さいため、テスト中の計算コストが大幅に低くなります。 「誰もがネットワークの拡大について話している」とハサニ氏は言う。「我々はネットワークを縮小して、ノードの数を減らしながらも、より豊富なノードを持つようにしたいのだ。」

時系列予測結果。

ハサニ氏は、今後もシステムの改良と業界への応用を検討していく予定です。 「私たちはすでに、自然にヒントを得て、ニューラル ネットワークの表現力を高める実証済みの方法を持っています。しかし、このプロセスはまだ始まったばかりです」と、彼は言います。「当然の疑問は、これをどのように拡大するかということです。私たちは、このようなネットワークが将来のインテリジェント システムの重要な構成要素になると考えています。」

<<:  ついに誰かがナレッジグラフをわかりやすく説明してくれた

>>:  AutoML が大幅に高速化、Google が最適な ML モデルを自動検索する新しいプラットフォームをオープン ソース化

ブログ    

推薦する

...

Google Brain の新たな研究: 強化学習はどのようにして音で観察することを学ぶのでしょうか?

人間は、脳内の神経系が外部環境の変化に継続的に適応するためにその構造を変える能力を持っていることを証...

毎日のアルゴリズム: データストリームの中央値

[[431427]]この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載した...

AIが達成できること

半世紀にわたり、人工知能はコンピュータ開発の夢でしたが、常に手の届かないところにありました。しかし、...

歩行者の軌道予測に効果的な方法と共通基本方法は何ですか?トップカンファレンスの論文を共有しましょう!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

古代のLRから始まる初心者でもわかるレコメンデーションアルゴリズム入門

[[386397]]みなさんこんにちは。私は、気づかないうちに長い間、推薦システムに取り組んできまし...

...

...

AI人材の世界的な需要が急増、一部の職種では年間40万ドル近くを稼ぐ

AI業界の急速な発展に伴い、テクノロジー業界におけるAI人材の需要も高まっています。 USA Tod...

AIは仕事を楽にする?これらの人々は反対します。「仕事量が倍増しました!」

7月24日のニュース:昨年末にチャットボットChatGPTがリリースされて以来、人工知能がトレンド...

人工知能が医師の「映画鑑賞」を支援:診断精度は95%を超える

[[233292]]最近、北京天壇病院は、世界初のCTおよびMRI神経画像人工知能支援診断製品「Bi...

労働者は一生懸命働かなければなりません! AI仮想人間が労働力に参入しようとしている

[[413812]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

再編とリーダーシップ:デジタルとAIのリーダーが他を置き去りにしている

デジタルおよび AI リーダーと他の業界プレーヤーとの間のギャップは大きく、さらに広がっています。過...