人工知能は機械に流動的知能を与えることができるか？

2021年2月初旬に開催された第35回AAAI人工知能会議で、新しいタイプの人工知能（AI）機械学習が発表されました。マサチューセッツ工科大学（MIT）とオーストリアの研究者らは、「液体」機械学習と呼ばれる人工知能に、より流動的なアプローチを与える新しいニューラルネットワークを開発した。この新しいタイプの機械学習は、複雑な現実世界の問題の動的な変動にうまく適応できます。

[[402928]]

データストリームが時間の経過とともに変化する分野では、迅速に学習できるより柔軟な AI を開発することが非常に重要です。時系列データを使用する実際のアプリケーションには、ビデオ処理、疫学、金融市場、経済学、国内総生産 (GDP)、健康監視、天気予報、大気汚染、自動運転車、ロボット工学、航空、医療用画像処理などがあります。

流動性知能と結晶性知能の概念は、20 世紀で最も影響力のある心理学者の 1 人であるレイモンドキャッテル (1905-1998) によって 1963 年に提唱されたことに遡ります。流動性知能とは、柔軟に考え、推論し、新しい情報をリアルタイムで処理する能力です。対照的に、結晶化知能は、以前に学習した事実、スキル、経験から得られた知識を指します。

流動性知能とは、知覚、記憶、計算速度、推論能力など、生理学に基づいた認知能力です。流動性知能は結晶性知能に対応する概念であり、流動性知能は加齢とともに低下します。流動性知能は、生来の遺伝的要因に大きく影響され、教育や文化の影響をあまり受けない人間の基本的な能力です。流動性知能の発達は年齢と密接に関係しており、一般的に流動性知能は 20 歳を過ぎるとピークに達し、30 歳を過ぎると年齢とともに低下します。結晶性知能は加齢とともに低下しません。結晶性知能は主に、学習したスキル、言語能力、文章能力、判断力、連想能力を指します。

「我々は、新しいクラスの時間連続型リカレントニューラルネットワークモデルを導入した」と研究の著者らは書いている。ラミン・ハサニ氏は、コンピューター科学および人工知能研究所 (CSAIL) の博士研究員であり、この研究の主著者です。チームの他の研究者には、MIT教授でCSAIL所長のダニエラ・ラス氏、MIT博士課程の学生アレクサンダー・アミニ氏、オーストリア科学技術研究所のマティアス・レヒナー氏、ウィーン工科大学のラドゥ・グロス氏などがいる。

時系列データが存在する場合、常微分方程式 (ODE) を使用して連続時間の隠れ状態を決定するリカレントニューラルネットワークがよく使用されます。研究チームは、この構造を改良して「より豊かな表現学習と表現能力を可能にする」ことに着手した。

「暗黙の非線形性を持つ学習システムのダイナミクスを宣言するのではなく、非線形に相互接続されたゲートによって調整された線形一次動的システムのネットワークを構築します」と研究者らは書いています。

代替案として、研究者らは液体時間定数 (LTC) リカレントニューラルネットワーク (RNN) を作成しました。この新しいタイプの再帰型ニューラルネットワークの利点は、設計上、より表現力に富んでいるため、本質的に透明性と解釈性が高くなっていることです。

この表現力により、研究者はニューラルネットワークの「思考」プロセスの一部をより深く理解できるようになり、人工知能の機械学習の「ブラックボックス」の複雑な認知の謎の一部を解明するのに役立つ利点があります。

「結果として得られたモデルは、変化する（つまり、流動的な）時間定数が隠れた状態と結合した動的システムと、数値微分方程式ソルバーによって計算された出力を表現します」と研究チームは書いています。「これらのニューラルネットワークは安定した有界な動作を示し、ニューラル常微分方程式のファミリーで優れた表現力を生み出し、時系列予測タスクのパフォーマンスを向上させます。」

新しいモデルを評価するために、研究チームは液体時間制約型リカレントニューラルネットワークを用いたいくつかの実験を実施しました。実験には、モーションデータからジェスチャーを認識する分類器のトレーニング、センサーデータストリーム (温度、CO2 レベル、湿度、その他のセンサー) から部屋の占有状況を予測すること、スマートフォンデータから人間の活動 (立つ、歩く、座るなど) を認識することなどが含まれていました。その他のテストには、シーケンシャル MNIST、モーションダイナミクスモデリング、交通予測、1 時間ごとの家庭の電力使用量、オゾン濃度レベル、その他の種類の人間の活動が含まれます。

研究者らは、他の再帰型ニューラルネットワークモデル (LSTM、CT-RNN、Neural ODE、CT-GRU) と比較して、時系列予測に関する 7 つの実験のうち 4 つで 5% から 70% の範囲の改善を確認しました。

人工知能は業界や多くの機能にわたって急速に拡大しています。 AI 機械学習がより柔軟で流動的かつ透明になるほど、将来的に AI のセキュリティとパフォーマンスが向上する可能性が高まります。

<<: それは祝福でしょうか、それとも呪いでしょうか?顔認識技術の長所と短所

>>: 高いリアリティ、全体的な一貫性、優れた外観を備えたぼやけたターゲット向けの NeRF ソリューションがリリースされました

人工知能は機械に流動的知能を与えることができるか？

マルチラベル分類とは何ですか?ここにいくつかの実用的な古典的な方法があります

コンピュータビジョンプロジェクト: 10 個の高品質オープンソースデータセットがリリースされました

TransformerがCNNバックボーンネットワークを活性化、HKUとTencentの視覚的自己教師あり表現学習CARE

Google Gemini: CMU の総合評価では、Gemini Pro は GPT 3.5 Turbo より劣っていることが判明

人工知能が新薬開発を支援

人工知能技術がホームセキュリティ市場の急速な発展を促進

百度研究所が新しいAIツールを発表：10分以内に記事を自動的に動画に変換可能

すべてのトップオブジェクト検出アルゴリズムを統合: FAIRオープンソースDetectron

「素晴らしい成果物！」ハードウェア AI パフォーマンステスト用の Python ライブラリがリリースされました

推薦する

CycleGAN が敵対的ネットワーク画像処理ツールを生成

SSDの寿命は短いですか？寿命を延ばすバランスアルゴリズム

人工知能画像生成技術：わずか5年でなぜ急速な発展を遂げたのか？

27回の機械学習インタビューの後、重要な概念を強調しましょう

マイクロソフト、2023年までに8つの人工知能プロジェクトをオープンソース化へ

よく使われる6つのクラスタリング評価指標

Google、AIアシスタント「Gemini」の修正を加速、拒否率を半減

Google、開発者の効率向上を支援するAIコード支援ツール「Duet AI for Developers」をリリース

防衛分野で人工知能はどのような役割を果たすのでしょうか?

「中関村スマートAIパートナープログラム」の登録受付が開始

GitHubが機械学習ベースのコードスキャンと分析機能を開始

人工直感は人工知能の次の発展方向となるだろう