人工知能は機械に流動的知能を与えることができるか?

人工知能は機械に流動的知能を与えることができるか?

2021年2月初旬に開催された第35回AAAI人工知能会議で、新しいタイプの人工知能(AI)機械学習が発表されました。 マサチューセッツ工科大学(MIT)とオーストリアの研究者らは、「液体」機械学習と呼ばれる人工知能に、より流動的なアプローチを与える新しいニューラルネットワークを開発した。この新しいタイプの機械学習は、複雑な現実世界の問題の動的な変動にうまく適応できます。

[[402928]]

データ ストリームが時間の経過とともに変化する分野では、迅速に学習できるより柔軟な AI を開発することが非常に重要です。時系列データを使用する実際のアプリケーションには、ビデオ処理、疫学、金融市場、経済学、国内総生産 (GDP)、健康監視、天気予報、大気汚染、自動運転車、ロボット工学、航空、医療用画像処理などがあります。

流動性知能と結晶性知能の概念は、20 世紀で最も影響力のある心理学者の 1 人であるレイモンド キャッテル (1905-1998) によって 1963 年に提唱されたことに遡ります。流動性知能とは、柔軟に考え、推論し、新しい情報をリアルタイムで処理する能力です。対照的に、結晶化知能は、以前に学習した事実、スキル、経験から得られた知識を指します。

流動性知能とは、知覚、記憶、計算速度、推論能力など、生理学に基づいた認知能力です。流動性知能は結晶性知能に対応する概念であり、流動性知能は加齢とともに低下します。流動性知能は、生来の遺伝的要因に大きく影響され、教育や文化の影響をあまり受けない人間の基本的な能力です。流動性知能の発達は年齢と密接に関係しており、一般的に流動性知能は 20 歳を過ぎるとピークに達し、30 歳を過ぎると年齢とともに低下します。結晶性知能は加齢とともに低下しません。結晶性知能は主に、学習したスキル、言語能力、文章能力、判断力、連想能力を指します。

「我々は、新しいクラスの時間連続型リカレントニューラルネットワークモデルを導入した」と研究の著者らは書いている。ラミン・ハサニ氏は、コンピューター科学および人工知能研究所 (CSAIL) の博士研究員であり、この研究の主著者です。チームの他の研究者には、MIT教授でCSAIL所長のダニエラ・ラス氏、MIT博士課程の学生アレクサンダー・アミニ氏、オーストリア科学技術研究所のマティアス・レヒナー氏、ウィーン工科大学のラドゥ・グロス氏などがいる。

時系列データが存在する場合、常微分方程式 (ODE) を使用して連続時間の隠れ状態を決定するリカレント ニューラル ネットワークがよく使用されます。研究チームは、この構造を改良して「より豊かな表現学習と表現能力を可能にする」ことに着手した。

「暗黙の非線形性を持つ学習システムのダイナミクスを宣言するのではなく、非線形に相互接続されたゲートによって調整された線形一次動的システムのネットワークを構築します」と研究者らは書いています。

代替案として、研究者らは液体時間定数 (LTC) リカレント ニューラル ネットワーク (RNN) を作成しました。この新しいタイプの再帰型ニューラル ネットワークの利点は、設計上、より表現力に富んでいるため、本質的に透明性と解釈性が高くなっていることです。

この表現力により、研究者はニューラル ネットワークの「思考」プロセスの一部をより深く理解できるようになり、人工知能の機械学習の「ブラック ボックス」の複雑な認知の謎の一部を解明するのに役立つ利点があります。

「結果として得られたモデルは、変化する(つまり、流動的な)時間定数が隠れた状態と結合した動的システムと、数値微分方程式ソルバーによって計算された出力を表現します」と研究チームは書いています。「これらのニューラル ネットワークは安定した有界な動作を示し、ニューラル常微分方程式のファミリーで優れた表現力を生み出し、時系列予測タスクのパフォーマンスを向上させます。」

新しいモデルを評価するために、研究チームは液体時間制約型リカレントニューラルネットワークを用いたいくつかの実験を実施しました。実験には、モーション データからジェスチャーを認識する分類器のトレーニング、センサー データ ストリーム (温度、CO2 レベル、湿度、その他のセンサー) から部屋の占有状況を予測すること、スマートフォン データから人間の活動 (立つ、歩く、座るなど) を認識することなどが含まれていました。その他のテストには、シーケンシャル MNIST、モーション ダイナミクス モデリング、交通予測、1 時間ごとの家庭の電力使用量、オゾン濃度レベル、その他の種類の人間の活動が含まれます。

研究者らは、他の再帰型ニューラル ネットワーク モデル (LSTM、CT-RNN、Neural ODE、CT-GRU) と比較して、時系列予測に関する 7 つの実験のうち 4 つで 5% から 70% の範囲の改善を確認しました。

人工知能は業界や多くの機能にわたって急速に拡大しています。 AI 機械学習がより柔軟で流動的かつ透明になるほど、将来的に AI のセキュリティとパフォーマンスが向上する可能性が高まります。

<<:  それは祝福でしょうか、それとも呪いでしょうか?顔認識技術の長所と短所

>>:  高いリアリティ、全体的な一貫性、優れた外観を備えたぼやけたターゲット向けの NeRF ソリューションがリリースされました

ブログ    
ブログ    

推薦する

中国初!最も人気のあるMoE大型モデルアプリがここにあります。無料でダウンロードでき、誰でもプレイできます。

MoE(Mixed of Experts)モデルは最近とても人気があるので、詳しく紹介する必要はな...

データは今日のビジネスに競争上の優位性をもたらすことができるのでしょうか?

データは今やさまざまな産業に統合され、世界市場のハイライトとなっています。現在の経済成長はデータと切...

AI、機械学習、ディープラーニングはOEMにとって重要な市場です

人工知能 (AI) は、世界中の業界関係者のビジネスのやり方を急速に変えています。 AI がビジネス...

インテリジェントエッジがモノのインターネット (IoT) の変革を推進

2025年までに、世界中に約750億個のIoTデバイスが存在すると予想されています。スマートデバイス...

BiLSTMとCRFアルゴリズムを徹底的に理解する

CRF は、品詞タグ付け、単語分割、固有表現認識などのタスクに使用できる、一般的に使用されるシーケン...

人工知能に適した9つのプログラミング言語

[[436583]] [51CTO.com クイック翻訳]人工知能という用語は、20 世紀半ばに生ま...

...

...

業界の未来を牽引する8つのデジタル変革トレンド

さらに、2024 年までに、産業企業は自己管理テクノロジーと再設計された運用プロセスを組み合わせるこ...

...

テクノロジーの本質: コンピューターは私たちの社会をどのように形作るのでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

AI を使って AI を修正しますか?これらの検出ツールを理解する

生成型AI作成ロボットの登場以来、各界はロボットを使って記事や学術論文を書くようになりました。この状...

単一の GPU で GPT-3 をトレーニングする方法にまだ苦労していますか? HP チューニングの新しいパラダイムをぜひご覧ください。

偉大な科学的成果は試行錯誤だけでは達成できません。たとえば、宇宙計画におけるすべての打ち上げは、空気...

GANは音声を使って画像を生成できるようになった

[[432735]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...