アリババ、AI研究所、清華大学が共同でAIに認知能力を与える新しいAIモデルを発表

アリババ、AI研究所、清華大学が共同でAIに認知能力を与える新しいAIモデルを発表

1月12日、アリババ、AI研究所、清華大学などの共同研究チームが、新たな超大規模認知事前トレーニングモデル「Wenhui」を発表した。このモデルは、AIの理解能力を向上させるだけでなく、常識に基づいたAIの作成も実現できます。将来的には、テキスト理解、人間とコンピューターの相互作用、視覚的な質疑応答などのシナリオに適用される予定です。

従来の手動でラベル付けされたデータを必要とする AI トレーニングとは異なり、認知事前トレーニング済み言語モデルは、AI が最初に大量の言語、テキスト、画像データを自動的に学習し、情報と人間の言語表現のルールを記憶して理解し、その後専門知識をさらに学習するという新しい学習アプローチを提供します。これにより、AI は常識と専門知識の両方を習得できるようになります。

今回公開された「Wenhui」は、パラメータ規模が113億で、現在中国最大の事前トレーニングモデルです。複数の並列戦略を統合するアリババの自社開発の高性能分散フレームワークを採用し、モデル並列性、パイプライン並列性、データ並列トレーニングを使用して分散トレーニングを行います。 「文匯」はマルチモーダル理解とマルチモーダル生成という2つの大きな難関を突破し、テキストと画像情報を簡単に理解し、創造的なタスクを完了することができます。たとえば、詩のタイトル、王朝、作者を入力するだけで、Wenhui は古代の詩を自動的に生成できます。現在、「Wenhui」は認知推論に基づくさまざまな自然言語およびクロスモーダルアプリケーションタスクをすでにサポートしており、いくつかのアプリケーションはまもなくリリースされる予定です。


このモデルは、詩のタイトル、王朝、作者に基づいて詩を自動的に生成することができます。

DAMOアカデミーの2020年トップ10テクノロジートレンドでは、AIは「聞く、話す、見る」などの知覚知能分野で人間のレベルに到達または上回っているが、その論理的推論能力はまだ初期段階にあると述べられています。マルチモーダル事前トレーニングモデルは、知覚知能から認知知能への飛躍を達成するための重要な基盤です。 DAMOアカデミーのインテリジェントコンピューティング研究所の所長である周景仁氏は、「事前トレーニング済み言語モデルは、過去70年間で最も革新的な自然言語モデルの1つです。そのモデル設計の難しさは、従来のモデルよりもはるかに高いです。DAMOアカデミーの研究チームは、アルゴリズムとシステムエンジニアリングの課題を克服し続け、人工知能から認知知能への移行を加速していきます。」と述べました。

アリババは中国で最も早く認知知能研究に投資したテクノロジー企業の一つで、トップクラスの国際会議に30以上の研究成果が発表され、世界人工知能大会の最高賞であるSAIL賞を受賞し、清華大学と共同で国家科学技術進歩賞の2等賞を受賞しました。同社のグラフニューラルネットワークフレームワークGraph Learnは世界にオープンソース化されており、モデルの計算能力とストレージリソースの消費量を削減するとともに、アルゴリズムの開発とリリースサイクルを短縮することができます。

<<:  2021年の人工知能業界の予測

>>:  AI愛好家が注目するべき8人のインスタグラマー

ブログ    
ブログ    
ブログ    

推薦する

JavaScript チュートリアル: Web アプリケーションに顔検出機能を追加する

[51CTO.com クイック翻訳] 先週、annyang を使用してマップ インターフェースに音声...

業界関係者が語るウルトラマン解雇:業界にとっては大激震だが、AI開発の全体的な動向には影響しない

米国の人工知能スタートアップOpenAIは11月18日、金曜日に大きな人事異動を発表した。CEOのサ...

...

Facebook がアルゴリズム コード ライブラリ PySlowFast をオープンソース化、最先端のビデオ理解モデルを簡単に再現

Facebook AI Research は近年、ビデオ理解研究において多くの素晴らしい成果を上げて...

人工知能の時代において、自己成長と教育においてどのような取り組みがなされるべきでしょうか?

近年、私たちは時代の広大さと大きな変化を痛感しています。潮流の下では、個人は泥や砂のように小さく、そ...

機械学習を活用して産業オペレーションにおける運用リスクを管理する

センサーデータは、産業オペレーションにおける運用の安全性と効率性を確保する上で重要な役割を果たします...

機械学習コードを単体テストするにはどうすればいいですか?

現在、ニューラル ネットワーク コードの単体テストに関する特に包括的なオンライン チュートリアルはあ...

再び攻撃! AI+教育に注力する学百軍は、年間10億元という小さな目標を設定

「今年末までに、学覇君は年間売上高10億元を確保するという小さな目標を達成する予定です」と張凱蕾氏は...

Meta と Microsoft が、開発者が生成型 AI アプリケーションを構築できるようにオープンソース モデル Llama 2 をリリース

7月19日、MetaとMicrosoftは協力して、研究や商用目的で無料で使用できるMetaの次世代...

Hinton チームの新しい CV 研究: ターゲット検出に言語モデルを使用、DETR に匹敵するパフォーマンス

[[426028]]視覚オブジェクト検出システムは、画像内のすべての定義済みカテゴリのオブジェクト...

...

米連邦取引委員会は、ChatGPTによるデータ漏洩と回答の捏造を含むOpenAIに対する徹底的な調査を開始した。

ワシントンポスト紙によると、7月13日、米国連邦取引委員会(FTC)はサンフランシスコに拠点を置くO...

グラフィカル分散コンセンサスアルゴリズム

本日の記事では、グラフを使用して分散一貫性の実装原則を深く研究し、理解します。まず、自己を見つめ直す...

機械学習が自動車産業を次のレベルに引き上げる方法

機械学習は、ユーザーエクスペリエンスを向上させ、ビッグデータの力を活用することで、自動車業界を次のレ...