大型家電や自動車を購入するとき、インテリジェント音声機能が搭載されているかどうかを尋ねますか?はい、人々は徐々に人工知能を魔法としてではなく、慣れ親しんだものとして扱うようになりました。 AlphaGoがチェスの王者イ・セドルに4対1で勝利したことで、人々は初めて人工知能が本当に人間を超えることができると認識し、AIの将来性に期待を膨らませた。 近年、ディープラーニングに代表される人工知能技術が急速に発展し、新たなアルゴリズムが次々と登場し、画像認識、自然言語、音声クローンなどの知能レベルは人間のレベルに近づき、あるいは上回るようになりました。同時に、人工知能技術の発展は、データと計算能力における人類の飛躍的進歩も促進しています。 AI技術はさまざまな応用が実現され、私たちの生活のあらゆる面に浸透し、私たちの生活に欠かせないものとなっています。 1.2021 レビュー2021年の浮き沈みを振り返ると、新型コロナウイルス感染症(COVID-19)のパンデミックは依然として世界中で猛威を振るっており、流行終息の兆しは見えません。疫病によってもたらされた国際情勢の急激な変化は、世界の半導体産業チェーンと生態系に深刻な影響を及ぼし、人工知能産業にも衝撃をもたらしました。コンピューティングパワーをめぐる国際的な競争は極めて熾烈です。コンピューティングパワーが同じ次元になければ、当然競争力も同じ次元にはなりません。 2021年、わが国ではチップ不足によるサプライチェーンの混乱事件が相次いで発生し、デジタル化とインテリジェント化への変革が国家重点発展計画に挙げられ、一般的な潮流となっている。 流行はまだ終わっていないものの、2021年の人工知能分野の急速な発展には影響がなく、刺激的なニュースが頻繁に聞かれています。 SenseTimeは中国の「AI四大ドラゴン」の中で初めてIPOによる株式公開に成功し、AphaFold2はタンパク質構造の98%を予測することに成功しました。自動運転の分野では、技術とアルゴリズムの継続的な進歩によりL4シナリオがますます成熟し、自動後退や車線変更など、人間の運転に近い多くの動作を習得しています。 2021年10月、中国科学技術大学の潘建偉、陸朝陽、劉蕃楽らからなる研究チームは、中国科学院上海マイクロシステム・情報化研究所、国家並列コンピュータ工学技術研究センターと協力し、113個の光子と144個のモードを持つ量子コンピューティングのプロトタイプ「九章2号」を構築し、「量子コンピューティングの優位性」を実証するために使用されたガウスボソンサンプリングタスクの高速解法を完成させた。解法速度は、世界最速のスーパーコンピュータの10の24乗(10億倍)も速い。私たちは人類の技術爆発の時代にあり、人工知能の分野もその先頭に立つと信じています。 マルチモダリティマルチモーダル学習は、コンピュータがさまざまなソースからの情報を処理できるようにすることを目的としており、近年、人工知能の分野で研究のホットスポットとなっています。異なるモーダル情報を融合し、異なるモーダル情報間の関係を学習します。 2021年は、OpenAIにとって、画像とテキストをマッチングするCLIPと、入力テキストに基づいて対応する画像を生成するDall·Eを実装する重要な年であり、マルチモーダル学習の始まりとなります。同時に、DeepMind の Perceiver IO はテキスト、画像、ビデオ、ポイント クラウドを分類し、スタンフォード大学の ConVIRT は医療用 X 線画像にテキスト ラベルを追加します。これらはすべて、マルチモーダル学習が増加し、他の分野にも浸透していることを示しています。 フェイスブックはまた、ヘイトスピーチ検出器にマルチモーダル学習を採用し、ソーシャルネットワークから虐待的かつ有害なコンテンツの97%を削除していると述べた。このシステムは、テキスト、画像、ビデオを含む 10 種類のデータに基づいて、ミームやその他の画像とテキストのペアを無害か有害かに分類できます。同時に、Google は検索エンジンにマルチモーダル (および多言語) 機能を追加し、75 言語のいずれかのクエリに応答してテキスト、音声、画像、ビデオ リンクを返すことができるマルチタスク統合モデルを実現したとも発表しました。 巨大モデル機械が人間の言語を理解できるようにすることは、常に人工知能の中心的な願いでした。機械に人間の脳に特有の自然言語を与えることによってのみ、機械は真に「生き生き」することができます。昨年、OpenAI が GPT-3 モデルを提案したことで、主要プラットフォーム上で白熱した議論が巻き起こり、私たちは神の領域に触れたかのようでした。 GPT-3 モデルは、世界最大のディープラーニング モデルである Turing NLP の 10 倍の大きさです。質問に答えたり、翻訳したり、記事をより良く書いたりできるだけでなく、数学的な計算機能も備えています。論文によると、GPT-3は1750億のパラメータを持つ自然言語ディープラーニングモデルです。 誰もがまだ GPT-3 モデルの膨大なパラメータ数に魅了されていた頃、Google Switch Transformer は 2021 年に 1 兆を超えるパラメータを持つ最初のモデルをリリースし、パラメータ規模は最大 1.6 兆に達しました。その後、北京人工知能研究院は1兆7500億のパラメータを持つより大規模なモデル「Wudao 2.0」を立ち上げた。資金力のある AI 企業は、パフォーマンスを向上させるため、また特に言語モデルにおいてその実力を誇示するために、猛烈な勢いでパラメータを積み上げています。言語モデルでは、教師なしおよび半教師ありの事前トレーニング用に大量のラベルなしデータがインターネットから提供されています。しかし、モデルが「大きい」から「巨大」へと移行するにつれて、効果は確かにどんどん良くなりますが、より多くの問題や課題ももたらされることになります。 (1)データの課題:巨大なモデルには膨大な量のデータが必要であるが、インターネットやデジタルライブラリで入手できる高品質なデータが不足している。たとえば、研究者が 30 を超える大規模な言語モデルをトレーニングするためによく使用する 11,000 冊の電子書籍のデータセットである BookCorpus は、特定の宗教に対する偏見を広める可能性があります。 AI コミュニティではデータ品質が重要であることがますます認識されていますが、大規模で高品質なデータセットを収集するための効果的な方法についてはコンセンサスが得られていません。巨大なモデルの場合、大量の高品質データの収集は避けられない障壁になります。 (2)速度と効率:人間のハードウェア能力は常に向上していますが、大規模なモデルのニーズに追いつくことはできません。 Switch Transformer を開発した Google チームは、各トークンにモデルのレイヤーの選択されたサブセットを処理させることでレイテンシを削減する方法を開発しました。彼らの最良モデルは、パラメータが 1/30 しかないモデルよりも約 66% 高速でした。同時に、Microsoft は、データ、レイヤー、レイヤーのグループを並列処理し、CPU と GPU 間でタスクを分割することで冗長な処理を削減する DeepSpeed ライブラリを開発しました。しかし、最善の解決策は依然としてハードウェアの効率を向上させることであり、人間は計算能力の飛躍的進歩を続けなければなりません。 (3)膨大なエネルギー消費:このような巨大なモデルをトレーニングするには大量の電力を消費します。 2019 年の調査によると、8 つの Nvidia P100 GPU で 2 億パラメータの Transformer モデルをトレーニングすると、平均的な自動車を 5 年間運転した場合とほぼ同じ量の二酸化炭素が排出されることがわかりました。巨大なモデルのトレーニングの電力消費をいかに削減するかという問題が、すべての人の前に提起されています。 Cerebras の WSE-2 や Google の最新 TPU など、AI の高速化を約束する新世代のチップは、排出量の削減に役立つ可能性があります。同時に、コンピューティングパワーは国のインフラの一部となっており、コンピューティングパワーによって引き起こされるエネルギー消費の問題も、風力や太陽エネルギーなどのよりクリーンなエネルギーを使用する必要性を促しています。 コンピュータビジョンコンピューター ビジョンは現在、人工知能の中で最も進歩が早く、最も急速に発展している分野であり、常に競争の最前線に立っています。 Grand View Researchによると、世界のコンピュータービジョン市場規模は2020年に113億2000万ドルと評価され、2021年から2028年にかけて年平均成長率7.3%で拡大すると予想されています。現在、激しい競争が繰り広げられているコンピューター ビジョンのサブ分野には、シーン再構成、ターゲット検出、イベント検出、ビデオ追跡、ターゲット認識、3D ポーズ推定、モーション推定、視覚サーボ、3D シーン モデリング、画像復元などがあります。 上場企業であるSenseTimeが提供するOpenMMLabは、これまでで最も完全なコンピュータービジョンアルゴリズムシステムおよびフレームワークであり、「人工知能アルゴリズムのオープンシステム」であり、10を超える研究方向を含み、100を超えるアルゴリズムと600を超える事前トレーニング済みモデルを公開しています。現在、OpenMMLab は、単一ポイント、単一方向のオープンソースおよび単一論文のオープンソースから、ますます繁栄するオープンソース システムへと徐々に移行し、基礎となるトレーニング フレームワーク、コンピューティング プラットフォームと科学研究、教育、アルゴリズム生成の間の重要な架け橋およびリンクとなり、AI 研究および産業化のプロセスを大幅に加速しています。 強化学習強化学習は、人間の学習プロセスに最も近いAIと言えます。彼らの立場に立って考えてみると、私たちが幼少期から成人期まで継続的に学習することは、試行錯誤の連続です。強化学習は本物の子供のように、自ら成長し、ガイドとして大量の履歴データを必要としません。監督なしで学習することだけが、人工知能の最良の形です。 強化学習理論は、人間の行動心理学にヒントを得たもので、オンライン学習に重点を置き、探索と活用のバランスを維持しようとします。強化学習は、教師あり学習や教師なし学習とは異なり、事前にデータを与える必要がなく、行動に対する報酬(フィードバック)を環境から受け取ることで学習情報を取得し、モデルのパラメータを更新します。過去数年間、Facebook、Google、Deepmind、Amazon、Microsoft のいずれの企業も、強化学習における継続的なイノベーションを促進するために、多大な時間、資金、人材を投資してきました。 2. 国内大手AIクラウドプラットフォームの登場人工知能の普及が進む中、国内大手企業もAI分野への投資を始めました。 AI オープン プラットフォームは、過去のクラウド コンピューティング プラットフォームと同様に、雨後の筍のように出現しています。 AIオープンプラットフォームは企業にとって重要なインフラとなっています。中国の代表的な AI オープン プラットフォームは次のとおりです。
AIクラウドプラットフォームの本質は、ビッグデータ時代の古典的なリースモデルを今も継承しており、数年前のビッグデータが隆盛だった時代に戻ったようです。 AIクラウドプラットフォームの利点は、より多くの開発者がAIをよりシンプルかつ直感的に理解できるようになることです。誰もが学べるトップカンファレンスモデルを多数提供すると同時に、開発者が自分の作品をアップロードして展示できるプラットフォームも提供しています。 AIがもう遠い存在ではなく、誰もが使える存在になりましょう。成熟したコミュニティ文化だけが新しいクリエイターを育成し、より多くの人工知能製品が市場に登場できるようにします。これがAIクラウドプラットフォームの核心的な意義です。 3.2022 トレンド創業17年目を迎えたFacebookが、社名を「Meta」に変更することを2021年10月28日(米国時間)に正式発表し、業界に衝撃の嵐を巻き起こした。ザッカーバーグ氏は、メタバースが到来したことを実際の行動で皆に発表した。来たる2022年は、人工知能の新たなトレンドの到来を告げるでしょう。 メタバースの真の転換点2021 年にメタバースが単なる夢想家の希望的観測に過ぎないと人々が考えるなら、2022 年は人類の「世界」という言葉に対する理解を真に覆し始めることになるでしょう。したがって、著者は 2022 年がメタバースにとって真の転換点になる可能性があると考えています。技術的な観点から見ると、メタバースの主な技術グループは、ネットワークおよびコンピューティング技術、人工知能、ゲーム技術、ディスプレイ技術(VR、AR、MR、さらにはXRなど、体験は絶えず深化しています)、ブロックチェーン技術です。著者は、人工知能がメタバース全体の中核となり、メタバースの母体、あるいは頭脳となると信じています。真の社会形態を進化させるためには、マトリックスはさまざまなルールを設定し、社会形態を絶えず修正するのではなく、自ら常に学習する必要があります。映画「ゲーマー」と同様に、マトリックスによって作成された NPC も社会形態の進化に合わせて進化します。 ブルームバーグ・インテリジェンスによれば、メタバースへの投資と価値は今後数年間で増加の一途をたどり、2024年までに8,000億ドルに達すると予想されています。このような巨大なチャンスに直面して、市場は人工知能の生産能力の飛躍的進歩を促し続けるだけだろう。 コンピューティングパワー革命自動運転に対する世界的な需要が拡大し続ける中、2022年には高性能コンピューティングチップをめぐる競争が非常に活発化するだろう。なぜなら、今年はNvidiaの自動運転チップOrinが量産され、QualcommのSnapdragon Rideも量産され、中国の新興企業の高計算能力チップも量産されるからだ。楊宇新氏は、一連のデータを示しました。テスラ モデル S の計算能力は 2014 年から 2016 年まで 0.256TOPS、NIO ES8 の計算能力は 2017 年に 2.5TOPS、テスラ モデル 3 の計算能力は 2019 年に 144TOPS、Zhiji L7 の計算能力は 2021 年に 1070TOPS、NIO ET7 の計算能力は 2022 年に 1016 TOPS でした。このデータセットは、インテリジェント運転における小さな前進には、コンピューティング能力の大きな前進が必要であるという事実をさらに裏付けています。コンピューティングパワーの役割は自動車業界にのみ反映されているわけではない。2021年11月8日、アリババDAMOアカデミーはマルチモーダル大型モデル「M6」の最新の進捗状況を発表した。そのパラメータは数兆から10兆に跳ね上がり、世界最大のAI事前トレーニングモデルとなった。 10月、M6は再び業界の限界を打ち破り、512個のGPUを使用して、わずか10日間で10兆個の使用可能なモデルをトレーニングしました。2020年にリリースされた大規模モデルGPT-3と比較すると、M6はわずか1%のエネルギー消費で同じパラメータスケールを達成しました。 ますます強力になるコンピューティング能力は、よりスマートな人工知能モデルの利用可能性の基盤となります。人工知能業界が発展し続けるにつれて、それは単なる技術革命ではなく、コンピューティング能力の革命でもあります。人工知能モデルの主な消耗品である計算能力が、人工知能の進歩の速度を決定します。 2021年11月、ムーアスレッドは20億人民元のシリーズA資金調達ラウンドを完了したと発表しました。今回の資金調達は、上海国勝資本、5Yキャピタル、BOCインターナショナル傘下の渤海中勝基金が共同で主導し、CCBインターナショナルや前海シード基金を含む9つの機関が共同で投資した。ムーアズ・スレッド社は今回の資金調達を発表すると同時に、同社初のフル機能GPUチップが予定通り開発され、国内の主流CPUやOSへの採用が始まったことも発表した。調達した資金は主に、初のGPUチップの量産・製造、GPU SOC関連IPの研究開発、国内GPUエコシステムの拡大に充てられる予定。コンピューティングパワー革命が始まると、すべての国が多額の資本と人材を投入するでしょう。この火薬の煙のない戦争は、人工知能を新たな高みへと押し上げるでしょう。 AIの敷居を下げることで、産業生産への包括的な応用が進むAIの継続的な発展と人間の計算能力の継続的な向上により、AIを使用するための敷居はますます低くなっています。インテリジェント音声システムやインテリジェント顧客サービスなどの商用アプリケーションは、あらゆる場所で使用されています。一方、短・中・長編動画ビジネスは世界的に依然として比較的高い成長率を維持しており、動画コンテンツの制作者やコンテンツの消費者も非常に活発に活動しています。中でも、世界で最も人気のあるモバイルアプリケーションである「Tik Tok」は、多数のインテリジェントなビデオ処理技術を使用して、クリエイターがより良い作品を作成できるようにしています。さらに、北京冬季オリンピックのAI仮想天気予報キャスター、AI手話キャスター、会場スマートガイド、インテリジェント言語翻訳機、ホークアイ審判、AIアスリートトレーニングシステムなどは、すべて人工知能の総合的な応用の現れです。 事前トレーニング済みの大規模モデルにより、AI アプリケーションの敷居が下がり、AI アプリケーションにおけるデータと業界知識という 2 つの難しい問題が解決されます。基礎的な基盤を確保しながら、大量のラベル付きデータを必要としません。したがって、起業家が直面する最大の問題は、もはや技術的なブレークスルーを達成する方法ではなく、ビジネスモデルを確立する方法、クローズドビジネスループを実装する方法、そして技術を製品に変換する効率性です。 科学界におけるAI技術は新たな生産ツールとして機能するAlibaba DAMO Academy の 2022 年のトップ 10 テクノロジー予測によると、トレンド 1 は「科学のための AI」です。 引用: 実験科学と理論科学は、何百年もの間、科学界の 2 つの基本的なパラダイムであり、人工知能は新しい科学研究パラダイムを生み出しています。機械学習は、膨大な量の多次元およびマルチモーダルデータを処理し、複雑なシナリオにおける科学的問題を解決し、これまでは到達できなかった新しい領域への科学的探究を導くことができます。人工知能は科学研究のプロセスを加速するだけでなく、新たな科学法則の発見にも役立ちます。今後 3 年間で、人工知能は応用科学で広く使用され、一部の基礎科学の科学者にとって生産ツールになり始めると予想されます。 そうです、DeepMind は 2021 年初頭にタンパク質構造の 98.5% を予測できる AlphaFold2 をオープンソース化しました。 2021年12月、DeepMindは初めて人工知能を使用して数学者が2つの新しい数学的推測を提案するのを支援し、それがNatureの表紙に掲載されました。著者らは、低次元トポロジーには未知の非線形関係があると推測し、大量のデータを生成してニューラルネットワークを使用して近似関数をフィッティングし、フィッティングプロセスで 3 つの量が非常に重要な役割を果たしていることを発見しました。数学者は、フィッティング実験を行い、新しいデータを生成し、新しい観測モデルを取得することで、最終的にその知恵を駆使して不等式構造を推測し、さらに厳密な証明を与えました。 これは、人工知能が科学者にとって新たな生産ツールとなった後、科学の発展の進歩を加速できるだけでなく、人工知能が新たなアイデアを生み出し、さらには特定の科学に新たな方向性を与えることもできることを示しています。 4. まとめ2022年は人工知能技術が爆発的に進歩する年となり、前例のない成果を目撃することになるかもしれません。人工知能は私たちの生活に浸透し、より多くの利便性をもたらすとともに、より多くの課題と機会をもたらしています。 |
<<: MITの研究者らが、致命的な出血を止めるためにAIを活用するハンドヘルドロボットを開発
>>: エンタープライズ向け人工知能プラットフォームの選択ガイド
グラフ ニューラル ネットワーク (GNN) は、グラフの構造情報を推論に活用するのに優れていますが...
長年にわたり、AI テクノロジーの発展と変化に伴い、さまざまな業界や IT 意思決定者がこの分野に多...
MetaImage は最近、テクノロジー界で大きな話題を呼んでいます。論文「IMAGEBIND: ...
研究者たちは、特定の昆虫の神経系の機能が、決定論的、確率的、揮発性、不揮発性メモリの機能とどのように...
[[434145]]職場における支援/拡張現実 (AR) と人工知能 (AI) の可能性を最大限に引...
Google や Facebook のアルゴリズムを理解しなければ、面接に合格することはできません。...
今の時代の発展は本当に速すぎます、それを今実感していただけると思います。 3G から 4G、そして ...
この記事では、機械学習の知識を広め、機械学習で何ができるのか、どのように行うのかを簡単に紹介します。...
人工知能 (AI): ChatGPT などのツールの最近の登場により、AI はビルダーの間で注目を集...
[[271164]]人類史上初のプログラム可能なメモリスタ コンピュータが誕生しました。音声コマン...
[[429514]]ベアリングポイントは、IT リーダーが今後 1 年間にどのテクノロジー分野に重点...
[51CTO.comより引用] デジタル時代において、ビッグデータと人工知能は企業のビジネス成長を推...
[[269803]]最近、研究者たちはニューラルネットワークに基づく新しいアルゴリズムを使用して量子...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...