2020年が終わり、2021年が始まりました!私たちは最近、人工知能の専門家たちにインタビューし、2021年の人工知能分野の主な発展動向についての見解を伺いました。 これらの専門家は主に、カナダのモントリオール学習アルゴリズム研究所(MILA)、アメリカの情報技術調査分析会社ガートナー、Facebook、Amazonの人工知能研究開発部門Alexa AI、アメリカ航空宇宙局(NASA)、許可ベースの電子メールマーケティングサービスプロバイダーMailchimpなどの組織や機関から来ています。
画像出典: RE•WORK アメリカの情報技術調査分析会社 ガートナーのデータサイエンスリーダー アンドリー・ブルコフ 一部の企業は、ユーザーとの試験運用後に自宅と職場間のポイントツーポイントの無人通勤サービスを開始する可能性があるが、完全自動運転車は2021年でも「運行準備が整っている」。 さらに、完全自動運転のトラックが海岸の端から端まで高速道路で長距離走行を開始する(プロセス全体に人間による遠隔監視の支援が必要になる可能性がある)が、最後の 1 マイルの運転は依然として安全担当者によって直接制御される。 さらに不気味なことに、GPT-3 などの Transformer ベースの事前トレーニング済みモデルは、知能を装うことがさらに得意であり、知能を装う程度によっては、知能を獲得したと思わせる可能性さえある。 NASAの機械学習部門責任者、 写真共有サイトPinterestの技術インキュベーション責任者、 クラウド、モバイル、エッジスマートデバイス向けの実践的なディープラーニング 本の著者 アニルド・コール 2021年、私がとても楽しみにしていることが2つあります。 1 つは大きくなるもので、もう 1 つは小さくなるものです。未来を予測する最良の方法は、過去を振り返ることです (おそらく、過去に Long Short-Term Memory ネットワーク (LSTM) を構成することによって)。 2 年間で、当社の事前トレーニング済みモデルは、サイズが 440 MB の BERT から、サイズが 350 GB の GPT-3 に成長しました。すでにクラウド経由でスーパーコンピューターをレンタルし、285,000 個の CPU コアと 10,000 個の GPU (シリコンバレーの大物が共同設立した人工知能の非営利団体 OpenAI 向けに Microsoft が開発) の計算能力を活用できるようになっている。 ポケットに収まる iPhone A14 チップに 118 億個のトランジスタを搭載することが可能になりました。今では ImageNet を 90 秒でトレーニングできますが、10 年前はこのプロセスに数か月かかっていました。 したがって、コンピューティング、モデル、アルゴリズムのパワーは飛躍的に成長し続け、人工知能の新たな魔法が一般の人々にさらに明らかになることが予測できます。 一方、FastFormers を使用することで、CPU 推論が 233 倍高速化され、BERT の精度を達成できるようになりました。現在、NVIDIA Maxine を介して、以前の 500 倍の帯域幅でビデオ通話を送信できます。 AutoML モデルのトレーニング時間を 40,000 GPU 時間 (2018 年の MNasNet) から 3.75 時間 (2019 年のシングルパス NAS) に短縮しました。 モデルのプルーニングとモデルの量子化だけに焦点を当てることは、私たちのモデルの研究テーマではありませんが、研究テーマは、実践者がすでに記述した効率的な 3 行のコード (TensorFlow Model Optimization Toolbox) です。 2021 年には、小さなことに注意を払う喜びがさらに高まり、エッジ スマート デバイスのユーザーは強力なモデルに基づいた魔法のような体験をすることができるようになります。 感情センシングのスタートアップAffectiva 共同創設者兼CEO ラナ・エル・カリウビ博士 COVID-19 パンデミックの期間中、オンラインでのコラボレーションとコミュニケーションを促進するために、感情を認識する AI の新たな使用例が見られるようになるでしょう。 COVID-19 パンデミックの間、私たちはこれまで以上にビデオ会議に頼っています。ビデオ会議は私たちを仮想的に結びつけ、遠隔地で仕事をしたり、自宅で勉強したり、社会生活を送ることを可能にします。 しかし、現在存在する大きな問題は、これらの技術が感情認識において盲点を持っていることです。対面でコミュニケーションをとると、言語そのものを通じて情報を伝達できるだけでなく、表情、声のトーン、ボディランゲージを通じて自分自身を表現することもできます。しかし、これらのテクノロジーはもともと、私たちの周囲の人々とのやり取りのニュアンスを捉えるために設計されたものではありません。 人工知能を使えば、仮想環境でも人間性を保つことができるかもしれません。具体的には、顔の表情や声に基づいて微妙な感情や複雑な認知状態を理解できる感情認識 AI ソフトウェアは、パンデミック中に生じた技術的な欠陥の一部に対処できるため、企業が次のような新しいユースケースに適用することが見込まれます。 ビデオ会議と仮想イベント – 感情を認識する AI は、仮想イベントや会議中の人々の感情を理解することができます。オンライン講演者に実際の聴衆からのフィードバックを提供し、参加者に共通の体験を提供すると同時に、企業がこのストレスの多い時期に集団的な関与を理解するのに役立ちます。 オンライン学習 – 感情を認識する AI は、オンラインの教育資料や指導に対する学生の関与に関するフィードバックを提供できます。システムは、生徒が混乱したり、緊張したり、退屈したりしたときに信号を送ります。多くの学生がオンライン学習で「Zoom疲れ」を発症しているため、これはパンデミック中に特に重要です。 遠隔医療 – 対面での診察に代わって遠隔診療がますます増える中、感情を認識する AI により、患者と医療提供者の間でより有意義な話し合いと信頼関係を築くことができます。さらに、患者の精神的健康に関するデータ駆動型の分析は、単純な 1 から 10 のスコアを使用して患者に自己評価を求めるのではなく、精神的健康の定量的な評価方法も提供します。 博士研究員 アレクシア・ジョリクール=マルティノー アニール ランジュバン サンプリングによるノイズ除去スコア (DSM-ALS) と拡散ノイズ除去のバリアントは、モデル生成の記録を破り始め、現在の最先端の敵対的生成ネットワーク (GAN) を上回るでしょう。 また、生成モデルの新しいメトリックも登場します。現在のメトリックである IS (インセプション スコア) と FID (フレシェ インセプション距離スコア) は、値を完璧に近づけますが、まだフォトリアリスティックなグラフィックスには至りません。 人工知能エージェンシー Got-It AI チーフサイエンティスト兼会話型AI責任者 チャンドラ・カトリ コード不要の AI プラットフォーム、製品、スタートアップが急増し始めています。過去数年間で、PyTorch や Tensorflow など、多くの強力なディープラーニングおよび AI ツールが作成されました。エンジニアは、既存のツールの上にコード不要の AI プラットフォームと製品レイヤーを構築する準備が整いました。ユーザーは、構成またはユーザー インターフェイスを通じてデータを提供し、モデルを一覧表示または選択するだけです。 モデルをトレーニングして提供できるだけでなく、REST API を通じてアプリケーションに公開することもできます。 Got-It AI は、会話型 AI の普及に向けて、コード不要、自己発見、自己トレーニング、自己管理のプラットフォームを開発しました。マイクロソフトは最近、誰でも人工知能モデルをトレーニングできる「Lobe」というアプリケーションをリリースし、人気の会話型人工知能の方向へも進んでいます。 持続可能な開発のための人工知能: 私たちは、パンデミック(SARS、H1N1、COVID-19を含む)がより一般的になり、気候変動により多数の森林火災や種の絶滅が起こり、洪水や干ばつなどの問題がより一般的になりつつある段階を経験しています。 持続可能な開発のために AI を活用するスタートアップ企業や、大企業や組織が資金提供している取り組みがますます増えていくでしょう。スロバキアの再生可能エネルギー企業 Fuergy やカナダのライドシェアリングプラットフォーム Facedrive などのグリーンテクノロジーのスタートアップ企業ではすでにこの現象が見られ、AI のスタートアップ企業が予測モデリングを使用して気候変動、パンデミックの予測と緩和、都市交通問題などに対処するようになるとみられます。 モントリオール人工知能倫理研究所 (MAIEI) 創設者兼主任研究員、 Microsoft の機械学習エンジニア イノベーション・技術協力課(CSE) チーフAI委員会メンバー アビシェク・グプタ 私の予測(そして心からの希望)は、倫理、安全性、インクルージョンが、AI 分野で働くすべての人が日常的に従う原則になるということです。さらに重要なことは、差分プライバシーのような概念が主流となり、日常業務にうまく統合されるようになると予測しています。 新しい組織が、業務を遂行するために AI を使用することの価値を認識し始めるにつれて、AI が適用されている従来の領域以外でも、多くの能力構築作業が行われるようになると私は予測しています。 AIツールが使いやすくなるにつれて、市民データサイエンティストという概念がさらに注目され、AI技術は人類社会にとって大きな意義を持つ問題を解決する新しい方法として活用されるようになるでしょう。 最後に、情報汚染などの問題が深刻化するでしょう。そして、組織やグループが意識を高め、環境をよりうまく乗り越えるためのスキルを国民に身につけさせる取り組みを通じて、知識構築の時代が到来すると信じています。 主任研究科学者 シャリニ・ゴーシュ 人々が自宅や職場環境で AI 対応デバイスに触れる機会が増えるにつれ、これらのデバイスがユーザーの実行を支援できるタスクの数は増え続けるでしょう。たとえば、スマート アシスタントは、ユーザーが映画のレンタルやオンラインでの食べ物の注文などのタスクを完了するのを支援し、スマート モニタリングは異常なイベントを検出して家の安全を確保できます。 多くのタスクはマルチモーダルであり、ビデオ、オーディオ、音声、テキストデータの処理と分析が含まれます。 したがって、2020 年にすでに見られたように、2021 年もマルチモーダル AI への関心が高まり続けるでしょう。 さらに、多くの高レベルタスクではラベル付けされたトレーニング データが不足しているため、少量学習や自己教師あり学習など、スパース データ環境での学習手法に関するさらなる研究が求められています。 最後に、多くの AI タスクがユーザーのデバイス上で実行されるため、デバイス上の機械学習 (およびより広義ではリソースが制限された機械学習) に対する研究上の関心が高まるでしょう。 Mailchimp、許可ベースのメールマーケティングサービスプロバイダー データサイエンティスト ムハンマド・アハメド ゼロショット注釈をもっと活用しましょう!近年、私たちは多数の事前トレーニング済みの自然言語処理 (NLP) モデルの利点を徹底的に研究してきました。最近の多くの研究では、すぐに使用できる分類器としてゼロショット (ZS) 学習器を使用することが好まれています。 2021 年には、ゼロショット学習を使用してデータセットに注釈を付け、分類器をすぐにトレーニングする人が増えると予想しています。ゼロショット分類と比較して、ゼロショットラベリングの利点は次のとおりです。 無料のアノテーション: 高価なアノテーター (Amazon Mechanical Turk など) なしでデータセットを管理できます。 注釈ガイダンス: 自由記述の注釈タスクを単純な真偽注釈に変換する プライバシー保護注釈: 機密データ (医療データや遺伝子データなど) に注釈を付けるときに非常に便利です。 複数のソースからゼロショットラベル付きサンプルを取得し、その結果得られるトレーニングセットサンプルの多様性 将来開発される新しい分類器を訓練する能力 推論速度の向上(マルチクラス、ゼロショット、自然言語推論(NLI)などの一部のシナリオ) フルスタックデータサイエンティストの成長 多くの機械学習タスクにとって、将来のエンジニアリングとモデリングはもはや困難ではありません。これは主に、ここ数年の機械学習の分野での驚異的な進歩によるものです。 自然言語の理解と生成には、トランスフォーマーを使用することが知られています。コンピュータービジョンの場合、CNN を使用することが知られています。リスト型データの場合、バギングやブースティングなどのアルゴリズムを使用することが多いツリーメソッドを使用することが知られています。これにより、これまでかかっていた多くの時間を節約し、最先端のモデルを迅速にトレーニングしてトラブルシューティングや実験を行うことができます。 多くのデータ サイエンス チームにとっての新たな問題点は、モデルのデプロイと本番環境対応のコードの作成であり、開発者にはソフトウェア エンジニアリングと MLOps のスキルが求められます。 2021 年には、機械学習エンジニアとフルスタックデータサイエンティストの需要がさらに高まると予想しています。
データ管理プラットフォーム「Aperture Data」 創設者兼CEO ヴィシャカ・グプタ 機械学習とデータ サイエンスの分野が成熟するにつれて、機械学習業界は、特定のデータセットにおけるモデルのパフォーマンスと精度の向上から、MLOps の課題の解決へと進化しています。 現在の機械学習ツールとプラットフォームでは詳細が抽象化されているため、将来的には実現可能性を証明することよりも、複雑さを軽減し、生産性を高め、リアルタイムの企業データ(一定の遅延とフットプリント内)で結果を示すことに重点が置かれると考えています。 機械学習を通じてデータからビジネス価値を引き出すには複数のステップが必要であり、このプロセスは現在でも複数の独立したソリューションを使用して解決されています。これらのソリューションを統合すると、システム効率が低下します。 これらのさまざまなステップのそれぞれがデータとやり取りし、統一された効率的な方法でデータとやり取りすると仮定すると、どの段階であっても、機械学習パイプラインの複雑さは規模に応じて軽減されます。 私の研究はインテリジェントなデータ管理の分野に焦点を当てています。 2021 年には、エッジ デバイスとクラウド上でよりシンプルでスケーラブルな機械学習の展開を可能にするインフラストラクチャにますます注目が集まり、解決までの時間と、実際のデータに対して大量のトレーニングおよび検証タスクを安全に実行する能力が主要な指標になると予測しています。一方、エネルギー効率は二次的な指標ではあるものの、今後ますます重要になってくるでしょう。 2021 年に注目に値するもう 1 つの分野は、より代表的なデータセットでモデルがどれだけうまく機能するかを検証するためのツールです。いくつかの研究グループは、モデルが現実世界の画像キャプチャによってどのように影響を受けるか、テキスト データがどのように問題になるか、トレーニング セット データ自体がどのように代表的でないかを特定しました。 モデルの精度を評価するための標準化された指標や中立的な第三者検証ツールやサービスがさらに増えるだろうと考えています。これらのツールやサービスは、最終的にソリューションの運用およびパフォーマンスのメトリックを組み込んで、全体的なスコアカードを提供します。 カナダのテクノロジーヘルス企業 WinterLight Labs 機械学習部門長 エカテリーナ・ノビコワ 2020年は多くの人にとって特別な年であり、ポジティブなエネルギーはあまりありません。 COVID-19の発生、健康リスクの増大、世界中での前例のない移動および旅行制限、およびCOVID-19パンデミックのその他の影響により、私たちの日常生活は大きく変化しました。 このような背景により、さまざまな分野で AI の導入が加速し、2021 年には大きな変化が起こるのではないかと考えています。 まず、AI ソリューションはヘルスケア分野、特にメンタルヘルスの分野でより広く使用されるようになります。うつ病、不安、ストレスなどの問題に苦しむ人々の数は劇的に増加しており、AI ベースのツールとソリューションはこの危機に対処できるし、対処すべきです。 第二に、COVID-19パンデミックがまだ完全に制御されていないため、さまざまな追跡アプリケーションの使用や同様のAIベースのソリューションの出現により、個人のプライバシーの問題が特に顕著になっています。 これらの製品は非常に有用であり、必要な社会的制御を実施し、発生を予測し、感染を追跡するのに役立つことは明らかです。しかし、AI によって引き起こされる潜在的なプライバシーへの悪影響は、2021 年に深刻な問題となるでしょう。
シュアスタート 創設者兼CEO タニヤ・ミシュラ 人間や社会全体に焦点を当てた AI 製品がさらに増えるでしょう。 AI やテクノロジーを含むすべてのビジネス分野で、多様性、平等、包括性 (DEI) の問題が再び注目されており、この新たな傾向は消えることはありません。 具体的には、DEI のこれら 3 つの側面を無視する AI 企業は、収益に影響を及ぼすビジネスリスクを負うことになります。 AI がすべてのターゲット市場やユーザーにサービスを提供できない場合、これらの企業は実際には自社の業務の価値を最大化できていないことになります。 多くの企業がすでに、データやアルゴリズムの偏りの技術的評価を通じて、人工知能の多様性と倫理的問題に注目し、対処しており、これも非常に重要です。しかし、この問題に真剣に取り組み、人種的平等と正義に関する議論を検討するのであれば、人々、社会、そして AI を構築するチームにもっと焦点を当てる必要があると私は考えています。 トップダウンの DEI イニシアチブが失敗することが多いのは誰もが目にしたことがあるでしょう。多くの場合、個々の従業員が日常の意思決定に DEI を具体化する方法を理解していなかったり、それらの意思決定に感情的なつながりを感じていなかったりすることが原因です。 そのため、2021年には、AI企業がDEIに対してボトムアップのアプローチを採用し、社員、特に技術スタッフの視野を広げて、「誰が」エンジニアで、「誰が」科学者で、「誰が」技術専門家であるかをさらに理解できるようになるでしょう。 さらに、AI はもはや純粋に技術的な分野ではなく、人間への影響を理解するには学際的なアプローチが必要です。すでにこのことについて深く考えている企業は、専門チームの構築を開始するでしょう。チームのメンバーには、技術的な才能だけでなく、専門的に訓練された倫理学者、社会学者、人類学者も含まれ、製品の技術や仕様を超えた観点からテクノロジーの影響について考えることができることが多いです。 科学技術への信頼を回復するには、AI 業界がデータを利用する方法を変える必要がある。長年にわたり、多くの企業がイノベーション主導型企業 (IDE) になるために奮闘してきました。しかし現在、新たな焦点はデータ駆動型企業 (DDE) への発展に移っています。 DDE は人工知能企業にとって特に重要です。結局のところ、AI システムでは、アルゴリズムをトレーニング、テスト、検証するために大量のデータが必要です。 しかし、この大量のデータには、そのデータを収集、保存、使用したり、倫理的な人工知能を構築するために活用したりする際には、多大な責任が伴います。 消費者が自分のデータがどのように、誰によって使用されるかについての決定に関与することを望むようになるにつれて、市場もこれらの倫理的課題によって推進されるようになるでしょう。個人データへのアクセス制御は、技術開発者や技術企業の所有者ではなく、ユーザーが行うことになります。 AI 企業はこれを念頭に置き、データの収集、保管、使用をより透明化する方法を見つける必要があります。同時に、AI システムの公平性と公正性を確保するために、このデータがどのように使用されるかについても注意する必要があります。 そのため、AI 企業はアルゴリズムのテストと検証を行う際に制約を組み込む必要があり、全体的な精度だけでなく、白人男性と黒人女性など、さまざまな人口統計グループ間でどの程度一般化できるかを具体的にチェックする必要があります。そうすることで初めて、組織は AI を製品に導入する前に、偏見の具体的な領域を特定し、対処できるようになります。 ディープラーニングスタートアップ DeepCube 共同創設者兼最高技術責任者 イーライ・デイビッド博士 最先端のディープラーニングモデルがますます大規模化しているという明確な傾向が見られます。 2019 年、最大のディープラーニング モデルには約 10 億個のパラメーター (重み) がありました。 2020 年までに、最大のディープラーニング モデルのパラメーター数は 1,000 億を超え、わずか 1 年で 100 倍以上増加しました。 これらの大型モデルは、精度が向上しているという利点もあります。ただし、計算要件とメモリ要件は同じ割合で増加しています。したがって、これらのモデルのサイズを大幅に縮小し、速度を向上させることができるソリューションが、導入においてますます重要になります。 |
<<: 2021年になっても、データにラベルを付ける方法がまだわかりませんか?なぜ人工知能にはデータ注釈が必要なのでしょうか?
>>: EUがAIを活用して社会イノベーションを推進する方法
世界経済フォーラム(WEF)は毎年、世界経済と社会に大きな影響を与える可能性のあるトップイノベーショ...
マイクロソフトのサティア・ナデラCEOは10月23日、メディアのインタビューで、同社はこれまで4つの...
導入これらを習得することで、モデルをより効率的にして開発効率を向上させることができます。 [[343...
[[311593]] [51CTO.com クイック翻訳] 人工知能は最新の開発トレンドであり、その...
編集者注: サンスティーンは『インターネット共和国』でアルゴリズムが私たちの認知世界に影響を与えると...
データと製品を組み合わせるトピック 1 は、データと製品の組み合わせです。Stitch Fix を例...
[[207302]]現代の人工知能は企業に多くの利益をもたらすと同時に、機械の認知能力も大幅に向上さ...
最近、KuaishouとETH Zurichはオープンソースの分散トレーニングフレームワークBagu...
[[334729]]機械学習を行う際には、データのクラスター分析を行う必要があることがよくあります。...
会話型 AI ベンダーの Gnani は、会話型 AI ボットが今後 2 ~ 3 年で劇的に改善され...
感染症の影響で延期されていた2020年全国人民代表大会と中国人民政治協商会議が5月21日に開幕した。...
12月28日、ベンチャーキャピタリストで元Google China社長の李開復氏の予測によれば、中国...
最近、Magiという検索エンジンが注目を集めています。この検索エンジンは、私たちが持っている一般的な...