アンドリュー・ン氏の新演説:AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

アンドリュー・ン氏の新演説:AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

[[204846]]

1. 人工知能の応用と価値

Andrew Ng 氏は、AI は新しい電気であると述べて例を挙げました。

AI 技術の経済的貢献のほとんどは、教師あり学習、つまり A から B、つまり入力から出力へのマッピングを学習することから生まれます。たとえば、写真を入力し、その写真があなた自身のものかどうかを機械が判断して 0 または 1 を出力するように学習させます。

AIの最も収益性の高い応用はオンライン広告です。この例では、入力は広告とユーザーの情報であり、出力はユーザーが広告をクリックするかどうか (これも 0 または 1) です。

教師あり学習は、ローン申請情報が入力され、ユーザーがローンを返済するかどうかが出力される消費者金融の分野にも応用できます。

過去数年間で機械学習は急速な発展を遂げ、この種の A から B へのマッピングを学習することにますます長けるようになり、大規模な経済的価値を生み出しています。同時に、教師あり学習の出力が0や1の数字に限定されなくなったことにもAIの進歩が反映されています。

別の例を見てみましょう。音声認識のタスクもエンドツーエンドの学習です。十分なデータがあれば、音声認識は非常に優れた結果を達成できます。 Amazon Alexa、Apple Siri、Baidu DuerOS などは、優れた結果を達成するために AI アルゴリズムとデータに依存しています。

教師あり学習の欠点は、大量のラベル付きデータが必要になることで、これが教師あり学習の人気に影響を与えています。

ニューラルネットワークは長年存在しているのに、なぜ AI は近年になってようやく急速に発展し始めたのでしょうか?

[[204847]]

上の図では、横軸がデータ量、縦軸がアルゴリズムのパフォーマンスです。

データ量が増えても、従来の機械学習アルゴリズムのパフォーマンスはそれほど向上していませんが、ニューラルネットワークのパフォーマンスは大幅に向上します。ニューラルネットワークが大きくなるほど、パフォーマンスの向上は明らかになります。

最高のパフォーマンスを実現するには、大量のデータと大規模なニューラル ネットワークが必要です。

2. 機械学習のトレンドとアルゴリズムが価値を生み出す仕組み

現在、教師あり学習は依然として最も価値を生み出しています。さらに、転移学習技術はさらなる経済的価値を生み出しています。例えば、医療画像診断では転移学習技術によりデータを活用して優れた認識効果を生み出します。

教師なし学習は自然言語処理においてより大きな商業的価値を持ちます。

強化学習も非常に興味深いです。強化学習の人気と商業化は、少し不釣り合いだと思います。

強化学習のデータに対する要求は、特に強化学習アルゴリズムが十分なデータを取得することが難しいため、教師あり学習よりもさらに深刻です。別の例: AI + ゲームでは、強化学習が非常にうまく機能します。これは、ビデオ ゲームでは、アルゴリズムがゲームを何度も繰り返しプレイして、最大限のデータを取得できるためです。

ロボット工学の分野では、強化学習を使用してシミュレータを構築することは、強化学習エージェントが無人車両やヒューマノイドロボットをシミュレートし、初めてゲームを繰り返すことを可能にすることと同じです。ゲームやロボット工学以外では、強化学習が商業的に応用されるまでにはまだまだ長い道のりがあります。

現在、教師あり学習、転移学習、教師なし学習、強化学習の 4 種類のアルゴリズムによって生み出される経済的価値は減少しています。

注目すべきもう 1 つの点は、機械学習は構造化データに依存し、非構造化データよりも多くの経済的なメカニズムを生み出すことです。

構造化データを例に挙げてみましょう。たとえば、データベースにはユーザーのトランザクション、誰が何をいつ購入したか、誰が誰にいつメッセージを送信したかが記録されます。これが構造化データです。画像、音声、自然言語などは非構造化データです。

上で述べたいくつかの種類の学習アルゴリズムの中で、教師あり学習だけが企業や起業家にとって多くの経済的価値と機会を生み出してきました。

3. 人工知能製品の作り方

AIの台頭により、企業の競争環境は変化しています。同社の障壁はもはやアルゴリズムではなく、データです。

図に示すように、AI 製品を構築したい:

[[204848]]

アルゴリズムが製品を実行するのに十分なデータを使用できるようにし、製品を通じてユーザーを獲得し、ユーザーがさらに多くのデータを提供する…というサイクルを繰り返します。

別の例: 検索会社。検索会社には、ユーザーが特定の用語を検索した場合にどのリンクをクリックする可能性が高いかを示す大量のデータがあります。

検索アルゴリズムの構築方法は知っていましたが、大手検索会社と同じデータセットがなければ、小規模なチームが同等に優れた検索エンジンを構築できるとは想像もつきませんでした。これらのデータ資産はバランスを保つための障壁を構築します。

エンジニアは、AI の影響が教師あり学習よりもはるかに広範囲に及ぶことも理解する必要があります。日常的な AI には、機械学習、グラフィカル モデル、計画アルゴリズム、ナレッジ グラフなど、さまざまな種類のツールが含まれています。

機械学習とディープラーニングに重点が置かれているのは、他のツールの開発ペースが遅いことが主な理由です。

コンピューター、つまりアルゴリズムは、何をすべきかをどのように判断するのでしょうか? それは、データと人間の介入という 2 つの情報源に依存しています。

たとえば、オンライン広告では、膨大なデータが存在するため、ディープラーニング アルゴリズムは、手作業をあまりかけずに非常にうまく学習できます。しかし、医療分野では、データの量が非常に少なく、おそらく数百サンプル程度であり、グラフィカルモデルを使用して人間の知識を導入するなど、多くの人手が必要になります。

多くのエンジニアが AI 分野に参入したいと考えており、その多くがオンライン コースを受講していますが、論文を読んでその中の研究を再現するという、見落とされがちな学習方法が 1 つあります。

十分な数の論文を読み、十分な数のアルゴリズムを練習すると、それらはすべてあなたの知識とアイデアに変換されます。

機械学習エンジニアになるには、deeplearning.ai などの機械学習コースを受講してしっかりとした基礎を築き、その後、論文を読んで結果を再現し、さらにさまざまな人工知能活動に参加して基礎を強化することをお勧めします。

4. AI企業を立ち上げる方法

約 25 年前より、私たちはインターネット時代の到来を目の当たりにしてきました。

あの時代から学んだこと:ショッピングモール+ウェブサイト≠インターネット企業

私は大手小売企業の CIO を知っています。かつて CEO が彼にこう言いました。「私たちはオンラインで商品を販売しています。Amazon もオンラインで商品を販売しています。私たちも同じです。」

これは間違っています。

インターネット企業はどのように定義されるのでしょうか? 重要なのは、Web サイトを持っているかどうかではなく、A/B テストを実施しているかどうか、迅速に反復できるかどうか、エンジニアと製品マネージャーによって意思決定が行われているかどうかです。これがインターネット企業の本質です。

AI時代においては、次のことも明確にする必要があります。

従来のテクノロジー企業 + 機械学習/ニューラルネットワーク ≠ AI企業

社内の数人がニューラル ネットワークを使用しているからといって、AI 企業になるわけではありません。より深い基盤が必要です。

AI企業は戦略的にデータを取得する傾向があります。

以前にも、ある地域で製品を発売し、別の地域で製品を発売するためにデータを取得し、さらに次の地域で製品を発売するためにデータを取得する、といったことを繰り返していました。そして、すべての製品を組み合わせることで、より大きな目標を達成するためのデータを取得するように設計されています。

GoogleやBaiduのような大手AI企業は非常に複雑な戦略を持ち、今後数年間に向けて万全の準備を整えています。

2 番目のポイントはより戦術的なものであり、今すぐ実行できます。AI 企業は通常、統合されたデータベースを持っています。

多くの企業には多数のデータベースがありますが、それらは分散しています。エンジニアがこれらのデータをまとめて何かを実行したい場合、50 人の異なる人とコミュニケーションを取る必要があるかもしれません。

したがって、すべてのデータが一緒に保存される統合データベースを構築するのは良い戦略だと思います。

さらに、自動化とカスタマイズされた採用ニーズも AI 企業の重要な特徴です。

たとえば、モバイル インターネットの時代では、製品マネージャーは PRD を次のように記述します。

[[204849]]

その後、エンジニアがそれを実装するので、プロセス全体が簡単に理解できます。

しかし、AI時代にチャットボットを作りたいとします。このとき、プロダクトマネージャーがワイヤーフレームを描いて「これはアバターです。これはチャットバブルです」と言っただけでは、問題は解決しません。

チャット バブルがどのように見えるかは重要ではありません。私が知る必要があるのは、チャットボットが何を言うかです。ワイヤーフレームはチャットボット プロジェクトには役に立ちません。

プロダクトマネージャーが自動運転車のワイヤーフレームを描いて「これを作ります」と言ったら、それはさらに無意味です。

AI 企業では、プロダクトマネージャーはエンジニアとコミュニケーションをとりながら、データに基づいて製品を反復してアップグレードする方法を学ぶ必要があります。

<<:  Adobe が超強力な人工知能ブラックテクノロジーをリリース、アーティストたちは職を失うかもしれない!

>>:  王の英雄を見極める – PM の機械学習初心者の旅

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

ChatGPTとDALL·E 3間の業界用語が発見された

先月末、OpenAIは最新の画像ジェネレーターDALL・E 3をリリースしました。爆発的な生成効果も...

AI博士号取得者の年収は80万元。AI人材の需要と供給はどれくらいですか?

「女性は間違った男性と結婚することを恐れ、男性は間違った職業を選択することを恐れる」という古い中国...

人工知能とはいったい何でしょうか?人工知能の主要なテクノロジーと概念について学びましょう。

現在、人工知能が何であるかをまだよく理解していない人がたくさんいます。今日は、人工知能の主要な技術と...

Python 実用コード - 無限分類ツリー構造生成アルゴリズム

バックエンド開発者にとっては、無限レベルの分類に強い印象を受けたのではないでしょうか。最初はかなり時...

Python のアンサンブル学習とランダム フォレスト アルゴリズムを 10 分でマスターする

導入機械学習モデルは、複数の業界にわたる意思決定プロセスの不可欠な要素となっていますが、ノイズの多い...

人工知能が物流の自動化を変える

[[423132]]自動化では、テクノロジーを利用して、さまざまなタスクにおける人間の労力を強化しま...

生成 AI は現在の DevOps および SRE 作業システムをどのようにサポートしますか?

こんにちは、ルガです。今日は、人工知能エコシステムの中核技術である「生成型人工知能」を意味する GA...

研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

このアイデアはプライバシー擁護者を怖がらせているが、スマートスピーカーの開発者は、ユーザーのウェイク...

時速55キロ!寧波杭州湾新区のスマート道路に無人車が走行

「無人運転車が次々とゆっくりと停止し、住民が乗車すると、自動的にショッピングモール、オフィス、学校な...

Google検索アルゴリズムの変更:暗号化されたウェブページの重み付けが向上

つまり、新しい Google 検索アルゴリズムでは、「HTTPS」(Hypertext Transf...

収集する価値のあるAIツールメモ8つ

緊急時のメモとしても使える、コレクションする価値のあるAI写真を8枚シェアします。最初の RTF フ...

OpenAIの内部抗争による被害はまだまだ終わっていない

OpenAI の最近の論争を受けて、AI エンジニアや企業はその API への依存を減らしたり、完全...

...

AI、機械学習、IoTが健康を改善する7つの方法

[[402211]]画像ソース: https://pixabay.com/images/id-575...