アンドリュー・ン氏の新演説:AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

アンドリュー・ン氏の新演説:AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

[[204846]]

1. 人工知能の応用と価値

Andrew Ng 氏は、AI は新しい電気であると述べて例を挙げました。

AI 技術の経済的貢献のほとんどは、教師あり学習、つまり A から B、つまり入力から出力へのマッピングを学習することから生まれます。たとえば、写真を入力し、その写真があなた自身のものかどうかを機械が判断して 0 または 1 を出力するように学習させます。

AIの最も収益性の高い応用はオンライン広告です。この例では、入力は広告とユーザーの情報であり、出力はユーザーが広告をクリックするかどうか (これも 0 または 1) です。

教師あり学習は、ローン申請情報が入力され、ユーザーがローンを返済するかどうかが出力される消費者金融の分野にも応用できます。

過去数年間で機械学習は急速な発展を遂げ、この種の A から B へのマッピングを学習することにますます長けるようになり、大規模な経済的価値を生み出しています。同時に、教師あり学習の出力が0や1の数字に限定されなくなったことにもAIの進歩が反映されています。

別の例を見てみましょう。音声認識のタスクもエンドツーエンドの学習です。十分なデータがあれば、音声認識は非常に優れた結果を達成できます。 Amazon Alexa、Apple Siri、Baidu DuerOS などは、優れた結果を達成するために AI アルゴリズムとデータに依存しています。

教師あり学習の欠点は、大量のラベル付きデータが必要になることで、これが教師あり学習の人気に影響を与えています。

ニューラルネットワークは長年存在しているのに、なぜ AI は近年になってようやく急速に発展し始めたのでしょうか?

[[204847]]

上の図では、横軸がデータ量、縦軸がアルゴリズムのパフォーマンスです。

データ量が増えても、従来の機械学習アルゴリズムのパフォーマンスはそれほど向上していませんが、ニューラルネットワークのパフォーマンスは大幅に向上します。ニューラルネットワークが大きくなるほど、パフォーマンスの向上は明らかになります。

最高のパフォーマンスを実現するには、大量のデータと大規模なニューラル ネットワークが必要です。

2. 機械学習のトレンドとアルゴリズムが価値を生み出す仕組み

現在、教師あり学習は依然として最も価値を生み出しています。さらに、転移学習技術はさらなる経済的価値を生み出しています。例えば、医療画像診断では転移学習技術によりデータを活用して優れた認識効果を生み出します。

教師なし学習は自然言語処理においてより大きな商業的価値を持ちます。

強化学習も非常に興味深いです。強化学習の人気と商業化は、少し不釣り合いだと思います。

強化学習のデータに対する要求は、特に強化学習アルゴリズムが十分なデータを取得することが難しいため、教師あり学習よりもさらに深刻です。別の例: AI + ゲームでは、強化学習が非常にうまく機能します。これは、ビデオ ゲームでは、アルゴリズムがゲームを何度も繰り返しプレイして、最大限のデータを取得できるためです。

ロボット工学の分野では、強化学習を使用してシミュレータを構築することは、強化学習エージェントが無人車両やヒューマノイドロボットをシミュレートし、初めてゲームを繰り返すことを可能にすることと同じです。ゲームやロボット工学以外では、強化学習が商業的に応用されるまでにはまだまだ長い道のりがあります。

現在、教師あり学習、転移学習、教師なし学習、強化学習の 4 種類のアルゴリズムによって生み出される経済的価値は減少しています。

注目すべきもう 1 つの点は、機械学習は構造化データに依存し、非構造化データよりも多くの経済的なメカニズムを生み出すことです。

構造化データを例に挙げてみましょう。たとえば、データベースにはユーザーのトランザクション、誰が何をいつ購入したか、誰が誰にいつメッセージを送信したかが記録されます。これが構造化データです。画像、音声、自然言語などは非構造化データです。

上で述べたいくつかの種類の学習アルゴリズムの中で、教師あり学習だけが企業や起業家にとって多くの経済的価値と機会を生み出してきました。

3. 人工知能製品の作り方

AIの台頭により、企業の競争環境は変化しています。同社の障壁はもはやアルゴリズムではなく、データです。

図に示すように、AI 製品を構築したい:

[[204848]]

アルゴリズムが製品を実行するのに十分なデータを使用できるようにし、製品を通じてユーザーを獲得し、ユーザーがさらに多くのデータを提供する…というサイクルを繰り返します。

別の例: 検索会社。検索会社には、ユーザーが特定の用語を検索した場合にどのリンクをクリックする可能性が高いかを示す大量のデータがあります。

検索アルゴリズムの構築方法は知っていましたが、大手検索会社と同じデータセットがなければ、小規模なチームが同等に優れた検索エンジンを構築できるとは想像もつきませんでした。これらのデータ資産はバランスを保つための障壁を構築します。

エンジニアは、AI の影響が教師あり学習よりもはるかに広範囲に及ぶことも理解する必要があります。日常的な AI には、機械学習、グラフィカル モデル、計画アルゴリズム、ナレッジ グラフなど、さまざまな種類のツールが含まれています。

機械学習とディープラーニングに重点が置かれているのは、他のツールの開発ペースが遅いことが主な理由です。

コンピューター、つまりアルゴリズムは、何をすべきかをどのように判断するのでしょうか? それは、データと人間の介入という 2 つの情報源に依存しています。

たとえば、オンライン広告では、膨大なデータが存在するため、ディープラーニング アルゴリズムは、手作業をあまりかけずに非常にうまく学習できます。しかし、医療分野では、データの量が非常に少なく、おそらく数百サンプル程度であり、グラフィカルモデルを使用して人間の知識を導入するなど、多くの人手が必要になります。

多くのエンジニアが AI 分野に参入したいと考えており、その多くがオンライン コースを受講していますが、論文を読んでその中の研究を再現するという、見落とされがちな学習方法が 1 つあります。

十分な数の論文を読み、十分な数のアルゴリズムを練習すると、それらはすべてあなたの知識とアイデアに変換されます。

機械学習エンジニアになるには、deeplearning.ai などの機械学習コースを受講してしっかりとした基礎を築き、その後、論文を読んで結果を再現し、さらにさまざまな人工知能活動に参加して基礎を強化することをお勧めします。

4. AI企業を立ち上げる方法

約 25 年前より、私たちはインターネット時代の到来を目の当たりにしてきました。

あの時代から学んだこと:ショッピングモール+ウェブサイト≠インターネット企業

私は大手小売企業の CIO を知っています。かつて CEO が彼にこう言いました。「私たちはオンラインで商品を販売しています。Amazon もオンラインで商品を販売しています。私たちも同じです。」

これは間違っています。

インターネット企業はどのように定義されるのでしょうか? 重要なのは、Web サイトを持っているかどうかではなく、A/B テストを実施しているかどうか、迅速に反復できるかどうか、エンジニアと製品マネージャーによって意思決定が行われているかどうかです。これがインターネット企業の本質です。

AI時代においては、次のことも明確にする必要があります。

従来のテクノロジー企業 + 機械学習/ニューラルネットワーク ≠ AI企業

社内の数人がニューラル ネットワークを使用しているからといって、AI 企業になるわけではありません。より深い基盤が必要です。

AI企業は戦略的にデータを取得する傾向があります。

以前にも、ある地域で製品を発売し、別の地域で製品を発売するためにデータを取得し、さらに次の地域で製品を発売するためにデータを取得する、といったことを繰り返していました。そして、すべての製品を組み合わせることで、より大きな目標を達成するためのデータを取得するように設計されています。

GoogleやBaiduのような大手AI企業は非常に複雑な戦略を持ち、今後数年間に向けて万全の準備を整えています。

2 番目のポイントはより戦術的なものであり、今すぐ実行できます。AI 企業は通常、統合されたデータベースを持っています。

多くの企業には多数のデータベースがありますが、それらは分散しています。エンジニアがこれらのデータをまとめて何かを実行したい場合、50 人の異なる人とコミュニケーションを取る必要があるかもしれません。

したがって、すべてのデータが一緒に保存される統合データベースを構築するのは良い戦略だと思います。

さらに、自動化とカスタマイズされた採用ニーズも AI 企業の重要な特徴です。

たとえば、モバイル インターネットの時代では、製品マネージャーは PRD を次のように記述します。

[[204849]]

その後、エンジニアがそれを実装するので、プロセス全体が簡単に理解できます。

しかし、AI時代にチャットボットを作りたいとします。このとき、プロダクトマネージャーがワイヤーフレームを描いて「これはアバターです。これはチャットバブルです」と言っただけでは、問題は解決しません。

チャット バブルがどのように見えるかは重要ではありません。私が知る必要があるのは、チャットボットが何を言うかです。ワイヤーフレームはチャットボット プロジェクトには役に立ちません。

プロダクトマネージャーが自動運転車のワイヤーフレームを描いて「これを作ります」と言ったら、それはさらに無意味です。

AI 企業では、プロダクトマネージャーはエンジニアとコミュニケーションをとりながら、データに基づいて製品を反復してアップグレードする方法を学ぶ必要があります。

<<:  Adobe が超強力な人工知能ブラックテクノロジーをリリース、アーティストたちは職を失うかもしれない!

>>:  王の英雄を見極める – PM の機械学習初心者の旅

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AIがワールドカップの初代審判員になるチャンスはあるでしょうか?

著者 | ユン・チャオ最近、国際サッカー連盟(FIFA)は、2022年にカタールで開催されるワールド...

2022年にAIがサイバーセキュリティにもたらすもの

過去 1 年間で、人工知能 (AI) は私たちの日常生活のより大きな部分を占めるようになり、さまざま...

絵が醜すぎて見せられない?機械学習用の描画テンプレートセットを作った人がいます。ダークモードもあります

機械学習の専門家は、ニューラル ネットワーク図の描き方について心配する必要がなくなりました。論文やブ...

...

...

Python で畳み込みニューラル ネットワークを視覚化する

ディープラーニングなどのエンドツーエンドのモデルの場合、トレーニングプロセスをどのように説明し理解す...

機械学習システムの弱点: 保護が必要な 5 つの理由

[[345683]]日々の努力の究極の目的は、生活をより楽に、より便利にすることです。これが人類の歴...

ChatGPT 使用時に遭遇する落とし穴

最近、ChatGPT を使用しているときに小さな問題に遭遇しました。特殊な状況のため、syslog ...

...

...

画像を外国語として扱うKuaishouと北京大学のマルチモーダル大規模モデルはDALLE-3に匹敵する

GPT や LLaMA などの現在の大規模言語モデルは、自然言語処理の分野で大きな進歩を遂げており、...

...

Ctrip における Flutter マップのベスト プラクティス

著者についてCtrip のシニア モバイル開発エンジニアである Leo は、クロスエンド テクノロジ...