ハリー・ポッターの世界では、組分け帽子は生徒の行動履歴、好み、性格に関するデータを取得し、そのデータに基づいて生徒をホグワーツ魔法魔術学校のどの寮に配置するかを決定するアルゴリズムです。このような分類帽子が現実世界に存在するとしたら、それはおそらく複雑なデータセットに基づいて自律的に決定を下すことができる機械学習アプリケーションになるでしょう。今日、機械学習はヘルスケア、セキュリティ、農業など、世界的に数兆ドル規模の産業を牽引しています。 機械学習が大きな価値を生み出すと期待される場合、その価値はどこで生み出されるのか、という疑問が生じます。この記事では、機械学習を適用する従来の企業、業界に依存しない機械学習ツールを構築する企業、垂直統合型の機械学習アプリケーションを構築する企業という 3 種類の企業がどのように価値を生み出し、獲得するかについて説明します。
機械学習はテクノロジー大手だけのゲームではない Facebook、Amazon、Apple、Netflix、Google は、ニュースフィードから推奨エンジンまで、機械学習におけるイノベーションでよく知られていますが、ほとんどの人は、従来の業界で機械学習の需要が高まっていることをあまり認識していません。 AI システムへの世界的な支出は、金融サービス、小売、自動車業界が先頭に立って、2023 年までに 980 億ドルに達すると予想されています。これは、2019 年の支出の 2.5 倍以上です。 たとえば、運用資産が7兆ドルを超える投資運用会社ブラックロックは、2018年に機械学習を活用したETF商品をいくつか立ち上げました。現在、機械学習はヘルスケア業界でも広く注目を集めており、医療画像、診断、創薬に関わる機械学習ソリューションの予算は今後3年間で100億米ドルに達すると予想されています。 これらのエンタープライズ顧客の中には、ソフトウェア エンジニア、データ サイエンティスト、ビジネス アナリスト (「シチズン データ サイエンティスト」と呼ばれることもある) という 3 つの広範な顧客セグメントが存在します。ビジネス アナリストは、技術的なトレーニングのレベルが低いにもかかわらず、組織が拡大するデータ リポジトリを活用できるように機械学習を適用している大規模かつ成長中のユーザー グループを構成しています。 機械学習ツールはあらゆる業界に浸透している こうした顧客の要望に応えるため、このゴールドラッシュでツルハシを販売したいと考える企業の数は急増している。 「課題は機械学習を透明化することではなく、面倒な部分(ログ記録、データ管理、展開、再現性など)を簡単にし、モデルのトレーニングを効率的かつデバッグ可能にすることです」と、以前テスラとスナップでエンジニアリング担当副社長を務めていたスチュアート・バウワーズ氏は語る。 既存のベンダー、特にパブリック クラウドのベンダーは、インフラストラクチャ サービスの販売を増やす戦略の一環として、「エンドツーエンドのプラットフォーム」アプローチを採用しています。たとえば、AWS の機械学習プラットフォーム Sagemaker は、もともと専門の開発者やデータサイエンティストを対象としていましたが、最近 Sagemaker Studio をリリースし、技術的背景があまりないユーザーにも対象を広げました。 AWS のようなテクノロジー大手にとって、機械学習ツールを販売することは、それらのツールをわずかなコストで提供できることから、顧客のインフラ支出を増やす手段となります。 ユニコーン企業は、価値を創造するためにクラウド サービス プロバイダーと連携することもよくあります。たとえば、Databricks は強力なデータ エンジニアリング機能で知られる機械学習プラットフォームです。このプラットフォームは Apache Spark 上に構築されています。同社は2013年に設立され、現在の評価額は62億ドルとなっている。 DataBricks と Microsoft の提携により、Microsoft Azure はより多くのデータとコンピューティングを処理できるようになり、同時に DataBricks の市場拡大にも大きく貢献します。 しかし、ビジネス実務家は、より多くのインフラストラクチャを購入するよう誘うように設計されたツールではなく、「最善の」ソリューションを要求し始めています。この問題に対処するために、次世代のスタートアップはより的を絞ったアプローチを追求するでしょう。既存の大手プラットフォームで広く採用されているモデルとは対照的に、スタートアップは特定の問題を選択し、それをより効果的に解決するための専用ツールを開発することができます。機械学習ツールの分野では、ユーザーにとって大きな課題となる 3 つの大きな問題があります。
機械学習の結果は洗練されているように見えるかもしれませんが、実際には、実践者はデータのクリーニング、構造化、変換にほとんどの時間を費やしています。データはさまざまな形式で複数のマシンやクラウドに分散されることが多くなっているため、チームが簡単に使用して共同作業に使用できる単一の使用可能な形式でデータをまとめることは困難です。 これに対処するため、Tecton の共同設立者兼 CEO である Mike Del Balso 氏は、Uber で開拓したベストプラクティスを新しいスタートアップを通じて民主化しています。 「壊れたデータは、実稼働の機械学習システムで問題を引き起こす最も一般的な原因です」と彼は言います。「モデラーは、トレーニング中に機能を選択して変換し、それらの機能を実稼働モデルに提供するためのパイプラインを構築することにほとんどの時間を費やしています。」Tecton はこれらの「機能」を管理するプラットフォームを構築し、このようにしてデータ レイヤーの複雑さを簡素化しました。企業の生データから収集されたインテリジェントなリアルタイム シグナルは、機械学習を最適化するために不可欠です。 さらに上流では、Liquidata がデータベースのオープンソース GitHub 相当を構築しています。 Liquiddata の共同設立者兼 CEO の Tim Sehn (元 Snap のエンジニアリング担当副社長) との会話の中で、彼は「オープンソース ソフトウェアと同様に、インターネット レベルでオープン データでコラボレーションする必要があります。そのために、インターネット上でデータを無料で保存、ホスト、コラボレーションできる場所として DoltHub を作成しました」と強調しました。
もう一つのよくある問題は、結果間の再現性の欠如です。機械学習モデルのバージョン管理がないため、実験を再現することが困難になります。 Weights and Biases の共同創設者兼 CEO である Lukas Biewald 氏は、インタビューで次のように述べています。「現在、最も大きな問題点は、根本的に新しいコーディング スタイルを管理するための基本的なソフトウェアとベスト プラクティスが不足していることです。下手なブラシではうまく絵を描くことはできませんし、下手な IDE (統合開発環境) ではうまくコードを書くことはできません。また、現在あるツールでは優れたディープラーニング モデルを構築して展開することはできません。」彼の会社は 2018 年に実験追跡ソリューションを立ち上げ、OpenAI などの顧客が個々の研究者からの洞察をチーム全体に広められるようにしました。
モデルの展開を本番環境に拡張し、結果を監視するためのインフラストラクチャを構築することは、この成熟市場にとってもう 1 つの重要な課題です。 Anyscale はオープンソースフレームワーク Ray を開発する企業であり、分散アプリケーションとスケーラブルな機械学習のためのインフラストラクチャを抽象化したスタートアップ企業です。 Anyscale の共同創設者兼 CEO である Robert Nishihara 氏との会話の中で、彼は次のように考えを述べました。「Microsoft のオペレーティング システムが開発者ツールとアプリケーションのエコシステムを作成したのと同じように、私たちはモデルのトレーニングから展開まで、アプリケーションとライブラリの豊富なエコシステムをサポートするインフラストラクチャを作成し、開発者が機械学習アプリケーションを簡単に拡張できるようにしています。」 自然言語処理(NLP)の分野でも、スケーラビリティは急速に進歩しています。 Hugging Face は、NLP モデルを構築、トレーニング、共有するためのオープンソース ライブラリを確立しました。 「過去 3 年間でパラダイム シフトが起こり、NLP の転移学習によって、NLP をビジネス アプリケーションに統合する際の使いやすさと精度が劇的に変化し始めました」と、同社の共同創設者兼 CEO である Clément Delangue 氏は述べています。「当社は、企業が最新の研究用 NLP モデルを数か月ではなく 1 週間で実稼働できるようにしています。」 その他の有望なスタートアップ企業としては、開発者がわずか数行の Python コードを使用して機械学習アプリを作成し、即座にデプロイできるようにする Streamlit があります。 OctoML は機械学習に追加のインテリジェンスレイヤーを適用し、システムの最適化と展開を容易にします。 Fiddler Labs は、生産結果を継続的に説明および監視するための Explainable AI プラットフォームを構築しました。 既存企業との激しい競争の中で長期的かつ持続可能な企業を築くには、スタートアップ企業は次の 2 つの質問を自問する必要があります。どの顧客にとって私たちは不可欠な存在なのか。そして、これらの顧客にアプローチする最善の方法は何なのか。 多くのスタートアップは、大規模市場の 1% を獲得するというアイデアを思いつきますが、一般的に言えば、これらの大規模市場のニーズは、過密状態ではないにしても、すでに十分に満たされています。コア顧客層の獲得に注力する企業は、早期に強力な牽引力を発揮する必要があり、それが長期的な拡大の可能性につながります。こうした顧客を引き付けるために、Databricks や Datarobot などの大手企業のほとんどは、トップダウンのエンタープライズ セールス アプローチを採用しています。開発者ツールの分野で見てきたように、機械学習のスタートアップは、最終的には純粋なエンタープライズ販売からボトムアップの採用を推進し、今日の確立されたエンタープライズ中心の企業よりも優位に立つように進化すると予想しています。 垂直統合された機械学習アプリケーションが現状を打破 機械学習分野で最もエキサイティングな企業の中には、業界全体に混乱をもたらす新しいビジネスモデルを開拓している企業もあります。最もわかりやすい例は自動車産業です。2019年だけでも、この産業には100億ドルが投資されました。機械学習によって革命が起こる他の次世代垂直市場には、医療、産業、セキュリティ、農業などがあります。 「機械学習は『機械学習 + X』のコンテキストで最も効果を発揮します」とセールスフォースの主任科学者リチャード・ソッチャー氏は言います。「最高の機械学習企業は明確な垂直的焦点を持っています。彼らは自分たちを機械学習企業と定義さえしていません。」彼はヘルスケアを大きな可能性を秘めたユニークな分野と見ています。アセラスは免疫モニタリングに機械学習を適用し、患者の白血球数のデータを収集して薬物摂取の最適化に役立てています。 Curai は機械学習を使用して医師の紹介の効率と品質を向上させ、医師が患者の治療に費やす時間を増やすことに貢献しています。 Zebra と AIdoc は、データセットをトレーニングして病状をより迅速に特定できるようにすることで、放射線科医の能力を強化しています。 産業および物流分野では、Covariant は強化学習とニューラル ネットワークを組み合わせて、ロボットが大規模な倉庫施設内の物体を管理できるようにするスタートアップ企業です。Agility and Dexterity も、さまざまな予測不可能な状況にますます複雑な方法で適応するロボットを開発しています。Interos は、機械学習テクノロジーを適用してグローバル サプライ チェーン ネットワークを評価し、企業がサプライヤー管理、事業継続、リスクに関する重要な決定を下せるように支援しています。 セキュリティと防衛の分野では、Verkada がリアルタイム ビデオをインテリジェントに分析して学習することで、企業の物理的セキュリティを再構築しています。Anduril は、センサー タワーからのデータを統合して国家安全保障情報を強化する機械学習バックボーンを構築しました。また、Shield AI のソフトウェアにより、無人システムが信号を解釈し、戦場でインテリジェントに行動できるようになります。 農業は、機械学習技術から大きな利益を得る可能性があるもう一つの分野です。ジョンディアは、スマート農薬散布装置を開発する新興企業ブルーリバーテクノロジーを買収した。 「私たちは、コンピュータービジョンを導入して個々の植物を識別し、それに対処することで、農業の世界を変革しました」と、合併会社のインテリジェントソリューショングループの主任科学者リー・レデン氏は語った。他の注目すべきアグリテック企業には、機械学習を「精密農業」に使用し、データを活用してより収益性と持続可能性の高い方法で食料を生産するインディゴなどがある。 ここからどこへ行くのでしょうか? 要約すると、機械学習は静かに私たちの日常生活の一部となり、車や病院を動かし、私たちが食べる食べ物を保証しています。これまで、大企業が最先端の技術を育成してきましたが、本当の希望は、機械知能を取り巻く誇大宣伝をハリー・ポッターのようなファンタジーから具体的な社会的価値へと変える、機械学習アプリケーションとツールの次の波にあります。 今後数年間に機械学習が生み出す価値について楽観的な理由はたくさんあります。伝統的な企業は、崩壊した業界をより効率的な業界に作り変えるために、何百万人もの市民データサイエンティストを育成するでしょう。機械学習ツールは、インテリジェントなアプリケーションを構築する障壁を下げ、何百万もの新しいアイデアを製品に取り入れることを可能にします。垂直的な機械学習ビジネスモデルにより、健康的な食品、信頼できる個人の安全、手頃な価格の医療へのアクセスが民主化されます。 ここに機械学習の真の価値が見つかります。 |
<<: 外国人の機械学習エンジニアは失業に直面しているのに、なぜ彼らはまだMLの学習にこだわるのでしょうか?
>>: ソフトウェア エンジニアのコーディング面接でよく聞かれるアルゴリズム トップ 10
未来産業研究所は、顔認識市場規模は今後5年間で平均23%の複合成長率を維持し、2024年までに市場規...
AIは心臓病の予測やアルツハイマー病の検出など、医療分野で幅広い応用が期待されています。新たな研究に...
1. バブルソート 2. シェルソート 3. 選択ソート 4. 挿入ソート 5. クイックソート 6...
新しいインフラの波の下で、業界のデジタル変革は本格化しています。この過程で、AI音声は近年最も成熟し...
この記事は、初心者の視点から始まり、真のゼロベースの視点から専門的なアドバイスとガイダンスを提供する...
序文読者は自分で試してみることができます。ソースコードはここ (https://github.com...
科学者たちは最近、AI に数学の授業をさせることに夢中になっていると言わざるを得ません。現在、Fac...
2020年8月20日から22日まで、北京で「人工知能と未来の教育」に重点を置いた、待望の「2020年...
著者: 徐潔成物事の表面と内部の性質の間には常に微妙な境界線があります。過去数か月間、私たちは人工知...
コンピューター ビジョンの GPT の瞬間が到来しました。最近、カリフォルニア大学バークレー校のコン...
AIチップはクラウドとエッジに分かれています。クラウドチップは高いパフォーマンスが求められますが、...
人工知能の人気が高まるにつれ、あらゆるテクノロジーメーカーが自社の製品やサービスに人工知能というラベ...