機械学習を生産性に変えるには、よくある 4 つの落とし穴に注意してください。

機械学習を生産性に変えるには、よくある 4 つの落とし穴に注意してください。

[[279043]]

ビッグデータダイジェスト制作

出典: topbots

編纂者:呉帥

ある技術カンファレンスで、講演者が聴衆に「ビジネスのために機械学習や人工知能のモデルを開発した人はいますか?」と尋ねたところ、80~90パーセントの人が手を挙げました。

「それで、皆さんの中で誰がそれを生産に投入したのですか?」と講演者は続けた。ほぼ全員が手を下ろしました。ほぼすべての人がビジネスに機械学習を導入したいと考えていることは明らかですが、これらの人々は大きな問題にも直面しています。特にクラウド アーキテクチャでは、モデルを持続可能にすることが難しいのです。

Medium のブロガーもこの問題を指摘し、機械学習モデルを本番環境に導入する際によくある 4 つの落とし穴を提案しました。

車輪の再発明はしない

この言葉は長い間聞かれてきましたが、改善は見られませんでした。既存の解決策を拒否したために失敗するケースを私たちは数多く見てきました。

たとえば、Amazon Web Services (AWS) や Google Cloud には、使いやすい強力な機械学習スイートと製品があります。これらはすべてのケースに適しているわけではありませんが、特に企業の従業員に機械学習の経験があまりない場合は、間違いなく優れたエントリー プラットフォームです。

Google Vision API を使用した感情検出。画像は TheNextWeb より

上記は、Google Cloud の Vision API を使用して抽出できる情報の例です。製品に対する顧客の反応の写真やビデオのデータがあり、顧客の表情に基づいて製品に対する態度を理解したいとします。次に、写真またはビデオをデータとして Google Vision に送信するだけで、処理が行われ、それぞれの顔が表す感情のおおよその把握が可能になります。

一般的に言えば、AWS と Google Cloud 上の製品の価格性能比はすでに良好です。さらに、バージョンアップデートや機能追加などもプラットフォーム側で処理されるため、メンテナンスも非常に簡単です。

解決策は決まっていない

小規模なプロジェクトの場合、このシンプルで簡単なアプローチで十分かもしれません。しかし、大規模なプロジェクトの場合、コストが高すぎるか、より多くのカスタマイズが必要になります。

このようなプロジェクトでは、多くの場合、カスタム ソリューションが必要になります。前述のように、多くのプロジェクトがやりすぎたために失敗するのと同様に、多くのプロジェクトがやりすぎたために失敗します。私たちは「漸進的利益」の精神、つまり長期的な目標を犠牲にすることなく製品から可能な限り多くの短期的な価値を引き出すという精神を維持する必要がありますが、時にはこの行動が製品設計を損なうことがあります。

この問題は次のように解決できます。

  • 問題と期待されるビジネス価値を十分に理解していることを確認する
  • 必要な調査を行ってください。

最初のアプローチでは、チームが最初から技術的な詳細にこだわりすぎると、全体像を把握できない可能性が高くなります。 「私は本当に何を達成したいのか?」を常に自分に思い出させる必要があります。

2 番目のアプローチは少し複雑です。まず、Google Scholar でリサーチし、関連する学術出版物やブログ投稿を精査して、自分が直面している問題を他の人がどのように解決したかを確認します。満足のいく結果が得られない場合は、良い手がかりが見つかるまで、同様の問題(異なる分野でも可能)を探してみてください。その時点で、既製のソリューションを探して、それがニーズを満たすかどうかを確認します。

満足すれば、計画は実行されます。そうでない場合は、さらにカスタマイズを構築する必要があります。

リスクを適切に特定していない

[[279044]]

優れたソリューションを開発した後、これらのモデルに内在するリスクを忘れてしまうことがよくあります。 「モデルがどのように機能するかはよく分からない」と言う人がいるが、それはある程度は真実だ。説明可能な AI は、「なぜこのモデルはこのように動作するのか」といった質問に答えることに特化した、急速に成長している分野です。

しかし、モデルがどのように機能するかを正確に説明する前に、いくつかの必要な予防措置を講じる必要があります。

1. モデル間の特性と相関関係を理解する

通常、モデルが人種、性別、収入レベルなどに基づいて決定を下すことは望ましくないため、それらを入力として使用しません。それですべてうまくいくでしょうか? 必ずしもそうとは限りません。これらの要素が、使用している他の機能に影響を及ぼさないようにする必要があります。たとえば、郵便番号は、人がどこにいるかを示す強​​力な人口統計指標です。したがって、各プロジェクトを開始する前に、データの調査に多大な労力を費やす必要があります。

2. モデルを本番環境で進化させることができますか?

「機械学習」という言葉を聞くと、たいていの人は、それが人間と機械のやりとりの結果としてリアルタイムで変化するモデルを意味すると考えます。一部のモデルではこれを実行しますが (これについては別の投稿で詳しく説明します)、多くのモデルでは実行しません。それには十分な理由があります。必要なチェックや監視を行わなくても、入力データが大幅に変化してもモデルが制御不能になることはありません。

しかし、そうではありません。市場の動向に基づいて動的に更新される株式取引モデルがあるとします。通常の市場ではうまく機能しますが、予測できない事態が発生した場合 (通常は最悪のタイミングで発生します)、モデルは新しい環境に適応するために過剰に補正し、元々トレーニングされた戦略を完全に放棄する可能性があります。

3. モデルの再トレーニングまたは更新はどのくらいの頻度で行う予定ですか?

この質問に対する標準的な答えはありません。それは問題とモデリング手法によって完全に異なりますが、早い段階でそれを把握することが重要です。標準的な更新方法と戦略が必要な理由は単純です。モデルが改善されているか、劣化しているかをどうやって知るかということです。

75% の精度を持つモデルが本番環境にあるとします。精度が 75% であることをどうやって確認すればよいでしょうか? 通常、検証には履歴データの一部を検証セット (通常は 20%) として使用します。

さて、1 か月後にモデルを更新し、精度が 85% であることがわかったとします (すごいですね! 褒めてあげてください!)。そこで、喜んで更新をプラットフォームにプッシュします。しかし、突然、成果が急激に低下し、顧客が不満を言い続けていることに気づきました。何が起こっているのか?

理由は簡単です。検証セット (精度をテストするために使用する生データ) を保存しないと、同等のものを比較していないことになります。更新されたモデルのパフォーマンスが初期モデルよりも優れているかどうかはわかりませんが、それが大きな問題を引き起こします。

始めるのに機械学習は必要ありません

傷つくように聞こえるかもしれないが、これがおそらくこの記事を読んで得られる最大の教訓だろう。機械学習は今日のコンピュータサイエンスの最もクールな分野の 1 つと考えられていますが、機械学習はベルト自体ではなく、ベルトに取り付けられた単なるツールであるという事実を人々は見落としがちです。

釘を打つために削岩機を使う人はいないでしょうから、基本的な Python スクリプトでタスクを実行できる場合は機械学習を使用しないでください。最先端のテクノロジーにアクセスしたいというのは魅力的であり、私もそのことは理解していますが、必要な専門知識がなければ、不必要な失敗を招く可能性があります。

製品を設計する前に「チャットボットをどう活用できるだろうか?」「顔認識で何ができると思う?」などとブレインストーミングする例を私はたくさん見てきました。しかし、実際のところ、これらのアイデアは基本的に役に立たないのです。

リンク: https://www.topbots.com/pitfalls-in-putting-ml-model-in-production/

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  2019 年の Web 開発のトレンド トップ 10

>>:  サンダーソフト、AIoT産業・大学・研究のボトルネックを打破するTurboX AI Kit教育実験プラットフォームをリリース

ブログ    
ブログ    

推薦する

ロシアのロボット宇宙飛行士が3Dプリントされた骨組織サンプルを持って地球に帰還

ロシア衛星ネットワークによると、最近、ロシアの「3Dバイオプリンティングソリューションズ」社のマネー...

2020 年の優れた産業用人工知能アプリケーション

人工知能技術は今、世界を変えつつあります。多くの業界はすでに、ビジネス プロセスを改善するために A...

Java ソートアルゴリズムについてどれくらい知っていますか?

今日は、Java のさまざまなソート アルゴリズムについてお話します。以前、上級開発者との面接があり...

業界に革命を起こすスマートパッケージング技術トップ10

ほとんどの人がサプライチェーン技術について考えるとき、パッケージングは​​おそらく最初に思い浮かぶも...

人工知能はすでに人間の減量を手助けするのに忙しい

今日はカロリーを消費しましたか?近年、生活水準の向上や生活習慣の変化に伴い、肥満は徐々に多くの人々を...

TensorFlow 2.0 中国語オープンソースブックプロジェクト: 1 日あたり 700 件の「いいね!」を獲得、GitHub のホットリストに

TensorFlow2.0の正式版がリリースされてからしばらく経ちますが、それに関連する体系的なチュ...

素手でネジを動かす、ボストンダイナミクスのアトラスが再び進化:兄弟たち、工場に入る準備をしよう

現在注目を集めているヒューマノイドロボット分野において、ボストン・ダイナミクスは早期参入企業の1つで...

モノのインターネット業界は一時的な流行に過ぎないのでしょうか、それとも産業史上の重要な節目となるのでしょうか?

人類の長い発展の過程において、生産性を向上させることができる発明や方法は、人々の記憶に残ります。産業...

GPT-4の5倍の性能を持つGoogle Geminiは、本当にOpenAIやMicrosoftに勝てるのでしょうか?

もしあなたが会社の CEO だったら、自社の製品が競合他社に打ち負かされたと聞いたらどう感じるでしょ...

人工知能が爆発的に進化しています。この「鉄の飯碗」を手に入れるための新しいガイドをぜひ保存してください!

近年の人工知能の発展スピードは驚異的で、あらゆる分野で専門的なAIが登場しています。上海では以前、無...

金融業界は AI を活用してデータを強化する準備ができているでしょうか?

金融業界は国民経済の生命線です。モバイルインターネットやオンライン決済の普及により、データは企業にと...

人工知能の雇用に関するレポートによると、GenAI は米国のほぼすべての仕事に影響を与えるだろう

世界有数の求人サイトおよび採用プラットフォームである Indeed は、Indeed AI 求人レポ...

ディープラーニングによって変革された5つのコンピュータービジョン技術

概要: この記事では、主にコンピューター ビジョンにおける 5 つの主要テクノロジ、つまり画像分類、...