機械学習の神話を暴く - 機械学習に関する一般的な神話はどこから来たのか?

機械学習の神話を暴く - 機械学習に関する一般的な神話はどこから来たのか?

機械学習について多くの誤解を持っていると、その人のキャリアや評判に悪影響を与える可能性があります。

[[320684]]

Forrester Research は最近、「機械学習に関する 7 つの神話が打ち砕かれる」と題するレポートを発表しました。その中で著者らは、「残念ながら、機械学習プロジェクトに関する重要な決定を下す一部のビジネスリーダーの間では、機械学習に関する誤解が広まっている」と警告している。

経営幹部や管理者が AI や機械学習について話すとき、彼らの実際の知識レベルを明らかにする事実上の誤りを犯すことがあります。

「製品リーダーが『トレンドモデルにユーザーからのフィードバックを取り入れるため、強化学習を使用しています』などと言うのは、おそらく良いことではありません」とカールソン氏は言う。「私は他のアナリストとパネルディスカッションに参加したことがあります。『教師なし学習では、人間の関与やトレーニングはもう必要ありません』といった声を聞いたことがあります。何を待っているのですか?」

ABIの主席アナリストであるリアン・ジェイ・スー氏は、自身の経験上、ほとんどの経営幹部は機械学習の基礎や「ゴミを入れればゴミが出る」という原則についてある程度の考えを持っているものの、そのほとんどは機械学習モデルはブラックボックスであり、機械学習には大量のデータが必要だと考えている、と述べた。

「これは主に、大量のデータを必要とし、畳み込み層の数が多いほどうまく機能する畳み込みニューラルネットワークの普及によるものだと思います。他の機械学習アルゴリズムが普及すれば、この認識は徐々に消えていくと思います」とリアン・ジェイ・スー氏は語った。

一つの問題は教育です。意思決定者は機械学習の真実をどこで学ぶべきでしょうか? Forrester の Carlsson 氏は、この 2 つの間には交わる部分が欠けていると見ていますが、実践者レベルと企業レベルではまだ多くの選択肢があります。

「我々が最も努力し、最も助けが必要なのは、ビジネス側の人々がこの技術を十分に理解し、これが実際に何に役立つのか、どのような問題に適用できるのかを理解できるようにすることだと私は思う」とカールソン氏は語った。

よくある誤解につながる要因をいくつか挙げます。

用語が理解しにくい

問題の一部は用語そのものにあります。人工知能は人間のように考える機械であり、機械学習は人間のように学習する機械であると説明されることがあります。

「データ サイエンティストは用語の使い方があまり得意ではありません」と ABI リサーチの Su 氏は言います。「新しいテクノロジーを紹介する際に大胆な言葉を使うことが多いので、アナリストにも責任の一端があると思います。」

非現実的な期待

AI は強力なものだという誤解がよくあり、AI は何でもできると人々が信じてしまいます。あるいは、異なる技術がさまざまなタイプのユースケースに適している場合、ディープラーニングは他の形式の機械学習よりも「優れている」と解釈されることもあります。

フォレスター社のカールソン氏は、コールセンターの全員を仮想エージェントに置き換えるなど、単に望むことから始めるだけでは、あまり役に立たないと述べた。これらは、コール センターのスタッフを支援するために拡張された方法で構築されています。

ABIリサーチのスー氏は、非現実的な期待は誇大宣伝が合理的思考を上回った例だと述べた。彼の経験では、経営者は不可能なことや達成できそうにないことを期待しなくなってきている。

機械学習の確率的性質を理解していない

従来、ソフトウェアは決定論的に構築されており、つまり、特定の入力に対して特定の出力が生成されるはずです。ルールベースの AI でも同様です。一方、機械学習にはある程度の誤差が存在します。

「機械学習の世界では、シグナルが手持ちのデータに含まれていないため、予測しようとしていることを決して予測できない可能性が非常に高い」とフォレスター社のカールソン氏は語った。

ABIリサーチのスー氏は、機械学習の使用に反対する論拠の1つは、結果が確率的であるという点だと述べた。産業用マシンビジョンで使用される従来のルールベースの AI ほど明確になったことはありません。

重要な詳細を無視する

あるエンジン製造会社は、部品の交換が必要になる時期を予測したいと考えていました。同社にはエンジンとエンジン故障に関する膨大なデータがあったが、そのすべては実験室のデータだった。現場にはエンジンセンサーが稼働していません。したがって、モデルを実際には意図したとおりに展開することはできません。 「組織では、データエンジニアリング側、つまり機械学習側で起こっているさまざまなことをすべて監視する人が実際には存在しない」とフォレスター社のカールソン氏は言う。

テクノロジーの機能とその機能の ROI の間で、常識が失われることがあります。たとえば、営業担当者に優良顧客を推薦できるモデルが構築されています。問題は、営業担当者がすでにこれらのアカウントについて知っていることです。

機械学習における「成功」が何を意味するのか理解できない

機械学習や AI に対する一般人の期待は、現実を上回ることがよくあります。 100% の精度は妥当に思えるかもしれませんが、場合によっては、精度をさらに 1% 向上させるために多大な時間と費用がかかることがあります。

(1)文脈が重要

たとえば、誰かの生命や自由が危険にさらされている場合、正確さのレベルは異なりますが、人口の一定割合が何かに対して軽度の不快感を覚える可能性もあります。

「量子化の問題に関しては、AIタスクの性質に応じて、トレードオフとしてAIモデルの精度を下げることが合理的であるという考え方が一通りありますが、その前提として、AIをエッジデバイスに展開する必要があるのです」とABIリサーチのスー氏は語った。 「結局のところ、私たち人間は一般的にそれほど正確ではありません。とはいえ、物体の分類、欠陥検査、組立ラインでの品質保証などの一部のアプリケーションには、繰り返し性が求められる厳しい要件があり、ここでは従来のルールベースの AI が役立ちます。

(2)第一選択肢となるかもしれない

フォレスター社のカールソン氏は、99.99%以上の精度で結果を出すモデルは誰でも作成できると述べた。テロを予測することもその一例です。これはめったに起こらないので、モデルがテロを予測しない場合は、非常に正確なモデルになります。

(3)簡単に勝てない

SF や広告によって、AI や機械学習を使えば驚くべきことができるはずだと人々が信じるようになりました。

「機械学習や AI というと、人々は自動的にそれが人間の行動を模倣するものだと考えてしまい、この技術の大きな可能性を見逃しがちです」とカールソン氏は言う。「機械学習技術は、大規模なデータ処理や、人間が本当に苦手とする大規模な分析を行うのに非常に優れています。」

[[320685]]

覚えておくべき7つのヒント

(1)機械学習の能力と限界を理解し、ある程度、さまざまな技術が適しているユースケースを理解する。こうすることで、技術的に不正確なことを言う可能性が低くなります。

(2)1つの機械学習技術がすべての状況に適しているわけではない。分類(猫や犬の写真の識別など)は、データ内でこれまで発見されていなかった信号を見つけることとは異なります。

(3)機械学習は「一度で終わる」技術の集合体ではない。生産中のモデルは「ドリフト」する傾向があり、つまり精度が低下します。機械学習モデルは、精度を維持するために調整および再トレーニングする必要があります。

「ソフトウェア開発では、反復の必要性が認識されています」とフォレスター社のカールソン氏は言います。「機械学習モデルに依存するアプリケーションの場合、データ、実際のビジネス、そして同時に使用しているアプローチを反復するため、より反復的である必要があります。どのようなデータを持っているかはわかりませんし、そのデータがどのようなビジネス シナリオをサポートできるかもわかりません。そのため、プロジェクトの開始時に決定されます。」

(4)機械学習の精度は実際のデータに関係している。潜在的なエラーに関連するリスクを考慮することに加えて、時間の経過とともに発生する可能性のある変化を理解することも重要です。

「50.1%の精度を誇るコンピューター ビジョン モデルは素晴らしい」とカールソン氏は言う。「あるいは、60% や 70% の精度は、これまでのものよりはるかに優れていると言えるでしょう。」

(5)文脈は非常に重要です。人工知能と機械学習は、状況に関係なく同じ結果を達成するわけではありません。コンテキストによって、特定の状況で許容されるか許容されないかのより良いテクニックとより悪いテクニック、および信頼レベルが決まります。

コンテキストは、問題を解決するためにどのようなデータが必要か、また逸脱が許容されるか許容されないかということにも関係します。たとえば、差別は一般的に悪いことだと考えられていますが、銀行が何百万ドルもを誰にでも貸し出さないのは理解できます。

「データに隠れた過去の偏見を特定するのに機械学習がまったく役に立たないケースは数多くあります。他のケースでは、ピクセル数、明確な注釈、クリーンなデータセットなど、データの品質が重要になります」とスー氏は述べた。

一方、どんなにきれいなデータでも、間違っていたら役に立ちません。

「機械学習や AI は、データがなくても魔法のようなことができると人々は思い込んでいますが、それはうまくいきません。逆に、大量のデータがあれば魔法のようなことができると人々は思い込んでいますが、これは多くの場合真実ではありません」とフォレスター社のカールソン氏は言う。「適切なものに関する質の低いデータを持つことは、間違ったものに関する大量のデータを持つよりも実際には良い場合があります。」 ”

(6)機械学習はハードウェアとソフトウェアの組み合わせであることを理解する。具体的には、ABI Research の Su 氏は、ソフトウェアの機能はハードウェアが提供できる、または提供するように設計されている機能と同じ程度しか提供できないと述べています。

(7)従来のルールベースのAIは、機械学習ベースのAIと今後しばらく共存していく可能性が高い。特定のタスクでは、確率的な決定ではなく決定論的な決定が今後も必要になるだろうとスー氏は述べた。

<<:  5Gが普及しつつある中、人工知能は「取り残される」ことになるのか?

>>:  清華大学の学生が強化学習プラットフォーム「TianShou」を開発:数千行のコードが完成、オープンソース化

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ドローン基地局は被災地の通信復旧にどのように役立つのでしょうか?

災害時において、通信は途切れることのできない生命線です。 [[412620]] 7月21日、河南省の...

Ant Financialが機械学習ツールSQLFlowをオープンソース化、機械学習はSQLよりも簡単

5月6日、アント・ファイナンシャルの副CTOである胡曦氏はオープンソースの機械学習ツールSQLFlo...

チャットテクノロジーと IoT セキュリティの将来はどうなるのでしょうか?

OpenAIは2022年11月30日にChatGPTをリリースしました。大規模言語モデル GPT3...

大規模AIモデルに対するいくつかの攻撃方法

人工知能やビッグデータなどの新技術の応用と推進に伴い、ビッグモデルも人気の技術となっています。もちろ...

メタは世界最速となる可能性のあるAIスーパーコンピュータを開発

Metaによれば、AI Research SuperCluster(RSC)は企業がより優れたAI...

サイバーセキュリティにおける人工知能の役割

人工知能(AI)が社会に普及するにつれ、サイバーセキュリティの分野にも参入してきました。 AI は、...

MetaチーフAIサイエンティストLeCun Yang氏:ChatGPTは犬ほど賢くない

6月16日のニュース: 人工知能技術の急速な進歩に伴い、その潜在的な危険性についての議論がますます白...

Bard と ChatGPT: 2 つの言語モデルの頂点対決

Bard と ChatGPT は、それぞれ Google AI と OpenAI によって開発された...

Meta がテキストを音声に変換するオープンソースライブラリ AudioCraft をリリース

最近、Meta は Llama シリーズのモデルやすべてを分割する SAM モデルなど、複数の AI...

...

販売禁止の影で、国産GPGPUがその穴を埋めることはできるのか?

今年初め、ChatGPTはAIアプリケーションの開発を刺激する火花のようなもので、AI業界は開発の急...

我が国の5G基地局は718,000台に達し、人工知能の発展を促進

2020年中国人工知能サミットフォーラム及び中国人工知能競技会結果発表会が23日、厦門で開催された。...

地球と宇宙の廃棄物問題を解決するためにAIを活用する4つの企業

人工知能は、世界中の組織において情報に基づいた意思決定を行うための重要なツールとなっています。人工知...

顔認識は終わったのか?最初の「顔ハイジャック」型バンキングトロイの木馬が誕生

各人の顔、指紋、虹彩の情報はそれぞれ固有であり偽造が困難であるため、生体認証は長年にわたり究極の本人...

空軍の最高データ・AI責任者がAIを通じて戦略的優位性を獲得する方法について語る

AI は、軍事への応用、脅威の監視、国家防衛の確保など、私たちの行動様式を変えています。 AIは軍事...