2018 年を振り返ると、人工知能はデジタル分野で急速な成長を続け、あらゆる業界のほぼあらゆる分野にその魔法の力を注入し、人々のデータの使用方法を完全に変えました。今日、多くの企業がディープラーニング技術を活用してビジネスプロセスに革命を起こすことに熱心です。現実には、AI は音声認識や動画認識などの分野に真の変革をもたらしましたが、言語を理解するための強力な新しいツールや、せいぜいわずかな直感しか持たないアルゴリズムを提供しただけであり、これまでの商用 AI アプリケーションの大部分は、現実世界のアプリケーションではほとんど改善を達成していないことがほとんどです。そもそもこれらのシステムが正しく構築されていれば、これらのプログラムは従来の方法よりもはるかに速く置き換えられるでしょう。 今日、多くの人々がディープラーニングに興味を持ち、それがほぼ神話的な超人的な能力であると考えています。企業は、あらゆるプロジェクトに人工知能などの新興技術を導入することに熱心です。従来の業界では、一部にリスクがあるとしても、AI テクノロジーを積極的に導入しています。たとえば、かつてはすべての採択提案に「ソーシャル メディア」を必須としていた資金提供機関は、現在ではどこかに「ディープラーニング」を必須としており、現在の問題の解決に AI が適用できるかどうかに関係なく、すべてのプロジェクトへの資金提供を検討しています。 一般の意識や企業幹部の一般的な考え方では、人工知能は、人間のようなアルゴリズムであり、初歩的で人間には十分な知性はないが、継続的に改善され、より多くのトレーニング データによって学習して自らを修正できるものと説明されています。 もちろん、現実には、今日のディープラーニング アルゴリズムは科学というよりも芸術です。精度の向上は、アルゴリズムに盲目的にトレーニング データを追加することだけでなく、慎重に選択されたトレーニング データ、複雑な調整、実験テスト、そしてある程度の幸運によっても得られます。そして、成功したアルゴリズムは、その作成者でさえ完全に理解できず、他の分野で自動的に複製することもできない謎です。最も正確なモデルであっても、非常に脆弱であるため、わずかな変更や悪意のある介入によって軌道から外れることがあります。 今日の AI システムには人間のような脳はありません。過去のアプローチよりも強力で有能な、基本的な統計的カプセル化であり、コンピューターが誕生以来行ってきたこととそれほど変わりません。 オーディオビジュアル分析などの一部の分野では、ディープラーニング手法が真に変革をもたらし、機械が画像、音声、ビデオを理解し、生成する精度のレベルを、ほんの数年前には想像もできなかったほどに達成できるようになりました。ニューラル ビジョン システムは、武器、旗、兵士、銃でいっぱいの戦場の写真であっても、車両のメーカーとモデルを認識でき、地面に置かれた銃、空に向けられた銃、人に向けられた銃の違いを理解することができます。写真が撮影された地理的な場所を推定できます。つまり、写真が以前に見たトレーニング画像とは非常に異なっているように見えます。また、人間のような新しい画像や音声を作成することもできます。 ここで、実際の応用 AI 革命が起こり、機械理解の新しいパラダイムが開かれます。 同時に、日常的なテキストや数字の分析に AI を使用すると、必ずしもより高度な変革が明らかになるわけではありません。ニューラル機械翻訳 (NMT) は、置き換えた統計的機械翻訳 (SMT) と同様に、良い場合には人間のような流暢さを実現できますが、そうでない場合には失敗します。ニューラル機械翻訳 (NMT) システムは確かに学術的なコンテストでは高い BLEU スコアを達成できますが、現実世界の日常的なコンテンツに適用した場合、理解の混乱の中で混乱してしまうため、その向上は必ずしも顕著ではありません。 問題は、ニューラル機械翻訳 (NMT) が、その前身である統計機械翻訳 (SMT) と同様に、大量のトレーニング データから学習した統計パターンを単純に盲目的に適用することです。ニューラル機械翻訳 (NMT) システムは、学習パターンを適用して 1 つの記号セットを別の記号セットに変換することしかできません。これは、子供が何を描こうとしているのか理解せずに、紙の上のカラーや形を追ってアーティストの絵を真似するのと同じです。人間の翻訳者とは異なり、今日のニューラル モデルは、読み取っている概念やアイデアのより深い意味を実際に理解しているわけではなく、統計的機械翻訳 (SMT) 手法のように記号のパターンを認識するだけです。ニューラル マシン トランスレーション (NMT) システムは、より複雑なパターンを認識し、より洗練された並べ替えを実行し、より大きなテキスト ウィンドウを操作する機能の点でかなり優れていますが、NMT システムでも、主に文レベルまたは小さな個別のテキスト チャンクで動作します。より洗練されたニューラル機械翻訳 (NMT) システムが、テキストの段落全体を読み取り、それを議論されている抽象的な概念やアイデアにまで抽出し、その抽象的な思考ベースの表現を別の言語に完全に変換して、文脈と知識を取り入れて曖昧さを解消し、文脈化し、枠組みを作ることができるようになるまでには、まだ長い道のりがあります。 さらに、ほとんどの言語でトレーニング データが不足しているため、最先端のニューラル機械翻訳 (NMT) システムでも、多くの言語の統計機械翻訳 (SMT) システムと同様に機能しなかったり、段落の不自然さが時折現れて主要な議論が理解できなくなったりします。 ニューラルテキスト処理は全体として、プロセスが結果に及ぼす影響に悩まされます。企業は、ディープラーニング ソリューションが他のどのソリューションよりも優れていると信じており、あらゆる問題が現在のニューラル アプローチで解決できるわけではないことを認識せずに、どんな犠牲を払ってでもディープラーニング ソリューションを追求すべきだと考えています。 多くの企業は、言及された特定の人物や会社名を識別するなどの最も基本的なタスクのためにディープラーニング ソリューションを構築しています。大規模で高価なディープラーニング モデルが、名前といくつかのバリエーションの単純なキーワード検索よりも優れているかどうかを尋ねられたとき、多くの場合、実際に答えを試したことはなく、ニューロンが最善の方法であると単純に想定しています。最終的なベンチマークを完全に実行すると、ニューラル アプローチはテキスト内のスペル エラーや文法エラーに敏感すぎることと、ほとんどのエッジ ケースを検出するためのトレーニング データが不足していることから、実際には精度が低いことが一般的に示されます。 ニューラルエンティティ認識、分類、ジオコーディング、感情分析はすべて、最先端のアルゴリズムでさえ、よく書かれた従来の方法を上回るのに苦労することが多い分野です。重要なのは、これらの商用展開があまりよく書かれていないということです。 ほとんどのユーザーは、自家製のルールやデータの少ないベイズモデルを急いでまとめてしまいます。実際、これはコードから上に向かってではなく、ドメインから下に向かって構築された古典的なアルゴリズムの珍しい例です。特に感情アルゴリズムは、一歩下がって心理学者や言語学者と協力して人間がどのように感情を伝えるかを理解したり、現実世界の複雑さやニュアンスを捉えるツールを構築したりするのではなく、プログラマーが構築したシンプルで使いやすいコード アルゴリズムに重点を置いてきました。 この場合、ニューラル メソッドはモデル作成を標準化し、より強力なデータ プラクティスに向けてそれを強制するのに役立ちますが、そのメリットはニューラル メソッド自体の機能ではなく、作成ワークフローの変更から主に得られることが多いです。実際、多くの企業にとって、ディープラーニング アプローチの最大のメリットは、ニューラル ネットワークのパワーからではなく、現在のモデル構築ワークフローによって強制されるデータ中心の標準化されたプロセスの作成から得られます。 過去半世紀にわたり、ディープラーニング革命により、考えられるほぼすべての機械理解タスクが 100 を超える言語のテキストおよび視聴覚ニュース コンテンツに適用されてきました。方法は、ニューラル学習から従来の機械学習、手動で構築されたエキスパートルール、アルファテストまで多岐にわたります。商用生産アプリケーションから最先端の研究実験まで、あらゆる分野でテストされ、結果は常に同じです。ニューラル メソッドは、オーディオビジュアル コンテンツと選択の理解および作成タスクの精度とパワーを大幅に向上させますが、トレーニング データが少なく堅牢性が高い、適切に設計された非ニューラル ソリューションを使用すると、一般的なテキスト理解で再現または上回られることがよくあります。 問題は、本当に有能なディープラーニングの専門家が不足している一方で、使用されるデータとシナリオを反映した強力なシステムを構築できるデータサイエンティストがさらに少ないことです。つまり、ニューラルアプローチは多くの企業に多大なメリットをもたらしますが、それはディープラーニングを使用しているからではなく、データサイエンスのワークフローが貧弱で、結果ではなくアルゴリズムのみに重点を置いているからです。 今日の最大の課題は、アルファベットのディープマインドのようなAI研究グループの画期的な研究と、インターネットによって引き起こされたAIイノベーションとの間の隔たりかもしれない。これらの研究グループは、商業部門が構築した機械的なディープラーニング システムとは対照的に、ビデオ ゲームのプレイ方法を学習し、ある程度の直感でプレイできるツールを構築しています。機械が世界について推論し、外界と通信して理解し、新しいタスクを迅速に学習し、例から高次の表現を抽象化し、さらには独自の表現を作成できるようにするのは、ディープラーニング手法に特有の素晴らしい機能です。同時に、これらは商業分野のディープラーニングの大部分を占める、機械的な分類フィルターやエンティティ抽出器とはかけ離れています。 まとめると、AI に関する誤解の多くは、現実というよりもマーケティング上の誇大宣伝です。多くの企業が急いであらゆるところに AI を導入し、「AI 主導のビジネス」を展開していると主張していますが、こうしたニューラル展開は、必ずしも、置き換える従来のシステムよりも正確であるとは限りません。多くの場合、状況は悪化することが多いです。ニューラルメソッドは確かに視聴覚理解に革命をもたらしましたが、テキスト理解に関しては、ニューラルメソッドが必ずしも大きな進歩を意味するわけではありません。ディープラーニングの画期的な応用が、DeepMind などの研究機関から商業の世界に進出するにつれて、状況は変わるかもしれませんが、現時点では、ディープラーニングが本当に特定の問題に対する答えであるかどうかを問い、結論が正しいかどうかをテストするために広範なベンチマークを実施したいと考える企業もあるかもしれません。最も重要なのは、ユーザーがソフトウェア システムの作成方法を再考し、ニューラル メソッドの創造性と厳密さをより伝統的なデータ サイエンスのワークフローに適用するとどうなるかを再考する必要があることです。 |
<<: マスターカードがAIを活用して詐欺を阻止し、誤ったチャージバックを削減する方法
>>: ブロックチェーン上の人間: 暗号が AI 支配者に対するより良い防御である理由
[[262824]]スマートシティ建設が国家戦略となり、ハイテクが急速に発展するにつれて、スマートシ...
人工知能が徐々に物理セキュリティの分野に参入するにつれて、より高度なアクセス制御ソリューションが登場...
病院の集中治療室 (ICU) では、重病の患者を一日中一連の機器に接続し、いつでもバイタルサインを監...
[[352004]]データ暗号化処理には多くの複雑な暗号化アルゴリズムがあり、これらの暗号化アルゴ...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
今後10年間で世界を変える人工知能の4つの主要な発展トレンドの分析61歳のビル・ゲイツ氏は大学卒業生...
[[203962]]過去数年間で、コンピューター科学者は人工知能 (AI) の分野で大きな飛躍を遂げ...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
マイクロソフトのサティア・ナデラCEOは10月23日、メディアのインタビューで、同社はこれまで4つの...
適切な技術人材の採用は、企業組織による人工知能 (AI) の導入に対する大きな障壁となっています。最...
サウンド分類は、オーディオのディープラーニングで最も広く使用されている方法の 1 つです。音を分類し...