生成型AIの7つの秘密

生成型AIの7つの秘密

誇大宣伝されているかどうかは別として、人工知能アルゴリズムの可能性は依然として有望です。しかし、今日の最も注目されている新興テクノロジーを活用しようとするなら、IT リーダーが心に留めておかなければならない核心的な疑問がいくつかあります。

株価は急騰した。生成 AI アルゴリズムは、あらゆるスタイルの素晴らしい芸術作品を作成し、瞬く間に文法的に完璧な長いエッセイを書き上げ、誰もが驚嘆するでしょう。どの CIO や CEO も、プレゼンテーションの中で、生成 AI がビジネスにどのような変化をもたらすかを説明するスライドを 1 つか 3 つ用意しています。

この技術はまだ初期段階ですが、その能力はすでに疑う余地がありません。コンピューティングの次の波には生成 AI が関与し、ワークフローの複数の場所に現れる可能性が高くなります。この波は止められないだろう。

何が問題になるのでしょうか?まあ、いろいろあります。終末論者は、経済は完全に破壊され、人類は奴隷化され、動物界も奴隷化されるだろうと信じている。

緊張しすぎて息ができなくなることもあります。しかし、最悪のシナリオが起こらなかったとしても、すべてが完璧になるわけではありません。生成 AI アルゴリズムはまだ非常に新しく、急速に発展していますが、基礎に亀裂が生じる可能性はまだ残っています。これらのアルゴリズムをさらに深く掘り下げていくと、期待どおりに機能しない領域がまだいくつか見つかります。

ここでは、このテクノロジーをビジネス ワークフローに組み込む方法を計画する際に留意すべき、生成 AI アルゴリズムの秘密について説明します。

01 間違いを捏造した

大規模言語モデル (LLM) には、砂鶴の交尾の儀式や 17 世紀東ヨーロッパの建築における尾根の重要性といった難解なテーマについて 1,000 語のエッセイを、まるで魔法のように書き出す方法があります。しかし、同じ魔法によって、何もないところからエラーを作り出すことも可能になります。彼らは、大学で英語を専攻した学生に劣らない能力で動詞の活用や文法を使います。事実の多くは完全に正しいです。すると、なんと彼らは小学4年生のように嘘をつき始めるのです。

LLM の構造上、これは避けられません。彼らは確率を使って単語の組み合わせ方を学びます。時々、数字は間違った言葉を選択します。彼らを導く本当の知識は存在せず、オントロジーさえも存在しません。それは単なる確率であり、サイコロが間違った方向に転がることもあります。私たちは、新しい高次の存在と精神的に交わっていると考えるかもしれませんが、実際はラスベガスでサイコロのサインを探しているギャンブラーと何ら変わりません。

02 |データフィルター

人類は、内部の者だけが知る詳細と、すべての人と共有する詳細を含む、複雑な知識の階層を構築しようと試みてきました。こうした希望的階層構造は、軍隊の階級制度に最も顕著に表れていますが、多くのビジネスにも存在します。これらの階層を維持することは、多くの場合、これらのシステムを管理する IT 部門や CIO にとって面倒な作業です。

LLM はこれらの分野では成績がよくありません。コンピューターは究極のルール遵守者であり、ほぼ無限の複雑さを持つカタログを維持できますが、LLM の構造では、特定の詳細を非公開にしたり、特定の詳細を共有したりすることはできません。それはすべて、マルコフ連鎖上の確率とランダムウォークの巨大な集合体にすぎません。

LLM が確率を使用して 2 つの事実を結び付け、名目上は秘密である真実を推測する不気味な瞬間さえあります。人間は、細部まで同一であれば同じことをするでしょう。

いつか LLM が強力な秘密層を維持できるようになるかもしれませんが、現時点では、これらのシステムは、漏洩しても騒ぎにならない非常に公開された情報を使用してトレーニングするのが最適です。企業のデータ侵害とLLMによる法的リスクの回避に関する注目を集めた事例がいくつかあります。一部の企業は AI をデータ侵害を阻止するツールに変えようとしていますが、これを実現する最善の方法がわかるまでにはしばらく時間がかかるでしょう。それまでは、CIO は利用可能なデータを厳しく管理しておくのが賢明でしょう。

03 |怠惰を助長する

人間は機械を信頼するのが得意であり、特に機械が労力を節約してくれる場合にはその傾向が強い。 LLM がほとんどの場合に正しいことが証明されると、人間は常に LLM を信頼し始めます。

人間に AI の二重チェックを依頼しても、あまり効果的ではありません。人間は人工知能の正しさに慣れてしまうと、道を見失い始め、機械が正しいと信じるようになるでしょう。

この怠惰は組織全体に浸透し始めます。人々はもはや自主的に考えなくなり、結局、誰も既成概念にとらわれずに考えようとせず、ビジネスはエネルギーの低い停滞状態に陥ります。この状態では、競争相手が現れるまで、人々はリラックスして一時的にストレスを感じません。

04 |本当のコストは不明

LLM の使用にかかる正確なコストは誰も知りません。多くの API には、各トークンのコストを示す値札が付いていますが、ベンチャー キャピタルによって多額の補助金が支給されている兆候があります。 Uber のようなサービスでも同じことが起こっています。投資家の資金が尽きるまで価格は低いままだったが、資金が尽きた時点で価格は急騰した。

現在の価格は、最終的に市場を支配する真の価格ではないという兆候があります。良質の GPU をレンタルして稼働させ続けるには、はるかに高額な費用がかかる可能性があります。 LLM をローカルで実行し、ラックにグラフィック カードを設置すると、コストを節約できますが、必要なときにのみマシンの料金を支払うなど、ターンキー サービスの利点はすべて失われます。

05 著作権の悪夢

高校の宿題をこなしたり、大学入学のためのエッセイを書いたりといった、学生の自立心、意欲、文章力、道徳心、そして自分で考える能力を重視する日常的な雑用をこなせる優秀な法学修士号取得者は、すでに市場には存在します。

しかし、ほとんどの企業では、AI にこのような一般的な雑用を任せることはありません。彼らには、特定のビジネスに合わせた結果が必要です。基本的な LLM は基礎を提供できますが、それでも多くのトレーニングと微調整が必​​要です。

このトレーニング データをまとめる最適な方法を理解している人はほとんどいません。幸運なことに、自社で管理できる大規模なデータセットを保有している企業もあります。しかし、ほとんどの企業は、著作権に関する法的問題がすべて解決されていないことに気づいています。作家の中には、自分の作品が人工知能の訓練に使われた際に参考にされなかったとして訴訟を起こした人もいる。アーティストの中には盗作されたと感じている人もいます。プライバシーの問題はまだ解決中です。顧客のデータを使って AI をトレーニングできますか?著作権問題は解決されましたか?正しい法的書類をお持ちですか?データの形式は正しいですか?ビジネスで活用できる優れたカスタマイズされた AI を作成するには、解決すべき問題がまだ数多くあります。

06 |ベンダーロックインにつながる可能性がある

理論的には、AI アルゴリズムは、ユーザー インターフェイスの複雑さをすべて抽象化する汎用ツールです。彼らは自立していて、人生が、あるいは彼らが仕える愚かな人間たちが投げかけるどんな問題にも対処できるはずだ。言い換えれば、アプリケーション プログラミング インターフェイスほど厳格で柔軟性に欠けるものであってはなりません。理論的には、AI が単純に適応するため、サプライヤーを迅速に変更することが容易になります。ベンダーを切り替える時期が来たら、プログラマーのチームがグルーコードを書き直したり、それに伴う面倒な作業をすべて行う必要はありません。

しかし、現実には、まだ違いが残っています。 API はシンプルかもしれませんが、呼び出しの JSON 構造など、違いはあります。しかし、本当の違いはもっと深いところにあります。生成 AI のプロンプトを書くには、本物の芸術が必要です。人工知能から最高のパフォーマンスを引き出すのは簡単ではありません。今では、特異性を理解し、より良いプロンプトを作成し、より良い回答を提供できる賢い人々のための職務記述書があります。アプリのインターフェースの違いはわずかですが、プロンプト構造の奇妙な違いにより、AI をすばやく切り替えることが困難になります。

07 |彼らの知恵はまだ浅い

資料の表面的な読み方と深く知的な理解との間のギャップは、長い間、大学におけるテーマとなってきました。アレクサンダー・ポープはこう書いています。「少しの学問も危険だ。

「たっぷり飲まないと、ピエール・ファウンテンの水を味わえませんよ」。それは 1709 年のことでした。

他の賢明な人々も、人間の知性の限界に関する同様の問題を指摘しています。ソクラテスは、自分の膨大な知識にもかかわらず、何も知らなかったと結論付けました。シェイクスピアは、賢者は自分が愚か者であることを知っていると信じていた。リストはさらに続き、認識論に関するこれらの洞察のほとんどは、何らかの形で、そして多くの場合はより広範囲に、生成 AI の魔法に取り入れられています。 CIO とテクノロジー リーダーシップ チームは困難な課題に直面しています。彼らは、生成 AI が提供する最高のものを活用しながら、歴史的に人間、エイリアン、またはコンピューターの知能にとって問題となってきたあらゆる知的難関に行き詰まらないように努める必要があります。

出典: www.cio.com

<<: 

>>:  ロボット工学が建設業界の新時代を告げる

ブログ    
ブログ    

推薦する

60年間の浮き沈みを経て、人工知能はどれだけの偏見や誤った判断を経験するのでしょうか?

過去 2 年間で、人工知能とディープラーニングは起業の分野で人気が高まってきました。シリコンバレーの...

2018 年の人工知能の予測を振り返ってみると、どれが現実になったのでしょうか?

人工知能は非常に複雑であり、急速に発展しています。今後数年間でそれがどうなるかを正確に予測することは...

比較分析に基づく人工知能技術の革新の道筋に関する研究

1. はじめに人工知能(AI)技術は1950年代に誕生し、現在では最も最先端かつ最も普及しているハイ...

...

あなたは統計学者になれますか?トランスフォーマーの強力な学習メカニズム「自動アルゴリズム選択」

ChatGPT などの大規模な Transformer ベースの言語モデルには、非常に強力なコンテ...

...

...

猫=チューリングマシン? 4つのテストにより、「猫コンピューター」が任意の計算を実行できることが証明された

柔らかくてかわいい猫は、いつも私たちに「猫を撫でたい」「猫を抱きしめたい」という衝動を掻き立てます。...

人工知能は第4世代に入り、人工直感が開発の次のステップとなる

AI はこれまでに開発された最も強力なテクノロジーの 1 つですが、すでに 4 回の進化を経ています...

...

ロボティック プロセス オートメーション (RPA) を構築するための基本知識とベスト プラクティス

[[442548]]世界中でロボティックプロセスオートメーション (RPA) が使用され、ビジネスの...

XNOR-NETテクノロジー詳細解説:AIテクノロジーがモバイル端末に搭載され、新時代が到来

[[187849]]この時代、人間の生活はスマートデバイスから切り離すことはできません。持ち歩く携帯...

GitHub で最も人気のあるオープンソース機械学習プロジェクト 28 件: TensorFlow がトップ

機械学習は現在、業界で徐々にホットな話題になりつつあります。20年以上の開発を経て、機械学習は現在、...