AIGCの6つの主なリスク

ChatGPTを運営するOpenAIのCEOサム・アルトマン氏は最近、議会公聴会で政府によるAIの規制を求め、大きな騒動を巻き起こした。「ますます強力になるAIモデルのリスクを軽減するには、政府による規制介入が重要になると考えています」とアルトマン氏は述べた。

ChatGPT は、大量のトレーニングデータに埋め込まれたパターンを学習することで、テキスト、画像、音楽などの新しいオリジナルコンテンツを自律的に作成できるテクノロジーである AIGC の一例です。 AIGC は、他の現在の機械学習技術とは多くの点で異なります。

まず、AIGC モデル (GPT や安定拡散など) の出力はオープンエンドです。これらのモデルはテキストと画像データをゼロから生成しますが、他の一般的に使用される識別 ML モデル (分類モデルや回帰モデルなど) は、明確に定義された値のセット (はい/いいえ、0 ～ 1 の数値など) に属する出力を作成します。感情分析モデルは、入力テキストに基づいて肯定的または否定的な感情を生成し、GPT 自体はさまざまな種類の入力テキストを生成できます。

さらに、現在使用されているほとんどのモデルとは対照的に、現在の AIGC モデルは膨大なデータセットでトレーニングされています。たとえば、OpenAI は 5,000 億のトークンで GPT-3 をトレーニングしました。 GPT-4、Stable Diffusion、Codex などの最新バージョンの AIGC モデルを開発している組織は、モデルのトレーニングに使用された正確なトレーニングデータを公開していません。これにより、プライバシー侵害や著作権侵害の可能性についての懸念が生じています。

これらのモデルの純粋なパワーもまた、他とは一線を画しています。現在市場に出回っている AIGC モデルは過去のどのモデルよりも強力であり、特に再現するように訓練されていない「新たな特性」を示し始めています。実用的な観点から言えば、これは、ある機能に使用されたモデルを再利用して他のタスクに使用できることを意味します。

最後に、これらのモデルは本質的に不透明です。 1,750 億のパラメータを持つモデルの結果を解釈したり、特定の決定がどのように行われたかを理解したりすることは、ほぼ不可能です。同時に、この技術はまだ初期段階にあり、現在の AIGC モデルには幻覚 (明らかに誤った情報を生成する) などのよく知られた限界があり、これが新たなリスクを生み出す可能性があります。

AIGCの6つの主なリスク

AIGC モデルの独自の特性により、他のタイプのモデルには見られない一連のリスクが伴います。 AIGC プロジェクトを検討する際にビジネスリーダーが注意しなければならない 6 つのリスクを以下に示します。

出力品質の問題: まず、AIGC モデルによって生成される出力の品質を確保することは、その予測不可能な性質のため、非常に困難です。マーケティング GPT モデルの結果の 1 つはブランドガイドラインと一致しているかもしれませんが、別の結果は一致していない可能性があります。モデルが作成した広告は、ある文化的背景では適切であっても、別の文化的背景では不快に感じられる場合があります。人間であればこれらの違いをすぐに見分けることができるかもしれませんが、モデルは文化的なニュアンスを認識できず、不注意で不適切なコンテンツを生成する可能性があります。したがって、出力品質を評価するには人間によるレビューが不可欠です。

捏造された「事実」と幻想: 第二に、AIGC モデルは急速に発展しましたが、依然として明らかな限界があります。最も重要なのは、モデルが「事実」を捏造するときに生じる前述の「幻想」かもしれません。その結果は、無害なもの（綿繰り機を発明したのは誰かという虚偽の報告）になる場合もあれば、訴訟問題になるもの（でっちあげの刑事告発）になる場合もあります。エンタープライズアプリケーションでは、モデルの幻覚が発生する可能性があるため、検索などの正確な情報が必要な状況でこれらのツールを使用する前に、重要な安全対策を講じる必要があります。

著作権およびその他の法的リスク: 3 番目に、AIGC には潜在的に重大な法的および規制上のリスクがあります。たとえば、AIGC ツールは著作権で保護された素材をクリエイターの許可なく使用します。さらに、AIGC アプリケーションの利用規約には、モデルの改善のためのユーザーインタラクションデータの使用に関する明確な規定が欠けていることが多く、企業のソースコードに関連するインシデントで発生したように、プライバシーとセキュリティの問題が発生する可能性があります。さらに、AIGC モデルのトレーニングデータの透明性の欠如は、プライバシー、出力の精度、年齢確認に関する懸念からイタリアが ChatGPT を一時的に禁止したことからもわかるように、規制上の影響を及ぼす可能性があります。

偏った出力: 4 番目に、AIGC モデルは、モデルのトレーニングに使用されるデータの偏りに基づいて、他のモデルと同様に偏った出力のリスクの影響を受けます。たとえば、安定拡散は「会社の CEO」の画像を表示するように指示され、白人男性の画像のみを生成する可能性があります。従来の機械学習モデルは、同様の公平性とバイアスのリスクをもたらしますが、新しい AI モデルの生成的な性質により、AIGC が顧客と直接やり取りする場合のリスクが増大します。

簡単に悪用できる: 第 5 に、AIGC の強力なパワーにより、「ジェイルブレイク」が容易になります。 GPT のトレーニングは単語予測に重点を置いていましたが、その推論機能は予想外の結果でした。 AIGC モデルの開発が進むにつれて、ユーザーはモデルの本来の機能を回避し、まったく異なる目的に使用する方法を発見する可能性があります。たとえば、メンタルヘルスチャットボットが GPT を使用して開発されている場合、悪意のある人物がチャットボットをハッキングして、不適切な応答をトリガーしたり、機密データを漏洩したりする可能性があります。 GPT 上に構築されたほぼすべてのチャットインターフェースは、リリース後すぐに「ジェイルブレイク」される可能性があります。

専門知識とコンピューティングコスト: 6 番目で最後の、AIGC 開発アプリケーションに関連する追加の具体的なビジネスリスクは、専門知識とコンピューティングリソースの可用性が限られていることです。現在、このテクノロジーを使用して回復力のあるアプリケーションを構築するためのリソースを集めることができる著名なテクノロジー企業はほんの一握りです。クラウドプロバイダーがコンピューティング能力を提供したり、組織が OpenAI や Azure の API を使用したりすることはできますが、この分野の専門知識は依然として少数の組織に集中しています。

これは、ビジネスリーダーが AIGC プロジェクトを推進すべきではないと言っているわけではありません。しかし、AIGC の取り組み中は、このテクノロジーの潜在的なリスクに常に注意を払い、必要に応じてリスクを軽減する措置を講じる必要があります。

<<: フォレスター：生成型AIと会話型AIが2023年のトップ10新興テクノロジーを独占

>>: 自動運転マシンビジョンの4つの基本タスクを理解するための1万語

エンタープライズレベルの AI を実装するにはどうすればよいでしょうか? Watson なら問題ありません!

AIGCの6つの主なリスク

AIGCの6つの主なリスク

エンタープライズレベルの AI を実装するにはどうすればよいでしょうか? Watson なら問題ありません!

AI と Wi-Fi 6: 家庭内 Wi-Fi の革命を推進

サム・アルトマンは大胆な発言をした。「OpenAIにはGPT-5を訓練するのに十分な資金があり、人間はAGIの閾値に近づいている」

機械学習で画像の色を復元する方法

「AI医薬品製造」の新時代が到来！人工知能がより良い抗がん剤の組み合わせを予測

オープンソースの大規模モデルの王座が交代しました! Google Gemmaが市場に参入、ノートパソコンは動作可能でビジネスにも使用可能

参入から放棄までのデータマイニング：線形回帰とロジスティック回帰

データ保護にはAIベースのセキュリティ戦略が必要

推薦する

あなたは統計学者になれますか？トランスフォーマーの強力な学習メカニズム「自動アルゴリズム選択」

国内オープンソースモデルのベンチマークが大幅にアップグレードされ、その主要機能はChatGPTに匹敵します。 Shusheng Puyu 2.0 がリリース、無料の商用利用をサポート

人工知能時代のセキュリティ専門職とは？

人工知能は第五の変革をもたらします。あなたはこのチャンスをつかむことができますか?

論文執筆に必ず使うべき 12 のニューラルネットワーク可視化ツール

人工知能が将来経験する7つの段階

マスク着用時の顔認識成功率は80％以上。顔はどうやってあなたを裏切るのでしょうか？

GPT をゼロから構築するための 60 行のコード!最も完全な実践ガイドはここにあります