企業は生成AIのオープンソース化のリスクとメリットを検討

EmTech MIT では、専門家が、生成 AI モデルのオープンソース化の長所と短所を含め、企業で生成 AI を導入する際の課題と利点を検討しました。

今週初め、MIT Technology Review が主催する EmTech MIT カンファレンスのプレゼンテーションでは、人工知能が大きな話題となりました。生成 AI の実験に対するプレッシャーが高まるにつれ、組織はドメイン固有の精度などの実際的な問題からセキュリティやプライバシーのリスクに至るまで、さまざまな課題に直面しています。

生成 AI は、企業環境でさまざまな用途に使用されています。 IBM インフラストラクチャー CTO 兼イノベーション担当ゼネラルマネージャーのヒラリー・ハンター氏は、「ジェネレーティブ AI の世界におけるデータの影響」と題した講演で、初期のユースケースにはサプライチェーン、顧客サポート、契約、法務などが含まれると述べました。「企業は、AIがさまざまな形で自分たちに影響を及ぼすことを理解し始めている」とハント氏は語った。

組織が生成 AI の幅広いユースケースを模索するにつれて、オープンソースオプションへの関心が高まっています。 GPT-4 のような一般的な大規模言語モデルへの独自のライセンスによるアクセスは、長期的には制限が多くコストがかかる可能性がありますが、オープンソースの代替手段は多くの場合、より安価でカスタマイズ性も高くなります。

したがって、オープンソースオプションを活用することで、企業はベンダーへの依存を減らし、特定のタスクやワークフローに合わせた専用の社内ツールを構築できるようになります。ただし、オープンソースの生成 AI を企業に責任を持って統合するには、セキュリティ、倫理、技術的機能の観点からリスクを厳密に評価する必要があります。

オープンソースと独自の生成 AI の比較

ブーズ・アレン・ハミルトンのジェネレーティブ AI ディレクターであるアリソン・スミス氏は、「オープンソースジェネレーティブ AI」と題した講演で、オープンソースジェネレーティブ AI の機会とリスクについて概説しました。

スミス氏は、オープンソースコミュニティと AI のブレークスルーの歴史的なつながりを強調し、機械学習の大きな進歩は TensorFlow や PyTorch などのオープンソースの取り組みに結びついていると述べました。しかし、生成 AI の時代では、これまで最高のパフォーマンスを発揮した LLM は閉鎖されました。

しかし、生成 AI は急速に進化している分野であり、特にニッチなアプリケーションでは、将来的にバランスが変化する可能性があります。オープンソースは、低コスト、柔軟性、透明性を備えているため、ニッチなアプリケーションモデルを微調整し、ソースコードのセキュリティ脆弱性を確認したい組織にとって魅力的です。

「オープンソースと、クローズドでプロプライエタリなソースとの比較については常に議論されてきた」とスミス氏はTechTargetに語った。「こうした生成AIモデルの力により、この傾向はさらに強まるだろうと思います。

ChatGPT のような消費者向けの生成モデルは依然としてほとんどが独自のものですが、スミス氏は、オープンソースは、専門性、透明性、コスト上の利点を提供できる、より狭い範囲のアプリケーションで普及しつつあると主張しています。「オープンソースに関してこのような大まかな発言をするのは、あるいはそもそもそれを実行するのは本当に難しい」と彼女は語った。

代わりに、独自の生成 AI を使用するかオープンソースの生成 AI を使用するかを決定するには、特定のユースケースの詳細を検討する必要がある場合があります。スミス氏は、ChatGPT などの消費者向けアプリケーションは主に独自のままである一方で、エコシステムは特定のタスクに合わせて調整された小規模なオープンソースモデルとして出現する可能性があると述べました。

「生成 AI の非常に幅広いレベルで、どちらか一方が他方と対決する事態は予想していない」とスミス氏は言う。「ChatGPT は、何でも質問でき、あらゆる種類のクレイジーなタスクを実行できるため素晴らしいです。しかし、特定のエンタープライズレベルのユースケースには本当に必要でしょうか?おそらくそうではないでしょう。

オープンソース生成AIの開発の難しさ

メリットがあるにもかかわらず、オープンソースの生成 AI の構築は困難な場合があります。他の種類のソフトウェアや機械学習の他の分野と比較して、生成 AI には、モデルを構築および運用するための専門的な才能だけでなく、より広範なインフラストラクチャとデータリソースも必要です。

これらの要因はすべて、効果的なオープンソース生成 AI の構築に潜在的な障害をもたらします。有用で高性能なモデルをトレーニングするために必要な財務および計算リソースは、オープンソース環境で作業するモデル開発者は言うまでもなく、資金力のある企業にとっても困難です。こうした資金調達の課題は、AI 開発においては深刻化しているものの、より広い意味ではオープンソースにおける長年の課題を反映しています。

「オープンソースソフトウェアであっても、フレームワークやライブラリがどれだけ人気があっても、プログラミング言語としてのPythonであっても、それを保守しているすべての人々にとって、それは本当に報われない仕事です」とスミス氏は語った。「そして、商品化するのは難しいのです。」

スミス氏は、資金調達の可能性のある方法として、基本的な機能への無料アクセスを提供しながら、セキュリティやコンサルティングなどの特定の機能やサービスに対して料金を請求するフリーミアムモデルに言及した。その他の一般的なモデルとしては、クラウドファンディング、非営利団体からの支援、大手テクノロジー企業からの資金提供などがあります。しかし、後者はオープンソースモデルやソフトウェア開発への影響に関して厄介な問題を引き起こす可能性があります。

「オープンソースコミュニティの素晴らしいところは、貢献が大規模で多様な人々から生まれることです」とスミス氏は語った。「資金を集中させると、その資金源のインセンティブが誇張されるリスクがある。」

企業における生成型AIのリスクの予測と管理

企業内で生成 AI を効果的に導入するには、特にドメインおよび組織固有のデータを微調整してテクノロジーを最大限に活用するには、リスク管理とイノベーションの間で慎重なバランスを取る必要があります。

多くの組織が生成 AI イニシアチブを迅速に実装するプレッシャーを感じていますが、堅牢な確率モデルの導入には、特に機密性の高いアプリケーションの場合、慎重な検討が必要です。たとえば、医療や国家安全保障に関連する情報を処理するモデルは、顧客サービスチャットボットよりも大きなリスクを伴います。

スミス氏は、社内質問応答システムなどの生成 AI のエンタープライズアプリケーションの場合、ユーザーアクセスと権限を制御する必要があることを強調しました。従業員が組織のドキュメント管理システム内の特定のフォルダーにのみアクセスできるのと同様に、内部 LLM は、情報を受け取る権限を持つユーザーにのみ情報を提供する必要があります。適切なアクセス制御を実装することで、ユーザーは自分の役割に適した応答のみを受け取ることができます。

「まず起こりうるリスクをリストアップすることが常に重要だ」とスミス氏は語った。「まず、どのような行動を取ろうとしているか、その深刻さから始めます。次に、それがどれだけ広範囲に及ぶか、つまり、どれだけの人が影響を受けるかを考えます。」

すべてのリスクを予測することは不可能であるため、インシデント対応戦略を慎重に計画および開発することが重要です。「私にとって、最善のアプローチは、まずセキュリティ体制から始めることです」とスミス氏は述べ、その後、有効性とユーザーエクスペリエンスの問題に移った。

ハンター氏は、IBMの調査により、事前に計画を立てることでサイバーセキュリティインシデントに関連するコストを大幅に削減できることがわかったと指摘した。 IBM の年次「データ侵害のコストに関するレポート」の 2023 年版では、インシデント対応の計画とテストのレベルが高い組織は、レベルの低い組織と比較して約 150 万ドルを節約しました。

「私たちは、特に新しい技術に興奮しているときは、その利点に圧倒されてしまう傾向があると思います」とスミス氏は語った。「まずリスクについて話し合えたらいいのにと思います。そこでは、他にもいろいろあることを承知の上で、起こり得るあらゆる問題を詳しく説明します。そして、メリットを踏まえて、これは理にかなっているでしょうか？」

<<: 人工知能のゲーム理論：エージェントと人間、エージェントと環境の間のゲーム関係の予備的調査

>>: 突然！人気のAI企業が倒産の危機に！創設者は辞任を求められました！