企業は生成AIのオープンソース化のリスクとメリットを検討

企業は生成AIのオープンソース化のリスクとメリットを検討

EmTech MIT では、専門家が、生成 AI モデルのオープンソース化の長所と短所を含め、企業で生成 AI を導入する際の課題と利点を検討しました。

今週初め、MIT Technology Review が主催する EmTech MIT カンファレンスのプレゼンテーションでは、人工知能が大きな話題となりました。生成 AI の実験に対するプレッシャーが高まるにつれ、組織はドメイン固有の精度などの実際的な問題からセキュリティやプライバシーのリスクに至るまで、さまざまな課題に直面しています。

生成 AI は、企業環境でさまざまな用途に使用されています。 IBM インフラストラクチャー CTO 兼イノベーション担当ゼネラルマネージャーのヒラリー・ハンター氏は、「ジェネレーティブ AI の世界におけるデータの影響」と題した講演で、初期のユースケースにはサプライチェーン、顧客サポート、契約、法務などが含まれると述べました。 「企業は、AIがさまざまな形で自分たちに影響を及ぼすことを理解し始めている」とハント氏は語った。

組織が生成 AI の幅広いユースケースを模索するにつれて、オープンソース オプションへの関心が高まっています。 GPT-4 のような一般的な大規模言語モデルへの独自のライセンスによるアクセスは、長期的には制限が多くコストがかかる可能性がありますが、オープンソースの代替手段は多くの場合、より安価でカスタマイズ性も高くなります。

したがって、オープンソース オプションを活用することで、企業はベンダーへの依存を減らし、特定のタスクやワークフローに合わせた専用の社内ツールを構築できるようになります。ただし、オープンソースの生成 AI を企業に責任を持って統合するには、セキュリティ、倫理、技術的機能の観点からリスクを厳密に評価する必要があります。

オープンソースと独自の生成 AI の比較

ブーズ・アレン・ハミルトンのジェネレーティブ AI ディレクターであるアリソン・スミス氏は、「オープンソース ジェネレーティブ AI」と題した講演で、オープンソース ジェネレーティブ AI の機会とリスクについて概説しました。

スミス氏は、オープンソース コミュニティと AI のブレークスルーの歴史的なつながりを強調し、機械学習の大きな進歩は TensorFlow や PyTorch などのオープンソースの取り組みに結びついていると述べました。しかし、生成 AI の時代では、これまで最高のパフォーマンスを発揮した LLM は閉鎖されました。

しかし、生成 AI は急速に進化している分野であり、特にニッチなアプリケーションでは、将来的にバランスが変化する可能性があります。オープンソースは、低コスト、柔軟性、透明性を備えているため、ニッチなアプリケーション モデルを微調整し、ソース コードのセキュリティ脆弱性を確認したい組織にとって魅力的です。

「オープンソースと、クローズドでプロプライエタリなソースとの比較については常に議論されてきた」とスミス氏はTechTargetに語った。 「こうした生成AIモデルの力により、この傾向はさらに強まるだろうと思います。

ChatGPT のような消費者向けの生成モデルは依然としてほとんどが独自のものですが、スミス氏は、オープンソースは、専門性、透明性、コスト上の利点を提供できる、より狭い範囲のアプリケーションで普及しつつあると主張しています。 「オープンソースに関してこのような大まかな発言をするのは、あるいはそもそもそれを実行するのは本当に難しい」と彼女は語った。

代わりに、独自の生成 AI を使用するかオープンソースの生成 AI を使用するかを決定するには、特定のユースケースの詳細を検討する必要がある場合があります。スミス氏は、ChatGPT などの消費者向けアプリケーションは主に独自のままである一方で、エコシステムは特定のタスクに合わせて調整された小規模なオープンソース モデルとして出現する可能性があると述べました。

「生成 AI の非常に幅広いレベルで、どちらか一方が他方と対決する事態は予想していない」とスミス氏は言う。「ChatGPT は、何でも質問でき、あらゆる種類のクレイジーなタスクを実行できるため素晴らしいです。しかし、特定のエンタープライズ レベルのユース ケースには本当に必要でしょうか?おそらくそうではないでしょう。

オープンソース生成AIの開発の難しさ

メリットがあるにもかかわらず、オープンソースの生成 AI の構築は困難な場合があります。他の種類のソフトウェアや機械学習の他の分野と比較して、生成 AI には、モデルを構築および運用するための専門的な才能だけでなく、より広範なインフラストラクチャとデータ リソースも必要です。

これらの要因はすべて、効果的なオープンソース生成 AI の構築に潜在的な障害をもたらします。有用で高性能なモデルをトレーニングするために必要な財務および計算リソースは、オープンソース環境で作業するモデル開発者は言うまでもなく、資金力のある企業にとっても困難です。こうした資金調達の課題は、AI 開発においては深刻化しているものの、より広い意味ではオープンソースにおける長年の課題を反映しています。

「オープンソースソフトウェアであっても、フレームワークやライブラリがどれだけ人気があっても、プログラミング言語としてのPythonであっても、それを保守しているすべての人々にとって、それは本当に報われない仕事です」とスミス氏は語った。 「そして、商品化するのは難しいのです。」

スミス氏は、資金調達の可能性のある方法として、基本的な機能への無料アクセスを提供しながら、セキュリティやコンサルティングなどの特定の機能やサービスに対して料金を請求するフリーミアムモデルに言及した。その他の一般的なモデルとしては、クラウドファンディング、非営利団体からの支援、大手テクノロジー企業からの資金提供などがあります。しかし、後者はオープンソース モデルやソフトウェア開発への影響に関して厄介な問題を引き起こす可能性があります。

「オープンソースコミュニティの素晴らしいところは、貢献が大規模で多様な人々から生まれることです」とスミス氏は語った。 「資金を集中させると、その資金源のインセンティブが誇張されるリスクがある。」

企業における生成型AIのリスクの予測と管理

企業内で生成 AI を効果的に導入するには、特にドメインおよび組織固有のデータを微調整してテクノロジーを最大限に活用するには、リスク管理とイノベーションの間で慎重なバランスを取る必要があります。

多くの組織が生成 AI イニシアチブを迅速に実装するプレッシャーを感じていますが、堅牢な確率モデルの導入には、特に機密性の高いアプリケーションの場合、慎重な検討が必要です。たとえば、医療や国家安全保障に関連する情報を処理するモデルは、顧客サービス チャットボットよりも大きなリスクを伴います。

スミス氏は、社内質問応答システムなどの生成 AI のエンタープライズ アプリケーションの場合、ユーザー アクセスと権限を制御する必要があることを強調しました。従業員が組織のドキュメント管理システム内の特定のフォルダーにのみアクセスできるのと同様に、内部 LLM は、情報を受け取る権限を持つユーザーにのみ情報を提供する必要があります。適切なアクセス制御を実装することで、ユーザーは自分の役割に適した応答のみを受け取ることができます。

「まず起こりうるリスクをリストアップすることが常に重要だ」とスミス氏は語った。 「まず、どのような行動を取ろうとしているか、その深刻さから始めます。次に、それがどれだけ広範囲に及ぶか、つまり、どれだけの人が影響を受けるかを考えます。」

すべてのリスクを予測することは不可能であるため、インシデント対応戦略を慎重に計画および開発することが重要です。 「私にとって、最善のアプローチは、まずセキュリティ体制から始めることです」とスミス氏は述べ、その後、有効性とユーザーエクスペリエンスの問題に移った。

ハンター氏は、IBMの調査により、事前に計画を立てることでサイバーセキュリティインシデントに関連するコストを大幅に削減できることがわかったと指摘した。 IBM の年次「データ侵害のコストに関するレポート」の 2023 年版では、インシデント対応の計画とテストのレベルが高い組織は、レベルの低い組織と比較して約 150 万ドルを節約しました。

「私たちは、特に新しい技術に興奮しているときは、その利点に圧倒されてしまう傾向があると思います」とスミス氏は語った。 「まずリスクについて話し合えたらいいのにと思います。そこでは、他にもいろいろあることを承知の上で、起こり得るあらゆる問題を詳しく説明します。そして、メリットを踏まえて、これは理にかなっているでしょうか?」

<<:  人工知能のゲーム理論:エージェントと人間、エージェントと環境の間のゲーム関係の予備的調査

>>:  突然!人気のAI企業が倒産の危機に!創設者は辞任を求められました!

ブログ    

推薦する

IBM CEOがパートナーに「一緒にAIで大儲けしましょう」

IBM CEO の Arvind Krishna 氏は CRN とのインタビューで、今年 IBM ...

太陽光発電や風力発電に AI はメリットをもたらすのでしょうか?

太陽光発電と風力発電は急成長しているが、世界の再生可能電力への移行は、気候目標を迅速に達成するにはま...

人工知能「XiaoIce」がデザイナーに変身した経緯が明らかに

最近、一部のネットユーザーは、ファッションブランドSELECTEDがWeChat公式アカウントでMi...

「コピー+貼り付け」に別れを告げ、ディープラーニングOCRに基づくPDFからテキストへの変換を実現

[[403226]]従来の講義には通常、PDF スライドのセットが付属します。一般的に、このような講...

中国は人工知能において3つの大きな優位性を持ち、5年後には日本と米国を追い抜くでしょう!

現在、私たちは「インターネット+」から「人工知能」への移行を経験しています。人工知能の発展は、技術レ...

2020 年の機械学習スタートアップ トップ 10

[[326722]] [51CTO.com クイック翻訳] データ、テクノロジー、人材の統合により...

人工知能業界における「人材獲得競争」をどう打破するか?

人材不足により人工知能業界全体の給与水準が上昇しており、有名企業の多くが「年俸13倍」「年俸15倍」...

UniPAD: ユニバーサル自動運転事前トレーニングモデル!あらゆる種類の知覚タスクをサポートできます

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

建設業界におけるドローン

建設業界へのドローンの導入は、高度な建設手順を合理化することで業界に大きな変化をもたらしました。建設...

...

ガートナー:バブルにもかかわらず、中国企業は依然としてビッグモデルと生成AIに最も関心を持っている

データ分析と人工知能は現在、世界のどの地域でも最も話題になっている技術です。特に昨年のジェネレーティ...

184.3億ドルを突破! 「中国スピード」が人工知能の分野で再び出現

AlfGOと韓国のプロ囲碁選手、イ・セドルの対局以来、人工知能は幅広い注目を集めているかもしれない。...

Nvidiaのアルゴリズムが破られ、RTX30シリーズはマイニング計算能力を100%回復:グラフィックカードの値下げは終わったのか?

GPUマイニングで米国証券取引委員会から罰金を科されたNvidiaは、最近、暗号化アルゴリズムが解...

コンピュータービジョン技術によって変革が期待できる3つの業界

コンピューター ビジョン テクノロジー (マシン ビジョンとも呼ばれます) により、機械は周囲の世界...