企業は生成AIのオープンソース化のリスクとメリットを検討

企業は生成AIのオープンソース化のリスクとメリットを検討

EmTech MIT では、専門家が、生成 AI モデルのオープンソース化の長所と短所を含め、企業で生成 AI を導入する際の課題と利点を検討しました。

今週初め、MIT Technology Review が主催する EmTech MIT カンファレンスのプレゼンテーションでは、人工知能が大きな話題となりました。生成 AI の実験に対するプレッシャーが高まるにつれ、組織はドメイン固有の精度などの実際的な問題からセキュリティやプライバシーのリスクに至るまで、さまざまな課題に直面しています。

生成 AI は、企業環境でさまざまな用途に使用されています。 IBM インフラストラクチャー CTO 兼イノベーション担当ゼネラルマネージャーのヒラリー・ハンター氏は、「ジェネレーティブ AI の世界におけるデータの影響」と題した講演で、初期のユースケースにはサプライチェーン、顧客サポート、契約、法務などが含まれると述べました。 「企業は、AIがさまざまな形で自分たちに影響を及ぼすことを理解し始めている」とハント氏は語った。

組織が生成 AI の幅広いユースケースを模索するにつれて、オープンソース オプションへの関心が高まっています。 GPT-4 のような一般的な大規模言語モデルへの独自のライセンスによるアクセスは、長期的には制限が多くコストがかかる可能性がありますが、オープンソースの代替手段は多くの場合、より安価でカスタマイズ性も高くなります。

したがって、オープンソース オプションを活用することで、企業はベンダーへの依存を減らし、特定のタスクやワークフローに合わせた専用の社内ツールを構築できるようになります。ただし、オープンソースの生成 AI を企業に責任を持って統合するには、セキュリティ、倫理、技術的機能の観点からリスクを厳密に評価する必要があります。

オープンソースと独自の生成 AI の比較

ブーズ・アレン・ハミルトンのジェネレーティブ AI ディレクターであるアリソン・スミス氏は、「オープンソース ジェネレーティブ AI」と題した講演で、オープンソース ジェネレーティブ AI の機会とリスクについて概説しました。

スミス氏は、オープンソース コミュニティと AI のブレークスルーの歴史的なつながりを強調し、機械学習の大きな進歩は TensorFlow や PyTorch などのオープンソースの取り組みに結びついていると述べました。しかし、生成 AI の時代では、これまで最高のパフォーマンスを発揮した LLM は閉鎖されました。

しかし、生成 AI は急速に進化している分野であり、特にニッチなアプリケーションでは、将来的にバランスが変化する可能性があります。オープンソースは、低コスト、柔軟性、透明性を備えているため、ニッチなアプリケーション モデルを微調整し、ソース コードのセキュリティ脆弱性を確認したい組織にとって魅力的です。

「オープンソースと、クローズドでプロプライエタリなソースとの比較については常に議論されてきた」とスミス氏はTechTargetに語った。 「こうした生成AIモデルの力により、この傾向はさらに強まるだろうと思います。

ChatGPT のような消費者向けの生成モデルは依然としてほとんどが独自のものですが、スミス氏は、オープンソースは、専門性、透明性、コスト上の利点を提供できる、より狭い範囲のアプリケーションで普及しつつあると主張しています。 「オープンソースに関してこのような大まかな発言をするのは、あるいはそもそもそれを実行するのは本当に難しい」と彼女は語った。

代わりに、独自の生成 AI を使用するかオープンソースの生成 AI を使用するかを決定するには、特定のユースケースの詳細を検討する必要がある場合があります。スミス氏は、ChatGPT などの消費者向けアプリケーションは主に独自のままである一方で、エコシステムは特定のタスクに合わせて調整された小規模なオープンソース モデルとして出現する可能性があると述べました。

「生成 AI の非常に幅広いレベルで、どちらか一方が他方と対決する事態は予想していない」とスミス氏は言う。「ChatGPT は、何でも質問でき、あらゆる種類のクレイジーなタスクを実行できるため素晴らしいです。しかし、特定のエンタープライズ レベルのユース ケースには本当に必要でしょうか?おそらくそうではないでしょう。

オープンソース生成AIの開発の難しさ

メリットがあるにもかかわらず、オープンソースの生成 AI の構築は困難な場合があります。他の種類のソフトウェアや機械学習の他の分野と比較して、生成 AI には、モデルを構築および運用するための専門的な才能だけでなく、より広範なインフラストラクチャとデータ リソースも必要です。

これらの要因はすべて、効果的なオープンソース生成 AI の構築に潜在的な障害をもたらします。有用で高性能なモデルをトレーニングするために必要な財務および計算リソースは、オープンソース環境で作業するモデル開発者は言うまでもなく、資金力のある企業にとっても困難です。こうした資金調達の課題は、AI 開発においては深刻化しているものの、より広い意味ではオープンソースにおける長年の課題を反映しています。

「オープンソースソフトウェアであっても、フレームワークやライブラリがどれだけ人気があっても、プログラミング言語としてのPythonであっても、それを保守しているすべての人々にとって、それは本当に報われない仕事です」とスミス氏は語った。 「そして、商品化するのは難しいのです。」

スミス氏は、資金調達の可能性のある方法として、基本的な機能への無料アクセスを提供しながら、セキュリティやコンサルティングなどの特定の機能やサービスに対して料金を請求するフリーミアムモデルに言及した。その他の一般的なモデルとしては、クラウドファンディング、非営利団体からの支援、大手テクノロジー企業からの資金提供などがあります。しかし、後者はオープンソース モデルやソフトウェア開発への影響に関して厄介な問題を引き起こす可能性があります。

「オープンソースコミュニティの素晴らしいところは、貢献が大規模で多様な人々から生まれることです」とスミス氏は語った。 「資金を集中させると、その資金源のインセンティブが誇張されるリスクがある。」

企業における生成型AIのリスクの予測と管理

企業内で生成 AI を効果的に導入するには、特にドメインおよび組織固有のデータを微調整してテクノロジーを最大限に活用するには、リスク管理とイノベーションの間で慎重なバランスを取る必要があります。

多くの組織が生成 AI イニシアチブを迅速に実装するプレッシャーを感じていますが、堅牢な確率モデルの導入には、特に機密性の高いアプリケーションの場合、慎重な検討が必要です。たとえば、医療や国家安全保障に関連する情報を処理するモデルは、顧客サービス チャットボットよりも大きなリスクを伴います。

スミス氏は、社内質問応答システムなどの生成 AI のエンタープライズ アプリケーションの場合、ユーザー アクセスと権限を制御する必要があることを強調しました。従業員が組織のドキュメント管理システム内の特定のフォルダーにのみアクセスできるのと同様に、内部 LLM は、情報を受け取る権限を持つユーザーにのみ情報を提供する必要があります。適切なアクセス制御を実装することで、ユーザーは自分の役割に適した応答のみを受け取ることができます。

「まず起こりうるリスクをリストアップすることが常に重要だ」とスミス氏は語った。 「まず、どのような行動を取ろうとしているか、その深刻さから始めます。次に、それがどれだけ広範囲に及ぶか、つまり、どれだけの人が影響を受けるかを考えます。」

すべてのリスクを予測することは不可能であるため、インシデント対応戦略を慎重に計画および開発することが重要です。 「私にとって、最善のアプローチは、まずセキュリティ体制から始めることです」とスミス氏は述べ、その後、有効性とユーザーエクスペリエンスの問題に移った。

ハンター氏は、IBMの調査により、事前に計画を立てることでサイバーセキュリティインシデントに関連するコストを大幅に削減できることがわかったと指摘した。 IBM の年次「データ侵害のコストに関するレポート」の 2023 年版では、インシデント対応の計画とテストのレベルが高い組織は、レベルの低い組織と比較して約 150 万ドルを節約しました。

「私たちは、特に新しい技術に興奮しているときは、その利点に圧倒されてしまう傾向があると思います」とスミス氏は語った。 「まずリスクについて話し合えたらいいのにと思います。そこでは、他にもいろいろあることを承知の上で、起こり得るあらゆる問題を詳しく説明します。そして、メリットを踏まえて、これは理にかなっているでしょうか?」

<<:  人工知能のゲーム理論:エージェントと人間、エージェントと環境の間のゲーム関係の予備的調査

>>:  突然!人気のAI企業が倒産の危機に!創設者は辞任を求められました!

ブログ    
ブログ    

推薦する

700 を超えるチームが登録し、「ICV アルゴリズム研究タスクの第 1 バッチ」の登録フェーズが成功裏に終了しました。

中国の自動車産業は、インテリジェンスとネットワーキングを核として、競争の後半期に突入しています。新世...

6つの権威あるリストを制覇したDAMOアカデミー独自の深層言語モデルシステムAliceMindはオープンソースです

[[406821]]自然言語処理 (NLP) は、AI の最高傑作として知られています。従来の NL...

物議を醸すClearview AI:顔認識アプリケーションは民間企業には販売されなくなった

生体認証技術といえば、アメリカの Clearview AI 社を挙げなければなりません。同社は最も包...

IoT、分析、AI – デジタル化の勝利のトリオ

デジタル化が進む世界では、すべてがスピードと個々の顧客ニーズの特定と対応を中心に展開されます。サービ...

救世主か、それとも公敵か? 人工知能の現在と未来を説明する記事

囲碁チャンピオンのイ・セドルを破ったロボット「アルファ碁」から、卓球ができるKUKAロボット、遠隔手...

役に立たない、それとも翻訳ツール?日本が「会話」できるスマートマスクを発明

マスクが翻訳機の仕事を引き継ごうとしている。 最近、日本のスタートアップ企業が、マスクを着けていると...

GPT の成熟への道に関する公式メモ | OpenAI Developer Day

OpenAI は ChatGPT 製品の作成の詳細を明らかにしました。そして、この共有の波は、次の...

バイトダンスが声明を発表:アルゴリズムや技術の移転は行われていない

9月21日、ByteDanceは「TikTokに関する特定の虚偽の噂についての声明」を発表した。バイ...

...

Python 用 OpenCV について Dlib を使って顔検出を実装する

Dlib は、プログラミング言語 C++ で記述された汎用のクロスプラットフォーム ソフトウェア ラ...

...

2021 年のトップ 10 のテクノロジー トレンド - AI、エッジ コンピューティング、マシン ビジョンなど

アーキテクチャ、クラウドコンピューティング1. 複雑なものをシンプルに: 「ミニマリズム」の道を行く...

低速自動運転と高速自動運転に関する議論

前回の記事「自動運転車に「道路を認識」させる方法」では、主に自動運転車における高精度地図の重要性につ...

2020年以降のAIトレンド

機械で書かれたニュース記事、AI 主導のサイバーセキュリティ、感情検出における重要な進歩など、201...

新たなレベルに到達しましょう!自動運転とインテリジェント交通における視覚言語モデルの最新の応用

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...