テクノロジー企業史上初:MetaがGPT3パラメータサイズのAIモデルをオープンソース化

テクノロジー企業史上初:MetaがGPT3パラメータサイズのAIモデルをオープンソース化

テキスト段落の生成、人間の会話のシミュレーション、数学の問題の解決において驚くほど優れたパフォーマンスを発揮する大規模言語モデルは、明らかに近年の AI 開発で最もホットな分野の 1 つです。しかし、このような大規模な言語モデルは、それ自体が有害なコンテンツを生成するだけでなく、その上に構築された下流のアプリケーションを通じてそのようなコンテンツを拡散させる可能性もあります。

理論的には、より多くの人が参加すれば、問題解決に役立つはずです。しかし、言語モデルのトレーニングには膨大な量のデータと計算能力が必要となるため、これまでは大手テクノロジー企業の独占領域となっていました。 AIの誤用を懸念する学界、倫理学者、社会科学者などの幅広いグループにとっては、傍観するしか選択肢はない。

「信頼を築く唯一の方法は徹底した透明性だと私は信じている」とメタAIのマネージングディレクター、ジョエル・ピノー氏は語った。現地時間5月3日、Meta AIは1750億のパラメータを持つ大規模言語モデル「OPT-175B(Open Pretrained Transformer、OPT)」をリリースした。

これは大手テクノロジー企業にとって前例のない動きだ。大規模言語モデルの歴史の中でも、事前学習済みモデル、学習コード、使用コードが遠慮なく公開されるのは初めてのことです。

「私たちの多くは大学の研究者です」とピノー氏は言う。「そして、こうしたモデルを構築する上で大学と産業界の能力に明らかなギャップがあることを知っています。研究者が集まってこの技術について議論することの利点は明らかです」。彼女は、他の人たちが自分たちの研究を詳しく調べ、細かく分析したり、それを基に構築したりしてくれることを期待している。彼女は、より多くの人が関与すれば、より早く画期的な成果が達成されると信じています。

OPT 言語モデルには約 1,750 億個のパラメーター (トレーニング中に調整できるニューラル ネットワークのパラメーター) があり、これは OpenAI の画期的なニューラル ネットワーク GPT-3 とほぼ同じサイズですが、有料サービス GPT-3 の並外れた機能と避けられない欠陥の両方を備えています。

ピノー氏は「これは慎重に設計された」と言い、OPTを構築する際には、言語タスクにおける精度と有害性の点でGPT-3に匹敵することを検討したと語る。 OPT は、研究者に研究用の同様の言語モデルを提供することを目的としています。

OpenAIはMetaの声明についてコメントを控えた。

OpenAIの親会社であるGoogleは、自社の検索製品に大規模言語モデルを使用することを検討しているが、透明性の欠如についても批判されている。グーグルはこの点で多くの論争を巻き起こしてきた。同社は、当時のグーグルの言語システムがウェブサイトから偏見やヘイトスピーチを学習する可能性があるという論文を発表しようとしたAI倫理研究者のティムニット・ゲブル氏を解雇したほか、最近では発表された研究に異議を唱えた従業員を解雇した。

では、なぜ Meta はこのようなことをするのでしょうか。結局のところ、Meta は Facebook や Instagram の背後にあるアルゴリズムがどのように機能するかについてほとんど語らないテクノロジー企業であり、自社にとって不利な問題については社内の研究チームに秘密にしていることでも有名です。

MITテクノロジーレビューは、Meta社がこれまでとは異なるアプローチをとっている重要な理由は、長年AIの研究開発プロセスの透明性を推進してきたピノー氏自身にあると考えている。

主要な学術会議で研究を発表する方法に関して、ピノー氏は研究者に対し、実験がどのように行われたかについてのコードと詳細な情報とともに研究結果を提出することを義務付けている。彼女は2017年にMeta(当時はFacebook)のAIラボに入社して以来、この文化を推進してきました。

「メタのオープンサイエンスへの取り組みが、私がここにいる理由です」とピノー氏は言う。「他の方法ではここで働くことはできません。」

コードに加えて、Meta は開発ログも公開しました。ログには、チーム メンバーからのトレーニング データに関する毎日の更新 (モデルにデータがいつどのように追加されたか、何が機能して何が機能しなかったか) が含まれます。研究者らは、2021年10月から2022年1月までノンストップで実行された3か月間のトレーニングプロセス中に発生したすべてのエラー、クラッシュ、再起動を100ページを超えるメモに記録した。

スタンフォード大学基礎モデル研究センター所長のパーシー・リャン氏は、大規模モデルのオープン性を次の 4 つのレベルにまとめました。

最初のレイヤーは、いくつかのアイデアの実現可能性を証明し、構築のアイデアを提供するオープンペーパーです。2番目のレイヤーは、研究者が既存のモデルの機能 (推論能力など) と制限 (バイアスなど) を調査および評価できるようにするオープン API です。3番目のレイヤーは、研究者が既存のモデルを徐々に改善し、より深い解釈可能性技術とより効果的な微調整方法を開発し、モデルの動作におけるトレーニングデータの役割をより深く理解できるようにするオープンモデルの重みとトレーニングデータです。4番目のレイヤーは、研究者が新しいアーキテクチャ、トレーニングの目的とプロセスを試し、データ融合を実行し、さまざまな分野でまったく新しいモデルを開発できるようにするオープンコンピューティングパワーです

「オープン性が高まると、研究者はより深い問題に集中できるようになるが、リスクも高まる」とパーシー・リャン氏は明言した。

Meta が自社の大規模言語モデルをここまでオープンソース化するという決定は非常に大胆な動きであり、現在では想像もできないリスクをもたらす可能性があります。これは、OpenAI が GPT-3 の前身である GPT-2 をリリースしない理由でもあります。

「このモデルには他に恐ろしいリスクがないとは言えません」とピノー氏は述べた。「単に危険すぎるという理由で」このモデルをリリースすべきではないという考えをピノー氏は否定した。 「こうしたモデルの弱点は理解しているが、それは研究者の考え方ではない」と彼女は語った。

MITテクノロジーレビューによると、Googleの行動規範に違反したとして解雇されたAI倫理研究者のマーガレット・ミッチェル氏は、OPTのリリースは前向きな動きだと考えている。しかし彼女は透明性には限界があると考えている。 「言語モデルは十分に厳密にテストされているか? 予測可能な利点は予測可能な害を上回っているか? また、そのプロセスはどのようにして誤った情報や人種差別的、女性蔑視的な言語の生成を回避できるのか?」と彼女は問いかけた。

グーグルセンターでミッチェル氏と共同研究してきたワシントン大学の計算言語学者、エミリー・M・ベンダー氏も、潜在的な危害にどう対処するかを懸念している。 「機械学習テクノロジーのリスクを軽減する本当の鍵は、このシステムは何のために使用されるのか、誰が使用するのか、システムの出力は彼らにどのように提示されるのかなど、特定のユースケースのコンテキストで評価し、調査することです。」

ピノー氏にとって、こうした懸念は、コミュニケーションを減らすのではなく、よりオープンな議論を通じて対処されるべきである。 「世界中の人々は、どのような会話が適切かについてさまざまな見解を持っています。そして、人工知能はその会話の一部なのです」とピノー氏は語った。彼は、言語モデルが誰もが同意する何かを言うとは思っていないが、「しかし、私たちはそれにどう対処するのでしょうか。それは、議論中に他の人の声にもっと耳を傾けることです」

<<:  科学者たちは、人間の肌の感触を模倣し、さらには触覚の方向を感知して予測できる電子毛髪を備えたロボットを開発している。

>>:  トレンド: IT の複雑さにより AIOps の必要性が高まる

推薦する

...

世界図書デー: スマートテクノロジーがいかにして優れた読書環境を作り出すか

4月23日は第25回「世界本の日」です!今日は本を読みましたか?ゴーリキーはかつてこう言った。「本は...

ICLRは深層生成モデルに関する大きな議論を開催し、ウェリングとAAAIの百万ドル賞受賞者が来場する。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アリババが国際AIサミットを主催、医療AIとマルチメディアコンテンツ理解が話題に

10月15日、記者はアリババが主催する2020 ACMマルチメディア(以下、ACM MM 2020)...

9月9日がまたやってきました。重陽の節句にスマートテクノロジーについてお話しましょう。

[[428874]]現代では、社会の発展と時代の進歩に伴い、伝統と現代の衝突、古典と革新の融合が、...

人工知能は祝福か、それとも呪いなのか?事故は急増しており、アップルとグーグルも例外ではない

人工知能は現代の大きな発展のトレンドであり、世界中のほぼすべてのハイテク企業が AI 分野の技術を研...

言語は「絆」であり、イメージバインドを超えて、さまざまなモードでパンチとキックを行う

北京大学とテンセントがマルチモーダル15角形の戦士を制作しました!言語を中心に据えて、ビデオ、オーデ...

睡眠研究はより優れた AI モデルの作成に役立ちますか?

私たちはなぜ眠るのでしょうか? 明らかな理由の一つは、体と手足の力を回復することです。しかし、睡眠の...

人間と機械のコラボレーションが顧客に力を与え、インテリジェントな顧客サービスが企業のマーケティング環境を一変させています。

「ロボットはアフターサービスにしか適していません。」 「ロボットはどのようにして人手によるマーケテ...

業界のハイエンド複合AI人材を育成するために、第5回AICAチーフAIアーキテクトトレーニングプログラムが開始されました。

10月15日、国家深層学習技術応用工学研究所と百度が共同で開始した第5回AICAチーフAIアーキテ...

あなたはまだ顔認識精度指標に騙されていませんか?

導入ハードウェアの性能向上と顔データ量の増加に伴い、顔認識はますます成熟し、商業的な用途もますます増...

ヤン・ルカン:私は畳み込みニューラルネットワークの父ですが、その特許にも縛られてきました

[[409963]]学術研究の特許所有権は、研究者の研究成果を保護し、保証するものであるため、研究者...

GPT の成熟への道に関する公式メモ | OpenAI Developer Day

OpenAI は ChatGPT 製品の作成の詳細を明らかにしました。そして、この共有の波は、次の...

オペレーティングシステムエンジニアリングの観点から見たAIoT

2008年は特別な年でした。前年にはiPhoneが発売され、翌年にはAndroidがリリースされま...

ソートアルゴリズムを簡単に学ぶ: よく使われるソートアルゴリズムを視覚的に体験

1. クイックソート導入:クイックソートは、Tony Hall によって開発されたソートアルゴリズム...