オランダのラドバウド大学は8月2日、MetaやOpenAIなどの企業が「オープンソース」という用語を使用する際にユーザーを誤解させる傾向があり、「オープンソース」と表示されている大規模な言語モデルの中には実際にはオープンソースではないものがあることを指摘する研究レポートを発表した。 報告書では特にMetaのLlama 2モデルとOpenAIのGPT/codexモデルに言及しており、これらの大規模言語モデルをトレーニングするためのコードは一般に公開されていないと述べている。 研究者らは、オープンソースの大規模言語モデルの不足が、現在の AI コミュニティにおいてますます顕著な問題になりつつあると述べています。研究者らは、研究者や開発者がコードにアクセスしてこれらのモデルのパフォーマンスを向上できるように、企業に対し、より多くのオープンソース LLM をリリースするよう呼びかけています。 OpenAI の ChatGPT モデルは最も「神秘的」であり、オープンソースの標準を満たしていません。また、Meta の Llama 2 は「オープンソース」であると主張していますが、実際の透明性は ChatGPT モデルよりもわずかに優れているだけで、オープンソース ランキングでのランキングは依然として非常に低いです。 調査レポートでは、これらの企業の主な理由として以下のことが挙げられます。
しかし、研究者や開発者は、オープンソースの大規模言語モデルに直面した場合、当然ながら不利な立場に置かれ、論文の結果を研究したり、既存の大規模言語モデルのパフォーマンスを改善したりすることができない可能性があります。 Meta の姿勢は皮肉なもので、同社は Llama 2 は研究に使用できると誇らしげに述べている。それでも、同社はプロジェクトの一部を開発者や研究者から締め出しているようだ。 IT Homeでは、ここに論文のリンクアドレスを添付しておりますので、ご興味のある方は詳細をお読みいただけます。 |
<<: 北京大学のチームは、より強力な一般化とより高い生成品質を備えたDiffusionでDragGANをアップグレードしました。クリックするだけで「地面から山が立ち上がる」
>>: 複雑な課題に対するスマートなソリューション: 自動化の成功への道
私たちの日常生活では、携帯電話のさまざまなアプリにますます依存するようになっています。外食時にレスト...
自動運転技術の開発は常に議論の的となっています。自動運転の将来に関して、避けて通れない話題が1つあり...
海外メディアの報道によると、最近「ニューサイエンス」誌に次のような記事が掲載された。 「米軍は1キロ...
2020 年に世界中の企業の 42% がサイバー攻撃を受けたことをご存知ですか? サイバー犯罪者が...
翻訳者|朱 仙中レビュー | Chonglou導入通常、事前トレーニング済みの大規模言語モデル (L...
[[429444]]この記事はWeChatの公開アカウント「Computer World」から転載...
AlphaGoがイ・セドルに勝利したことで世界は人工知能に再び親しむようになったが、アップグレード...
7月4日、コード生成に重点を置いたAIモデルとしてMetaGPTが発表された。名前は似ているが、Me...
ビッグデータダイジェスト制作編集者: CoolBoyみなさん、こんにちは! 先月のトップ 10 の機...
基本的な紹介学術的なニーズを別にすれば、ほとんどの人はアルゴリズムの研究に従事するのではなく、第一線...