オランダのラドバウド大学は8月2日、MetaやOpenAIなどの企業が「オープンソース」という用語を使用する際にユーザーを誤解させる傾向があり、「オープンソース」と表示されている大規模な言語モデルの中には実際にはオープンソースではないものがあることを指摘する研究レポートを発表した。 報告書では特にMetaのLlama 2モデルとOpenAIのGPT/codexモデルに言及しており、これらの大規模言語モデルをトレーニングするためのコードは一般に公開されていないと述べている。 研究者らは、オープンソースの大規模言語モデルの不足が、現在の AI コミュニティにおいてますます顕著な問題になりつつあると述べています。研究者らは、研究者や開発者がコードにアクセスしてこれらのモデルのパフォーマンスを向上できるように、企業に対し、より多くのオープンソース LLM をリリースするよう呼びかけています。 OpenAI の ChatGPT モデルは最も「神秘的」であり、オープンソースの標準を満たしていません。また、Meta の Llama 2 は「オープンソース」であると主張していますが、実際の透明性は ChatGPT モデルよりもわずかに優れているだけで、オープンソース ランキングでのランキングは依然として非常に低いです。 調査レポートでは、これらの企業の主な理由として以下のことが挙げられます。
しかし、研究者や開発者は、オープンソースの大規模言語モデルに直面した場合、当然ながら不利な立場に置かれ、論文の結果を研究したり、既存の大規模言語モデルのパフォーマンスを改善したりすることができない可能性があります。 Meta の姿勢は皮肉なもので、同社は Llama 2 は研究に使用できると誇らしげに述べている。それでも、同社はプロジェクトの一部を開発者や研究者から締め出しているようだ。 IT Homeでは、ここに論文のリンクアドレスを添付しておりますので、ご興味のある方は詳細をお読みいただけます。 |
<<: 北京大学のチームは、より強力な一般化とより高い生成品質を備えたDiffusionでDragGANをアップグレードしました。クリックするだけで「地面から山が立ち上がる」
>>: 複雑な課題に対するスマートなソリューション: 自動化の成功への道
AI は教育テクノロジーの分野では以前から使われてきましたが、その導入は遅れています。しかし、COV...
コンピューター ビジョンは、ほぼすべての産業分野で進歩を加速させています。 コンピューター ビジョン...
ネイチャー誌は11月24日、現地時間水曜日に、今月初めに米国医師会眼科学会誌に掲載された論文で、著者...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
教師なしテキストコーパスのみで事前トレーニングされた基本的な大規模言語モデル (LLM) は、通常、...
2023年11月、51CTOが主催し、WOT大会の元共同議長とCTO組織が共催する「中国企業『IT印...
最近、2021年世界ロボット大会が北京で盛大に開幕しました。ロボット分野の最先端技術と最新の成果が展...
[[346344]] 「人類の技術発展の歴史を振り返ると、機械化、電化、情報化の時代を経験し、生産や...
2月27日、米国の著名な自動運転企業であるAuroraは、ライダーチップ企業OURSを1億ドルで買収...
このシリーズの前回の記事では、行列と線形代数についてさらに詳しく説明し、JupyterLab を使用...
人材管理に関して言えば、AI は、あらゆる業種のあらゆる企業ですでに日常的に導入されているツールです...
今年も大学入試シーズンがやってきました。私が大学受験をしていた頃には、この言葉が流行っていたのを覚え...