オランダのラドバウド大学は8月2日、MetaやOpenAIなどの企業が「オープンソース」という用語を使用する際にユーザーを誤解させる傾向があり、「オープンソース」と表示されている大規模な言語モデルの中には実際にはオープンソースではないものがあることを指摘する研究レポートを発表した。 報告書では特にMetaのLlama 2モデルとOpenAIのGPT/codexモデルに言及しており、これらの大規模言語モデルをトレーニングするためのコードは一般に公開されていないと述べている。 研究者らは、オープンソースの大規模言語モデルの不足が、現在の AI コミュニティにおいてますます顕著な問題になりつつあると述べています。研究者らは、研究者や開発者がコードにアクセスしてこれらのモデルのパフォーマンスを向上できるように、企業に対し、より多くのオープンソース LLM をリリースするよう呼びかけています。 OpenAI の ChatGPT モデルは最も「神秘的」であり、オープンソースの標準を満たしていません。また、Meta の Llama 2 は「オープンソース」であると主張していますが、実際の透明性は ChatGPT モデルよりもわずかに優れているだけで、オープンソース ランキングでのランキングは依然として非常に低いです。 調査レポートでは、これらの企業の主な理由として以下のことが挙げられます。
しかし、研究者や開発者は、オープンソースの大規模言語モデルに直面した場合、当然ながら不利な立場に置かれ、論文の結果を研究したり、既存の大規模言語モデルのパフォーマンスを改善したりすることができない可能性があります。 Meta の姿勢は皮肉なもので、同社は Llama 2 は研究に使用できると誇らしげに述べている。それでも、同社はプロジェクトの一部を開発者や研究者から締め出しているようだ。 IT Homeでは、ここに論文のリンクアドレスを添付しておりますので、ご興味のある方は詳細をお読みいただけます。 |
<<: 北京大学のチームは、より強力な一般化とより高い生成品質を備えたDiffusionでDragGANをアップグレードしました。クリックするだけで「地面から山が立ち上がる」
>>: 複雑な課題に対するスマートなソリューション: 自動化の成功への道
AI を活用して製造効率を向上させ、インテリジェントな自動化で業界を変革します。製造業は人工知能技...
Iconfinder は、デザイナー、開発者、その他のクリエイティブ ワーカー向けに優れたアイコンを...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
1. 製造業の発展の現状まず、製造業企業の発展状況について紹介します。 1. 企業経営は直線的な発展...
[[202723]] AWS 上で大規模なディープラーニング処理を実行することは、学習と開発を行うた...
この記事では、Python のトップ AI および機械学習プロジェクトを更新します。 Tensorf...
[[388981]]今まで見たことのない犬種や色であっても、私たちは一目見てその犬を認識することがで...
この記事では、超強力なソーシャル攻撃から AI 搭載 PC まで、AI が今年サイバーセキュリティを...
2019 年は AI にとって非常に素晴らしい年でしたが、これはすべて 2020 年にさらに大きな影...
最初のトレンドは、すべてのIT大手がAIクラウドサービスに多額の投資を行うことです。AI-aaS、つ...
企業のセキュリティ システム開発のペースが加速するにつれて、より高度な新しいタイプのサイバー攻撃が出...