大規模モデルの開発動向はオープンソースへと移行し始めています。 周知のとおり、ChatGPT、GPT-4などのスターモデルはオープンソースではありません。それに応じて、オープンソース分野では、Metaが最近リリースしたLlama 2が、無料かつ商用利用可能な大規模モデルシリーズとして特に注目を集めています。 今日、オープンソース分野にもう一つの朗報が届きました。AIモデルコミュニティModelScopeが、Qwen-7BとQwen-7B-Chatという2つのオープンソースモデルを発表しました。Alibaba Cloudは、これらがTongyi Qianwenの70億パラメータ汎用モデルと対話モデルであることを確認しました。 最も重要なのは、どちらのモデルもオープンソースで、無料で、市販されていることです。
具体的には:
オープンソース コードは、Qwen-7B および Qwen-7B-Chat の量子化をサポートし、ユーザーがコンシューマー グレードのグラフィック カードにモデルを展開して実行することをサポートします。 モデルをダウンロードしたいユーザーは、MoDa コミュニティから直接モデルをダウンロードするか、Alibaba Cloud Lingji プラットフォームを通じて Qwen-7B および Qwen-7B-Chat にアクセスして呼び出すことができます。Alibaba Cloud は、モデルのトレーニング、推論、展開、微調整など、幅広いサービスをユーザーに提供します。 実際、アリババクラウドは今年4月にはすでに自社開発のビッグモデル「Tongyi Qianwen」をリリースしており、今回の2つのオープンソースモデルは研究者がビッグモデルを利用するハードルを大幅に下げた。この動きにより、アリババクラウドは中国で初めて大規模モデルオープンソースの仲間入りを果たした大規模テクノロジー企業となる。 複数の権威ある評価において、Tongyi Qianwen 7B モデルは国内外の同規模のモデルをはるかに上回る結果を達成し、業界最強の中国語と英語の 7B オープンソース モデルとなりました。 Tongyi Qianwen 7B 事前トレーニング済みモデルは、複数の権威あるベンチマーク評価で優れたパフォーマンスを発揮しました。中国語と英語の機能は、国内外の同規模のオープンソース モデルの機能をはるかに上回っており、一部の機能は 12B や 13B 規模のオープンソース モデルの機能さえ上回っています。 英語能力評価ベンチマーク MMLU では、Tongyi Qianwen 7B モデルは、主流のオープンソース モデル 7B、12B、13B よりも高いスコアを獲得しました。このベンチマークには 57 の分野からの英語の質問が含まれており、人文科学、社会科学、科学、工学の総合的な知識と問題解決能力がテストされます。 中国の常識能力評価ベンチマーク C-Eval では、Tongyi Qianwen は検証セットとテストセットの両方で最高得点を獲得した 7B オープンソース モデルであり、その堅実な中国語能力を実証しています。 数学の問題解決能力評価の GSM8K やコーディング能力評価の HumanEval などのベンチマークでも、Tongyi Qianwen 7B モデルは優れたパフォーマンスを発揮し、同サイズのすべてのオープンソース モデルや一部の大規模オープンソース モデルを上回りました。 Alibaba Cloudは、オープンソースのビッグモデルは、ユーザーがモデルのトレーニングと展開のプロセスを簡素化するのに役立つと述べました。ユーザーはモデルをゼロからトレーニングする必要はありません。事前にトレーニングされたモデルをダウンロードして微調整するだけで、高品質のモデルを迅速に構築できます。 Tongyi Qianwen のオープンソース化により、より多くの企業や機関がこの仲間入りを果たし、より多くの研究者に利便性をもたらすようになると信じています。 |
<<: マスク氏がai.comドメイン名を購入しました!ウルトラマンは数千万ドルを費やしてそれを購入し、4ヶ月でアイアンマンに売却した
>>: Jupyter のアップグレード: さまざまな大規模モデルを接続し、コードを生成し、チャットを通じてエラーを修正できます
過去 30 年間にわたり、この種のイノベーションの歴史に残る例は数多くありました。ウェブサイト上のメ...
Star NLP 社からの速報: 6 か月間の業務および生産停止。最近配布されたスクリーンショット...
生体認証の一種である顔は固有のものであり、ひとたび情報漏洩が発生するとリスクが非常に高くなります。顔...
[[416636]] Transformer と CNN はどちらも独自の利点を持ち、視覚表現を処理...
ロボットファンの多くにとって、四足歩行ロボットといえば、まずボストン・ダイナミクス社のロボット犬を思...
6月9日、「新AI、新企業サービス、新旅」Wofeng Technologyブランドアップグレードメ...
NLP 研究者は皆、言語モデルは文法的な文脈情報しか学習できず、常識的な質問に関しては無力であること...
2018年、国内の人工知能とビッグデータ産業は引き続き急速な発展を遂げ、国家計画の導入に伴い、各地...
[[353503]]画像ソース: https://pixabay.com/images/id-575...
インダストリー 4.0 における AI イニシアチブの主要な運用指標と主要業績評価指標 (KPI) ...
過去数十年にわたり、AI ツールは、コンピューター サイエンスから製造、医学、物理学、生物学、さらに...
生体認証技術は、市場に登場した最新の AI イノベーションのおかげで、特に 2021 年には長年にわ...
人工知能の分野が日々急速な発展と進歩を遂げていることは疑いの余地がありません。携帯電話の電源を入れ、...