この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 わずか10 億のパラメータで中国の自然言語理解CLUEリストのトップ 3 にランクされているMencius モデルが、オープンソースになりました。 これを作成したチーム、蘭州科技創新工場は最近、孟子の普遍モデルに基づいた4つのモデルをオープンソース化すると発表した。 テキスト分類、金融ニュース分類、コピーライティング生成、画像説明などのシナリオで使用できます。 今年7月、AIの専門家である周明氏とそのチームが作成したこの軽量モデルは、リリースされるやいなや皆を驚かせました。 数百億、数千億のパラメータを持つモデルが10億のパラメータで樹立した記録を達成し、CLUEリストがテンセント、Sogou、Huawei、Alibaba Damo Academyによって独占されていた近年のパターンを打ち破りました。 現時点では、Mencius モデルはリストのトップ 5 の中で唯一、巨大企業が発売していないモデルであり、 3 位にランクされています。 下流タスクにおける優れたパフォーマンスCLUE リストは自然言語理解のプレイヤーたちの戦場であり、Tencent、Sogou、Huawei、Alibaba Damo Academy などが順番にリストを独占し、記録を更新しています。 彼らの大規模なモデルは、多くの場合、数千億または数兆のパラメータを持っています。わずか 10 億のパラメータを持つ Mencius モデルは、どのようにして包囲を突破したのでしょうか? 孟子モデルを見てみましょう。 Mencius モデルは、言語情報の統合やトレーニングの加速などの方法に基づいて Lanzhou Technology が開発した一連のモデルです。 BERT との一貫したモデル構造 (Transformer) により、Mencius モデルは既存の事前トレーニング済みモデルをすぐに置き換えることができます。 多言語・マルチモーダルなデータを処理でき、さまざまなテキスト理解やテキスト生成のタスクをサポートし、テキスト分類や読解などのさまざまなタスクで優れたパフォーマンスを発揮します。 具体的には、4 つのオープンソース モデル アーキテクチャは次のとおりです。 さまざまなシナリオに対応して、Mencius モデルは財務タスクで優れたパフォーマンスを発揮します。 マーケティング コピーの生成に関しては、Mencius モデルは GPT よりもはるかに豊富な言語を生成できます。 画像コンテンツの説明もより正確かつ詳細になり、AIの痕跡はほとんど見られません。 少しの努力で大きな成果が得られる他の中国語言語モデルと比較すると、Mencius モデルの最大の特徴は、小型で精密であることです。 軽量なトレーニング戦略を採用し、数十億のパラメータを持つ小さなモデルの構築に取り組んでおり、既存のパラメータの下でのモデルの潜在能力を最大限に活用し、実際のビジネスシナリオを迅速かつ低コストで実装するのに役立ちます。 同時に、Mencius は人間の事前知識を使用してモデルのトレーニングをガイドし、モデルがより効率的に知識を獲得できるようにします。 Menciusモデルの言語理解能力はトップクラスで、権威あるCLUE中国語理解評価の総合ランキングでは84点を超え、人間のベンチマークスコア(85.61)に迫りました。 さらに、T5 スタイルのエンドツーエンドで生成されたトレーニング パラダイムに基づき、BERT スタイルの判断ベースのアーキテクチャを同期的に適応させることで、Mencius モデルは業界のアプリケーションに簡単に適応でき、幅広いビジネス シナリオをカバーできます。 モデルアーキテクチャの面でも、「Mencius」は全面的に改善されました。 具体的な側面は 4 つあります。
周明:認知知能にとって今後10年間に大きなチャンスが生まれる最後に、Mencius モデルの背後にあるチームであるLanzhou Technologyを紹介しましょう。 イノベーションファクトリーによって育成された認知インテリジェンス企業です。 同社の創設者は周明博士。 AI の分野では、周明氏はもはや説明の必要がありません。彼は世界的に認められた AI 科学者であり、自然言語処理の分野を代表する人物です。 周明博士は2020年にイノベーションワークスに入社し、主任科学者を務めました。 私たちはまた、開催されたばかりの2021年杭州雲奇カンファレンスで周明博士に会いました。 彼は、長年にわたる産学研究連携の経験に基づき、認知知能に関する自身の考えをいくつか共有しました。 周明博士は、現在のニューラルネットワーク手法は、エンドツーエンドのトレーニングに大規模なラベル付きデータに依存していると述べました。このブラックボックスシステムには説明力と常識的な推論能力が欠けています。
現在のディープラーニングは、両方の利点を 1 つのモデルで組み合わせる方法、つまりデータと知識を統合して問題を解決する方法を考えるべきだと彼は考えています。 さらに、周明博士は、ディープラーニングでは新しいタスクをトレーニングし、すべての機能を学習する必要があるとも提案しました。しかし、人間が新しいタスクに取り組むときは、基本的な能力に基づいて小さな調整のみを行うことが多いです。 したがって、人間の脳をどのようにシミュレートし、一連の基本機能とそれに応じた微調整メカニズムを設計するかは、ディープラーニングが考慮する必要がある問題です。 AI業界の展望について語る際、周明博士は次のように述べた。
同時に、彼は、Lanzhou Technology がオープンソースから始まり、SaaS、カスタマイズ、アプリに移行していることも明らかにしました。現在、当社は国内外の数十の有名大学や関連分野の大手企業10社以上と安定した協力関係を築いています。 ポータル現在、蘭州科技はプロジェクトのオープンソースアドレスと技術レポートを公開しています。アドレスは次のとおりです。 プロジェクトアドレス: https://github.com/Langboat/Mengzi |
<<: 継続的な冷却を心配する必要はありません。ドローンが電力網を保護して暖かさを提供します
>>: AIコンピューティングのローカライズのもう一つの可能性:CoCoPIEの探究と選択
[[271164]]人類史上初のプログラム可能なメモリスタ コンピュータが誕生しました。音声コマン...
[[315014]]新型コロナウイルス感染症の発生と蔓延は、全国の人々の心を動かしました。社会のあ...
毎年、大学入試の結果が発表されると、多くの受験生が専攻の選択に悩みます。では、優秀な学生たちはこのよ...
会話型ロボットと聞くと、私と同じように、SiriやAlexaとの会話をすぐに思い浮かべますか?時には...
チャットができる「インテリジェント音声アシスタント」から、さまざまな家電を操作できるスマートスピーカ...
11月19日、北京で「百度銀行&百度クラウドAI+銀行金融技術シンクタンク」が開催されました。カンフ...
小売業におけるロボット工学の応用により、企業は小売業のバリューチェーン全体を変革し、強化することがで...
サイバーセキュリティは「人民の戦い」を必要とするだけでなく、科学技術の問題でもある。オンライン詐欺で...
現在、神府改革革新モデル区、華為(遼寧)人工知能イノベーションセンター、上海交通大学が共催する神府モ...
AI が OpenAI の内部闘争ドラマを変える...錦江の味がスクリーンから溢れ出てきます! イリ...