平均して、1 秒で 1 つの高得点大学入試エッセイが生成されます。PaddlePaddle Wenxin モデルはどのようにしてこれを実現するのでしょうか?

全国的な大学入試が進行中で、百度のAI技術も「大学入試」に直面している。 6月7日、大学入試の中国語テスト終了後、百度のデジタルヒューマン杜小小が「デジタルヒューマン受験生」に変身し、大学入試の作文に挑戦し、ネット上で白熱した議論を巻き起こした。 AI ライティングには、自然言語処理、データマイニング、ナレッジグラフなど、多くの人工知能技術が関わっています。Baidu は PaddlePaddle Wenxin モデルを使用して、Du Xiaoxiao が大学入試エッセイを適切かつ迅速に書き終えられるようサポートしました。報道によると、杜暁暁さんは全国大学入試問題Iの「天性の才能、優れた才能、平凡な才能」という論説文の解答に参加した。彼は40秒間でこのテーマに基づいて40本以上の文章を作成し、平均して1秒あたり1つの文章を生成した。そのうちの1つがランダムに選ばれ、彼の得点は大学入試受験者の約75％を上回った。

平均して1秒で1つの記事が書かれ、スコアは候補者の75％を超えています。Wenxinモデルは速く、文章が優れています。

テキスト作成に AI を適用することは、テクノロジーの世界ではもはや目新しいことではありません。ビッグデータやディープラーニングなどの技術の発展により、AI はテキスト生成機能を大幅に向上させました。金融やスポーツのニュース速報から詩や小説などの文学作品まで、AIライティングの対象となる分野はますます広くなり、創作形式や内容も多彩になってきています。

しかし、コメント、要約、速報などの他のコンテンツ形式と比較すると、大学入試のエッセイを AI で生成するのは明らかに困難です。大学入試のエッセイ作成は、「問題分析」「論理」「創造性」の3つの側面でAIにとって大きな課題となります。大学入試の小論文は、設問の見直しレベルでは、テーマやテーマが多岐にわたり、内容も複雑です。常に変化する組み合わせは、AI の理解力を試す厳しいテストです。論理的なレベルでは、大学入試のエッセイは 800 語以上必要です。長いエッセイのさまざまな部分間の論理と一貫性をどのように確保するかは、AI にとってもう 1 つの大きな課題です。最後に、クリエイティブなレベルでは、読みやすさは大学入試のエッセイの最も重要な採点基準の 1 つです。AI の文章は、関連性と一貫性があるだけでなく、古典を引用したり、修辞法を巧みに使用したり、さらには革新的であったりして、記事が空虚で退屈にならないようにする必要があります。

これらの課題に直面して、Du Xiaoxiao は Feijiang Wenxin モデルの助けと指導を受けて、迅速かつ適切に執筆を完了しました。かつて北京の大学入試中国語採点グループの責任者を務めた沈毅氏は、杜暁暁さんの作文で48点（合計60点満点）を採点した。彼女によると、過去の成績を見ると、小論文の点数が48点以上だった受験生は25％未満だった。つまり、杜暁暁さんの小論文の点数は、大学入試受験生の約75％を上回ったことになる。かつて「ザ・ブレイン」に出演した優秀な学生でネットセレブの潘周丹氏も、杜暁暁氏の文章力に「感心」を表明した。

これは、タスク関連の知識を統合した Wenxin Big Model の 1 兆ドル規模のモデル ERNIE 3.0 Zeus の最新リリースのおかげです。このモデルは、膨大なデータと知識の学習に基づいて、さらに 100 種類を超えるさまざまな形式のタスク知識を学習し、モデルの有効性を高め、さまざまな NLP タスクでより強力なゼロサンプルおよび小サンプル学習機能を発揮します。簡単に言えば、文心モデルは、従来のモデルよりも理解力と創造力が優れている、知識豊富な「優秀な学生」または「学問の達人」のようなものです。「一発で待てる」という迅速な生産能力だけでなく、「神に啓示されたように書く」という品質保証も備えています。

Wenxin モデルのサポートにより、Du Xiaoxiao が完成させた大学入試エッセイの品質は、以前に比べて大幅に向上しました。まず、生成された作文はテーマを忠実に守り、明確な意図を持っています。Du Xiaoxiao は与えられた作文のテーマをよく理解しており、テーマを中心に文章を構成し、記事の観点をサポートし、テーマに対する肯定的な洞察を出力します。次に、800 語の長い文章で、Du Xiaoxiao は生成されたコンテンツ構造が完全で、言語が流暢で、トピックが最初と最後に紹介され、コンテキストがスムーズにつながっていることを確認できます。同時に、Wenxin モデルの知識蓄積がより強力であるため、Du Xiaoxiao によって生成されたエッセイは古典の引用がより優れており、平行法や比喩などの修辞技法を適切に使用しているため、記事の読みやすさが大幅に向上します。

しかし、沈怡を驚かせたのは、杜暁暁が作文の中で小さな間違いを犯したことだった。彼女はインターネットの流行語であるYYDSを使ったのだ。この「ポイントの損失」の原因は、Du Xiaoxiao がいくつかの人気のあるネットワークデータを学習したためです。生成された記事の文脈から判断すると、Du XiaoxiaoはYYDSの「本質」をつかんでいます。使用法自体は適切ですが、大学入試エッセイの執筆基準に完全には適合していません。これは、AIライティングが学習と改善を継続できることを間接的に反映しています。

文心ビッグモデルは知能創造を助け、AIGC時代の到来を促進する

過去1年間、BaiduのAI技術、特に最近登場したAIGCは、急速に導入されてきました。 AIGC は、UGC や PGC に続く新しいコンテンツ制作手法です。人工知能技術を使用してコンテンツを自動制作することを指します。デジタルヒューマンや TTV (Text to Video) がそのベンチマークアプリケーションです。 Baidu Research Instituteは、2022年にAIGCテクノロジーが大規模モデルのクロスモーダルな総合技術力を活用して創造性を刺激し、コンテンツの多様性を向上させ、制作コストを削減し、大規模なアプリケーションを実現すると予測しています。

今回、Du Xiaoxiao は、PaddlePaddle Wenxin モデルによって実装された AIGC モデルに基づいて作成された大学入試エッセイを作成しました。 Wenxinモデルは「知識強化」を中核機能とし、大規模な知識と膨大なデータからの学習を統合することができ、学習効率が高く、結果も良く、汎用性が高く、一般化が強いという特徴があります。

インテリジェントライティングに加え、Wenxinビッグモデルのサポートにより、AIは強力な理解力と生成能力を備え、AIペインティング、AI作詞、AI編集などのクリエイティブ作品の自動生成を実現できます。現在、文心大型模型創作探究コミュニティ-楊谷コミュニティでは、知能絵画、知能対話、知能創作、物語生成などの大型模型の創作アプリケーションがリリースされています。「文心大型模型」を検索して公式サイトに入り、体験してください。将来的には、ビッグモデルに基づく AIGC が開放され、より多くのコンテンツ制作分野が強化される予定です。

大規模な事前トレーニング済みモデルの登場により、人工知能の汎用性がさらに高まりました。大規模モデルは、効果が良く、一般性が強く、研究開発プロセスの標準化度が高いという特徴があり、人工知能技術とアプリケーションの新たな基盤になりつつあります。百度は2019年以来、事前トレーニングモデルの研究開発に力を入れており、知識を強化したWenxinシリーズのモデルを次々とリリースしてきました。先日終了したWAVE SUMMIT 2022ディープラーニング開発者サミットで、文心ビッグモデルは一連のアップグレードを発表しました。学習タスク知識を統合する知識強化型兆ドルビッグモデル、マルチタスク統合学習用ビジュアルビッグモデル、クロスモーダルビッグモデル、バイオコンピューティングビッグモデル、業界ビッグモデルなど、10の新しいビッグモデルがリリースされました。また、ビッグモデル業界の実装をサポートするために、シナリオ要件にさらに適応したビッグモデルシステムの構築、プロセス全体を通じてアプリケーションの実装をサポートするツール、プラットフォーム、および方法の提供、イノベーションを刺激するオープンエコシステムの構築という3つの主要な道筋が提案されました。

文心ビッグモデルは、知能創造への応用に加え、工業、エネルギー、教育、金融、通信、メディアなどの業界にも応用されています。例えば、工業分野では部品の品質検査、エネルギー分野では送電線検査、金融業界では契約情報抽出などに利用されており、企業のコスト削減、効率向上、イノベーションの促進に真に役立ちます。同時に、Wenxin モデルは、インテリジェント検索、情報フロー、スマートスピーカーなどのインターネット製品にも全面的に適用され、ユーザーが情報、知識、サービスを取得する際の効率と効果を向上させます。

現在、PaddlePaddleは業界で最も包括的な、産業応用に最適なモデルライブラリシステムを構築しており、人工知能の「インフラストラクチャ」の一部として、ビッグモデルは人工知能技術の実装シナリオのカバレッジをさらに広げ、産業応用の深さを深めています。文心モデルは、引き続き応用の敷居を下げ、業界のインテリジェント化を促進し、人工知能技術がすべての人に利益をもたらすことを可能にします。

<<: AIとローコード/ノーコードのすべきこと、すべきでないこと

>>: 四足歩行ロボットが二足歩行で階段を降りることを学びます。脚型システムより83%効率が高い