今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

ERNIE は、Baidu のディープラーニング プラットフォーム PaddlePaddle 上に構築されたセマンティック理解テクノロジーおよびプラットフォームです。高度な事前トレーニング済みモデル、包括的な NLP アルゴリズム セット、エンドツーエンドの開発キット、プラットフォーム サービスを統合し、企業や開発者に NLP カスタマイズおよびアプリケーション機能の完全なセットを提供します。 2020年世界人工知能大会において、百度文鑫(ERNIE)が最高賞であるSAIL賞(スーパーAIリーダー)を受賞しました。

ERNIE は、ビッグデータの事前トレーニングと複数のソースからの豊富な知識の組み合わせを先駆的に開発し、大量のデータから継続的に知識を学習し、機械の意味理解のレベルを新たなレベルに引き上げました中国語モデルを例にとると、ERNIE は現在、1,500 万の百科事典コーパスと単語、エンティティ知識、700 万の人間の会話、3 億の記事の因果構造関係、10 億の検索クエリと結果の対応、2,000 万の言語論理関係知識を学習しています。このモデルは、新しい膨大なデータと知識を継続的にモデル化し、下流のアプリケーション効果を継続的に改善します。 ERNIE は、中国語と英語の 16 のタスクで業界最高のモデルを上回り、さまざまな NLP アプリケーション シナリオに完全に適用できます

現在、EasyDL には最先端の事前トレーニング済みモデル ERNIE2.0 がプリインストールされており、さまざまな古典的な NLP アルゴリズム ネットワークが搭載されており、テキスト分類、短いテキストのマッチング、シーケンスのラベル付けなどの一般的なテキスト処理タスクをサポートしています。

最近、ERNIEはカスタマイズされたマルチラベルテキスト分類、感情分析、テキストエンティティ抽出モデルなど、 3つの新機能を発表しました。同時にデータ管理機能もさらに強化され、NLP分野の開発者のニーズをよりよく満たしています。開発者はBaiduのAI開発プラットフォームEasyDLを通じてこれを利用できます。

EasyDLは、Baidu Brainがエンタープライズ開発者向けに立ち上げたゼロ閾値AI開発プラットフォームです。Baiduが自社開発したディープラーニングプラットフォームPaddlePaddleをベースに、業界の先進的なエンジニアリングサービス技術を組み合わせ、ビジョンと自然言語処理という2つの主要な技術方向をカバーし、ワンストップのインテリジェントラベリング、モデルトレーニング、サービス展開などの全プロセス機能をサポートします。現在、EasyDL は小売、インターネット、生産安全、工業品質検査、教育、医療、運輸など 20 を超える業界で広く使用されており、ユーザー数は 70 万人を超えています。

EasyDL を使用すると、優れたパフォーマンスで 3 つの簡単なステップで NLP タスクの構成とトレーニングを完了できます。

さて、ウェンシンはとても才能豊かなので、上級エンジニアと直接会って、技術原理と実用的なアプリケーションをすぐに習得する機会はありますか?

今週の土曜日、Baidu のシニア R&D エンジニアが上海に飛び、ERNIE テクノロジ分析から実践的な演習まで、企業向けに高精度の NLP モデルをカスタマイズする方法を午前中に説明しました。 (記事末尾のポスターにご登録ください)

まずは、ERNIE が最近リリースした多くの実用的な機能をプレビューして学ぶための技術的なヒントをいくつか見てみましょう。

カスタマイズされたマルチラベルテキスト分類機能を追加

「マルチラベルテキスト分類」とは、1 つのテキストに複数のラベルを同時に付けることです。たとえば、「学習と教育の未来は革命の真っ只中です。生徒は自宅で勉強し、ロボットが教壇に立つでしょう。」などです。対応するラベルは「教育」と「テクノロジー」です。この機能には、メディア シナリオでのニュース コンテンツの自動分類、コンテンツ推奨シナリオでのコンテンツ タグを使用したリコールの向上、自動ラベル付け機能によるナレッジ ドキュメントの多段階分類など、幅広い適用シナリオがあります。

現在、この機能は EasyDL プラットフォームのクラシック バージョンとプロフェッショナル バージョンの両方に追加されています。「プロフェッショナル エディション」のタスク構成プロセス中に、開発者は ERNIE Tiny、ERNIE Large、ERNIE Base という、それぞれに長所がある 3 つの事前トレーニング済みモデルから選択することもできます。

カスタマイズされた感情分析機能を追加

「感情傾向分析」とは、テキストの「肯定的な感情」または「否定的な感情」を判断することを指します。たとえば、「ホテルは素晴らしいロケーションにあり、サービスは思いやりがあり熱心で、次回も必ず来ます」などのユーザーレビューの場合、モデルを展開すると、「肯定的」ラベルと 99% の信頼度を直接取得できます。

この機能は、製品や店舗の口コミ分析、事実に基づくニュースイベントやインターネットトピックの世論分析など、ユーザーのコメント分析や世論分析で最もよく使用されます。自動車、ケータリング、ホテルなどの複数の垂直カテゴリでは、分析精度は 95% 以上に達する可能性があります。

現在、この機能は EasyDL クラシック バージョンでリリースされています。後続のプラットフォームでは、エンティティ レベルと文レベルに基づく感情分類を徐々に追加し、より多くのアプリケーション ニーズに対応できるように努めます。

 テキストデータ管理とデータ注釈機能の包括的なアップグレード

データ管理とデータラベル付けにおいて開発者が直面する問題点を解決するため、EasyDL はより柔軟なデータ形式をサポートし、現在は zip、Excel、TXT の 3 つのファイル形式でのアップロードをサポートしています。オンライン ラベリング機能の提供に加えて、インテリジェント ラベリング機能も提供し、開発者のラベリング コストを大幅に削減します。開発者は、ラベル付けされていないデータを直接アップロードして、この機能を体験できます。

図: インテリジェントテキスト注釈の概略図

10月24日、Baidu AI Fast Track [ PaddlePaddle Open Source Framework Advanced Camp ]オフラインコースが上海駅で「フラッシュ」され、「魔法都市プログラマー」と「上海プログラマー」を上海市徐匯区瑞平路230号Poly Time B1-09-LOFAS集会スペースに招待し、Baiduの上級エンジニアや業界の開発者と集まりました。上海ステーションのコンテンツは、絶対にあなたを空手にすることはありません。開発プロセス全体、展開ツール、高精度のターゲット検出、モデル最適化ソリューションが1つずつ紹介されています。また、「オールラウンド」OCRと金メダル推奨アルゴリズムもあります。一緒にハードコアパーティーをしましょう!

ERNIE の背後にある技術的原理を知りたいですか?

NLP モデル開発の方法とテクニックをさらに早く習得したいですか?

Baidu の上級 R&D スタッフやさまざまな業界の開発者とオフラインで深いコミュニケーションを取りたいですか?

今週の土曜日の午前中上海市徐匯区復興路1199号Aビル5階のBaidu AI Expressway [ EasyDLゼロ閾値モデルトレーニングキャンプ]で、上級R&DエンジニアがNLPの技術的機能を詳しく説明し、現場での実践的な操作と対面式の質疑応答を提供し、3時間でEasyDLのNLPモデル開発の秘密を習得できるようお手伝いします。

下のリンクをクリックして体験してください!

https://paddle.wjx.cn/m/93404058.aspx?udsid=798299

<<:  データセンターの物理的セキュリティに AI を活用する方法

>>:  技術革新により、AI人材が全国各地で活躍できるようになった

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

将来的には配送車両の80%が自動運転技術を使用する

[[251814]]フォード、トヨタ、グーグル、アップルなどの大企業が自動運転車に投資していることは...

生死に関わる問題:病院のICU病棟で人工知能は何ができるのか?

病院の集中治療室 (ICU) では、重病の患者を一日中一連の機器に接続し、いつでもバイタルサインを監...

AI エージェントが GPT-4 と連携して人間のディレクターを排除します。 「サウスパーク」はスタンフォード大学のウエストワールドを模倣して撮影された

AIエージェントがまた衝撃的なニュースをもたらしました。AIエージェントが直接監督に昇進し、「サウス...

...

校内暴力を予防し解決するために、AIは子どもたちのために何ができるでしょうか?

[[228688]]あなたはキャンパスライフに満足していますか?多くの人が「はい」と答えると思いま...

国連は2030年の持続可能な開発目標の達成を支援するために数十台のロボットを採用する予定

ロイター通信によると、7月5日、国連技術機関はスイスで行われた「人類の利益のためのAI」イベントで、...

アイティ族テクニカルクリニック第6回

【51CTO.comオリジナル記事】 [51CTO オリジナル記事、パートナーサイトに転載する場合は...

ロボットと触覚センシング技術の衝突、人間とロボットの触覚センシングを初めて探る記事

触覚は人間が相互作用を調整する主な方法の 1 つです。触覚を通じて知覚される触覚は、人間が物体の大き...

行列のランクと行列式の意味を1つの記事で理解する

工学部の学生として、私たちは行列や行列式などの線形代数の知識を長い間使用してきました。この記事では、...

ソートアルゴリズムのより詳細な概要

ソートアルゴリズム平均時間計算量バブルソート (n2) 選択ソート (n2) 挿入ソート (n2) ...

NeRF と自動運転: 約 10 件の論文の概要!

Neural Radiance Fieldsは2020年に提案されて以来、関連論文が飛躍的に増加し...

Google AI で学ぶ: Google が AI と機械学習の無料オンライン リソースをさらに公開

海外メディアの報道によると、機械学習とAIは現在、テクノロジー業界で最もホットな話題となっている。世...

会話型AIを導入する際に考慮すべき6つの質問

会話型人工知能 (AI) プロジェクトを正常に展開することは、他のデジタル ビジネス プロセスのアッ...

コロナウイルス流行中のIoTの真実と虚構を区別する

モノのインターネットは長い間、インターネットの第2フェーズとして宣伝されてきましたが、現在、コロナウ...

物議を醸すClearview AI:顔認識アプリケーションは民間企業には販売されなくなった

生体認証技術といえば、アメリカの Clearview AI 社を挙げなければなりません。同社は最も包...