今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

ERNIE は、Baidu のディープラーニング プラットフォーム PaddlePaddle 上に構築されたセマンティック理解テクノロジーおよびプラットフォームです。高度な事前トレーニング済みモデル、包括的な NLP アルゴリズム セット、エンドツーエンドの開発キット、プラットフォーム サービスを統合し、企業や開発者に NLP カスタマイズおよびアプリケーション機能の完全なセットを提供します。 2020年世界人工知能大会において、百度文鑫(ERNIE)が最高賞であるSAIL賞(スーパーAIリーダー)を受賞しました。

ERNIE は、ビッグデータの事前トレーニングと複数のソースからの豊富な知識の組み合わせを先駆的に開発し、大量のデータから継続的に知識を学習し、機械の意味理解のレベルを新たなレベルに引き上げました中国語モデルを例にとると、ERNIE は現在、1,500 万の百科事典コーパスと単語、エンティティ知識、700 万の人間の会話、3 億の記事の因果構造関係、10 億の検索クエリと結果の対応、2,000 万の言語論理関係知識を学習しています。このモデルは、新しい膨大なデータと知識を継続的にモデル化し、下流のアプリケーション効果を継続的に改善します。 ERNIE は、中国語と英語の 16 のタスクで業界最高のモデルを上回り、さまざまな NLP アプリケーション シナリオに完全に適用できます

現在、EasyDL には最先端の事前トレーニング済みモデル ERNIE2.0 がプリインストールされており、さまざまな古典的な NLP アルゴリズム ネットワークが搭載されており、テキスト分類、短いテキストのマッチング、シーケンスのラベル付けなどの一般的なテキスト処理タスクをサポートしています。

最近、ERNIEはカスタマイズされたマルチラベルテキスト分類、感情分析、テキストエンティティ抽出モデルなど、 3つの新機能を発表しました。同時にデータ管理機能もさらに強化され、NLP分野の開発者のニーズをよりよく満たしています。開発者はBaiduのAI開発プラットフォームEasyDLを通じてこれを利用できます。

EasyDLは、Baidu Brainがエンタープライズ開発者向けに立ち上げたゼロ閾値AI開発プラットフォームです。Baiduが自社開発したディープラーニングプラットフォームPaddlePaddleをベースに、業界の先進的なエンジニアリングサービス技術を組み合わせ、ビジョンと自然言語処理という2つの主要な技術方向をカバーし、ワンストップのインテリジェントラベリング、モデルトレーニング、サービス展開などの全プロセス機能をサポートします。現在、EasyDL は小売、インターネット、生産安全、工業品質検査、教育、医療、運輸など 20 を超える業界で広く使用されており、ユーザー数は 70 万人を超えています。

EasyDL を使用すると、優れたパフォーマンスで 3 つの簡単なステップで NLP タスクの構成とトレーニングを完了できます。

さて、ウェンシンはとても才能豊かなので、上級エンジニアと直接会って、技術原理と実用的なアプリケーションをすぐに習得する機会はありますか?

今週の土曜日、Baidu のシニア R&D エンジニアが上海に飛び、ERNIE テクノロジ分析から実践的な演習まで、企業向けに高精度の NLP モデルをカスタマイズする方法を午前中に説明しました。 (記事末尾のポスターにご登録ください)

まずは、ERNIE が最近リリースした多くの実用的な機能をプレビューして学ぶための技術的なヒントをいくつか見てみましょう。

カスタマイズされたマルチラベルテキスト分類機能を追加

「マルチラベルテキスト分類」とは、1 つのテキストに複数のラベルを同時に付けることです。たとえば、「学習と教育の未来は革命の真っ只中です。生徒は自宅で勉強し、ロボットが教壇に立つでしょう。」などです。対応するラベルは「教育」と「テクノロジー」です。この機能には、メディア シナリオでのニュース コンテンツの自動分類、コンテンツ推奨シナリオでのコンテンツ タグを使用したリコールの向上、自動ラベル付け機能によるナレッジ ドキュメントの多段階分類など、幅広い適用シナリオがあります。

現在、この機能は EasyDL プラットフォームのクラシック バージョンとプロフェッショナル バージョンの両方に追加されています。「プロフェッショナル エディション」のタスク構成プロセス中に、開発者は ERNIE Tiny、ERNIE Large、ERNIE Base という、それぞれに長所がある 3 つの事前トレーニング済みモデルから選択することもできます。

カスタマイズされた感情分析機能を追加

「感情傾向分析」とは、テキストの「肯定的な感情」または「否定的な感情」を判断することを指します。たとえば、「ホテルは素晴らしいロケーションにあり、サービスは思いやりがあり熱心で、次回も必ず来ます」などのユーザーレビューの場合、モデルを展開すると、「肯定的」ラベルと 99% の信頼度を直接取得できます。

この機能は、製品や店舗の口コミ分析、事実に基づくニュースイベントやインターネットトピックの世論分析など、ユーザーのコメント分析や世論分析で最もよく使用されます。自動車、ケータリング、ホテルなどの複数の垂直カテゴリでは、分析精度は 95% 以上に達する可能性があります。

現在、この機能は EasyDL クラシック バージョンでリリースされています。後続のプラットフォームでは、エンティティ レベルと文レベルに基づく感情分類を徐々に追加し、より多くのアプリケーション ニーズに対応できるように努めます。

 テキストデータ管理とデータ注釈機能の包括的なアップグレード

データ管理とデータラベル付けにおいて開発者が直面する問題点を解決するため、EasyDL はより柔軟なデータ形式をサポートし、現在は zip、Excel、TXT の 3 つのファイル形式でのアップロードをサポートしています。オンライン ラベリング機能の提供に加えて、インテリジェント ラベリング機能も提供し、開発者のラベリング コストを大幅に削減します。開発者は、ラベル付けされていないデータを直接アップロードして、この機能を体験できます。

図: インテリジェントテキスト注釈の概略図

10月24日、Baidu AI Fast Track [ PaddlePaddle Open Source Framework Advanced Camp ]オフラインコースが上海駅で「フラッシュ」され、「魔法都市プログラマー」と「上海プログラマー」を上海市徐匯区瑞平路230号Poly Time B1-09-LOFAS集会スペースに招待し、Baiduの上級エンジニアや業界の開発者と集まりました。上海ステーションのコンテンツは、絶対にあなたを空手にすることはありません。開発プロセス全体、展開ツール、高精度のターゲット検出、モデル最適化ソリューションが1つずつ紹介されています。また、「オールラウンド」OCRと金メダル推奨アルゴリズムもあります。一緒にハードコアパーティーをしましょう!

ERNIE の背後にある技術的原理を知りたいですか?

NLP モデル開発の方法とテクニックをさらに早く習得したいですか?

Baidu の上級 R&D スタッフやさまざまな業界の開発者とオフラインで深いコミュニケーションを取りたいですか?

今週の土曜日の午前中上海市徐匯区復興路1199号Aビル5階のBaidu AI Expressway [ EasyDLゼロ閾値モデルトレーニングキャンプ]で、上級R&DエンジニアがNLPの技術的機能を詳しく説明し、現場での実践的な操作と対面式の質疑応答を提供し、3時間でEasyDLのNLPモデル開発の秘密を習得できるようお手伝いします。

下のリンクをクリックして体験してください!

https://paddle.wjx.cn/m/93404058.aspx?udsid=798299

<<:  データセンターの物理的セキュリティに AI を活用する方法

>>:  技術革新により、AI人材が全国各地で活躍できるようになった

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

「ディープラーニング」市場の動向を多面的に分析

[[192373]]業界分析2016 年、世界のディープラーニング市場規模は 2 億 2,700 万...

...

...

C# DES アルゴリズムの暗号化と復号化の例の分析

C# DES アルゴリズムの暗号化と復号化は、開発のセキュリティ部分として、その使用方法を理解する必...

Pythonでグラフを描いてニューラルネットワークを理解する

Python 中国語コミュニティ (ID: python-china)人工ニューラル ネットワーク ...

2025年までにロボットが8000万人の労働者に取って代わるのでしょうか?職を失った人はどうすればいいのでしょうか?

同紙によると、世界経済フォーラムがロボット革命に関する報告書を発表し、世界的な警戒を呼び起こした。同...

人工知能時代の未来の教育

未来は、私たちが行く場所であるだけでなく、私たちが創り出す場所でもあるので、単なる時間の概念ではあり...

AIはワールドカップ賭博の「必殺武器」となるが、その精度は「イカ・リュー」ほど高くない

[[234677]]画像出典: Visual China韓国がドイツを2対0で破った後、私の別のグル...

機械学習はインビザラインの患者が完璧な笑顔を手に入れるのを助けている

モバイル コンピューティングのトレンドにより、企業はスマートフォンから情報にアクセスし、タスクを完了...

機械学習とコンピュータービジョンのためのトップ 20 画像データセット

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

国内生産のテスラは、自動運転アルゴリズムとチップを除いてすべて中国製です

みんなで思い出すと「サプライチェーン」が浮かび上がる最近、テスラは中国で国産テスラ車の一部をリコール...

今後10年の予測レポート:高齢化が進み、幼児市場が縮小、AIが様々な製品に浸透

IDCはこのほど、2019年および今後10年間の中国の情報通信分野と技術応用に関するトップ10予測を...

...

ストリームPETRを超えて! BEVNeXt: 高密度 BEV 認識のための新しいフレームワーク

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...