今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

ERNIE は、Baidu のディープラーニング プラットフォーム PaddlePaddle 上に構築されたセマンティック理解テクノロジーおよびプラットフォームです。高度な事前トレーニング済みモデル、包括的な NLP アルゴリズム セット、エンドツーエンドの開発キット、プラットフォーム サービスを統合し、企業や開発者に NLP カスタマイズおよびアプリケーション機能の完全なセットを提供します。 2020年世界人工知能大会において、百度文鑫(ERNIE)が最高賞であるSAIL賞(スーパーAIリーダー)を受賞しました。

ERNIE は、ビッグデータの事前トレーニングと複数のソースからの豊富な知識の組み合わせを先駆的に開発し、大量のデータから継続的に知識を学習し、機械の意味理解のレベルを新たなレベルに引き上げました中国語モデルを例にとると、ERNIE は現在、1,500 万の百科事典コーパスと単語、エンティティ知識、700 万の人間の会話、3 億の記事の因果構造関係、10 億の検索クエリと結果の対応、2,000 万の言語論理関係知識を学習しています。このモデルは、新しい膨大なデータと知識を継続的にモデル化し、下流のアプリケーション効果を継続的に改善します。 ERNIE は、中国語と英語の 16 のタスクで業界最高のモデルを上回り、さまざまな NLP アプリケーション シナリオに完全に適用できます

現在、EasyDL には最先端の事前トレーニング済みモデル ERNIE2.0 がプリインストールされており、さまざまな古典的な NLP アルゴリズム ネットワークが搭載されており、テキスト分類、短いテキストのマッチング、シーケンスのラベル付けなどの一般的なテキスト処理タスクをサポートしています。

最近、ERNIEはカスタマイズされたマルチラベルテキスト分類、感情分析、テキストエンティティ抽出モデルなど、 3つの新機能を発表しました。同時にデータ管理機能もさらに強化され、NLP分野の開発者のニーズをよりよく満たしています。開発者はBaiduのAI開発プラットフォームEasyDLを通じてこれを利用できます。

EasyDLは、Baidu Brainがエンタープライズ開発者向けに立ち上げたゼロ閾値AI開発プラットフォームです。Baiduが自社開発したディープラーニングプラットフォームPaddlePaddleをベースに、業界の先進的なエンジニアリングサービス技術を組み合わせ、ビジョンと自然言語処理という2つの主要な技術方向をカバーし、ワンストップのインテリジェントラベリング、モデルトレーニング、サービス展開などの全プロセス機能をサポートします。現在、EasyDL は小売、インターネット、生産安全、工業品質検査、教育、医療、運輸など 20 を超える業界で広く使用されており、ユーザー数は 70 万人を超えています。

EasyDL を使用すると、優れたパフォーマンスで 3 つの簡単なステップで NLP タスクの構成とトレーニングを完了できます。

さて、ウェンシンはとても才能豊かなので、上級エンジニアと直接会って、技術原理と実用的なアプリケーションをすぐに習得する機会はありますか?

今週の土曜日、Baidu のシニア R&D エンジニアが上海に飛び、ERNIE テクノロジ分析から実践的な演習まで、企業向けに高精度の NLP モデルをカスタマイズする方法を午前中に説明しました。 (記事末尾のポスターにご登録ください)

まずは、ERNIE が最近リリースした多くの実用的な機能をプレビューして学ぶための技術的なヒントをいくつか見てみましょう。

カスタマイズされたマルチラベルテキスト分類機能を追加

「マルチラベルテキスト分類」とは、1 つのテキストに複数のラベルを同時に付けることです。たとえば、「学習と教育の未来は革命の真っ只中です。生徒は自宅で勉強し、ロボットが教壇に立つでしょう。」などです。対応するラベルは「教育」と「テクノロジー」です。この機能には、メディア シナリオでのニュース コンテンツの自動分類、コンテンツ推奨シナリオでのコンテンツ タグを使用したリコールの向上、自動ラベル付け機能によるナレッジ ドキュメントの多段階分類など、幅広い適用シナリオがあります。

現在、この機能は EasyDL プラットフォームのクラシック バージョンとプロフェッショナル バージョンの両方に追加されています。「プロフェッショナル エディション」のタスク構成プロセス中に、開発者は ERNIE Tiny、ERNIE Large、ERNIE Base という、それぞれに長所がある 3 つの事前トレーニング済みモデルから選択することもできます。

カスタマイズされた感情分析機能を追加

「感情傾向分析」とは、テキストの「肯定的な感情」または「否定的な感情」を判断することを指します。たとえば、「ホテルは素晴らしいロケーションにあり、サービスは思いやりがあり熱心で、次回も必ず来ます」などのユーザーレビューの場合、モデルを展開すると、「肯定的」ラベルと 99% の信頼度を直接取得できます。

この機能は、製品や店舗の口コミ分析、事実に基づくニュースイベントやインターネットトピックの世論分析など、ユーザーのコメント分析や世論分析で最もよく使用されます。自動車、ケータリング、ホテルなどの複数の垂直カテゴリでは、分析精度は 95% 以上に達する可能性があります。

現在、この機能は EasyDL クラシック バージョンでリリースされています。後続のプラットフォームでは、エンティティ レベルと文レベルに基づく感情分類を徐々に追加し、より多くのアプリケーション ニーズに対応できるように努めます。

 テキストデータ管理とデータ注釈機能の包括的なアップグレード

データ管理とデータラベル付けにおいて開発者が直面する問題点を解決するため、EasyDL はより柔軟なデータ形式をサポートし、現在は zip、Excel、TXT の 3 つのファイル形式でのアップロードをサポートしています。オンライン ラベリング機能の提供に加えて、インテリジェント ラベリング機能も提供し、開発者のラベリング コストを大幅に削減します。開発者は、ラベル付けされていないデータを直接アップロードして、この機能を体験できます。

図: インテリジェントテキスト注釈の概略図

10月24日、Baidu AI Fast Track [ PaddlePaddle Open Source Framework Advanced Camp ]オフラインコースが上海駅で「フラッシュ」され、「魔法都市プログラマー」と「上海プログラマー」を上海市徐匯区瑞平路230号Poly Time B1-09-LOFAS集会スペースに招待し、Baiduの上級エンジニアや業界の開発者と集まりました。上海ステーションのコンテンツは、絶対にあなたを空手にすることはありません。開発プロセス全体、展開ツール、高精度のターゲット検出、モデル最適化ソリューションが1つずつ紹介されています。また、「オールラウンド」OCRと金メダル推奨アルゴリズムもあります。一緒にハードコアパーティーをしましょう!

ERNIE の背後にある技術的原理を知りたいですか?

NLP モデル開発の方法とテクニックをさらに早く習得したいですか?

Baidu の上級 R&D スタッフやさまざまな業界の開発者とオフラインで深いコミュニケーションを取りたいですか?

今週の土曜日の午前中上海市徐匯区復興路1199号Aビル5階のBaidu AI Expressway [ EasyDLゼロ閾値モデルトレーニングキャンプ]で、上級R&DエンジニアがNLPの技術的機能を詳しく説明し、現場での実践的な操作と対面式の質疑応答を提供し、3時間でEasyDLのNLPモデル開発の秘密を習得できるようお手伝いします。

下のリンクをクリックして体験してください!

https://paddle.wjx.cn/m/93404058.aspx?udsid=798299

<<:  データセンターの物理的セキュリティに AI を活用する方法

>>:  技術革新により、AI人材が全国各地で活躍できるようになった

ブログ    
ブログ    
ブログ    

推薦する

ディスカッション | 人工知能は同時通訳に取って代わることができるか?

[[254687]]少し前に同時通訳者がiFlytekを「AI同時通訳詐欺」と非難し、ネット上で騒...

モデルデータに偏りがある場合はどうすればいいですか?機械学習における 7 種類のデータバイアスについて 1 つの記事で学ぶ

機械学習におけるデータバイアスとは、データセットの一部の要素が他の要素よりも重み付けされ、または高く...

...

...

...

COVID-19パンデミックの影響を受けて、世界のエッジAIソフトウェア市場は急速な発展を遂げている

MarketsandMarkets は、エッジ AI ソフトウェア市場が 2019 年から 2021...

我が国は人工知能などの主要な技術標準に関する研究を強化します

標準は経済活動や社会の発展を技術的に支えるものであり、人々の生活に深く関わっています。最近、中国共産...

AR は人工知能と見なされますか?この記事を読めば分かるだろう

AR/VR は双子の兄弟として語られることが多く、一般的にはアプリケーション層の新しいテクノロジー、...

...

...

...

人工知能とセキュリティ:繋がる双子

何十年もの間、セキュリティは重要であると考えられてきましたが、いわゆる「コアビジネス」機能に関与した...

2021年に理解すべき5つのAIコンセプト

人間の知能は、生物学を模倣することで模倣されるべきでしょうか? それとも、鳥類の生物学が航空宇宙工学...