今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

ERNIE は、Baidu のディープラーニング プラットフォーム PaddlePaddle 上に構築されたセマンティック理解テクノロジーおよびプラットフォームです。高度な事前トレーニング済みモデル、包括的な NLP アルゴリズム セット、エンドツーエンドの開発キット、プラットフォーム サービスを統合し、企業や開発者に NLP カスタマイズおよびアプリケーション機能の完全なセットを提供します。 2020年世界人工知能大会において、百度文鑫(ERNIE)が最高賞であるSAIL賞(スーパーAIリーダー)を受賞しました。

ERNIE は、ビッグデータの事前トレーニングと複数のソースからの豊富な知識の組み合わせを先駆的に開発し、大量のデータから継続的に知識を学習し、機械の意味理解のレベルを新たなレベルに引き上げました中国語モデルを例にとると、ERNIE は現在、1,500 万の百科事典コーパスと単語、エンティティ知識、700 万の人間の会話、3 億の記事の因果構造関係、10 億の検索クエリと結果の対応、2,000 万の言語論理関係知識を学習しています。このモデルは、新しい膨大なデータと知識を継続的にモデル化し、下流のアプリケーション効果を継続的に改善します。 ERNIE は、中国語と英語の 16 のタスクで業界最高のモデルを上回り、さまざまな NLP アプリケーション シナリオに完全に適用できます

現在、EasyDL には最先端の事前トレーニング済みモデル ERNIE2.0 がプリインストールされており、さまざまな古典的な NLP アルゴリズム ネットワークが搭載されており、テキスト分類、短いテキストのマッチング、シーケンスのラベル付けなどの一般的なテキスト処理タスクをサポートしています。

最近、ERNIEはカスタマイズされたマルチラベルテキスト分類、感情分析、テキストエンティティ抽出モデルなど、 3つの新機能を発表しました。同時にデータ管理機能もさらに強化され、NLP分野の開発者のニーズをよりよく満たしています。開発者はBaiduのAI開発プラットフォームEasyDLを通じてこれを利用できます。

EasyDLは、Baidu Brainがエンタープライズ開発者向けに立ち上げたゼロ閾値AI開発プラットフォームです。Baiduが自社開発したディープラーニングプラットフォームPaddlePaddleをベースに、業界の先進的なエンジニアリングサービス技術を組み合わせ、ビジョンと自然言語処理という2つの主要な技術方向をカバーし、ワンストップのインテリジェントラベリング、モデルトレーニング、サービス展開などの全プロセス機能をサポートします。現在、EasyDL は小売、インターネット、生産安全、工業品質検査、教育、医療、運輸など 20 を超える業界で広く使用されており、ユーザー数は 70 万人を超えています。

EasyDL を使用すると、優れたパフォーマンスで 3 つの簡単なステップで NLP タスクの構成とトレーニングを完了できます。

さて、ウェンシンはとても才能豊かなので、上級エンジニアと直接会って、技術原理と実用的なアプリケーションをすぐに習得する機会はありますか?

今週の土曜日、Baidu のシニア R&D エンジニアが上海に飛び、ERNIE テクノロジ分析から実践的な演習まで、企業向けに高精度の NLP モデルをカスタマイズする方法を午前中に説明しました。 (記事末尾のポスターにご登録ください)

まずは、ERNIE が最近リリースした多くの実用的な機能をプレビューして学ぶための技術的なヒントをいくつか見てみましょう。

カスタマイズされたマルチラベルテキスト分類機能を追加

「マルチラベルテキスト分類」とは、1 つのテキストに複数のラベルを同時に付けることです。たとえば、「学習と教育の未来は革命の真っ只中です。生徒は自宅で勉強し、ロボットが教壇に立つでしょう。」などです。対応するラベルは「教育」と「テクノロジー」です。この機能には、メディア シナリオでのニュース コンテンツの自動分類、コンテンツ推奨シナリオでのコンテンツ タグを使用したリコールの向上、自動ラベル付け機能によるナレッジ ドキュメントの多段階分類など、幅広い適用シナリオがあります。

現在、この機能は EasyDL プラットフォームのクラシック バージョンとプロフェッショナル バージョンの両方に追加されています。「プロフェッショナル エディション」のタスク構成プロセス中に、開発者は ERNIE Tiny、ERNIE Large、ERNIE Base という、それぞれに長所がある 3 つの事前トレーニング済みモデルから選択することもできます。

カスタマイズされた感情分析機能を追加

「感情傾向分析」とは、テキストの「肯定的な感情」または「否定的な感情」を判断することを指します。たとえば、「ホテルは素晴らしいロケーションにあり、サービスは思いやりがあり熱心で、次回も必ず来ます」などのユーザーレビューの場合、モデルを展開すると、「肯定的」ラベルと 99% の信頼度を直接取得できます。

この機能は、製品や店舗の口コミ分析、事実に基づくニュースイベントやインターネットトピックの世論分析など、ユーザーのコメント分析や世論分析で最もよく使用されます。自動車、ケータリング、ホテルなどの複数の垂直カテゴリでは、分析精度は 95% 以上に達する可能性があります。

現在、この機能は EasyDL クラシック バージョンでリリースされています。後続のプラットフォームでは、エンティティ レベルと文レベルに基づく感情分類を徐々に追加し、より多くのアプリケーション ニーズに対応できるように努めます。

 テキストデータ管理とデータ注釈機能の包括的なアップグレード

データ管理とデータラベル付けにおいて開発者が直面する問題点を解決するため、EasyDL はより柔軟なデータ形式をサポートし、現在は zip、Excel、TXT の 3 つのファイル形式でのアップロードをサポートしています。オンライン ラベリング機能の提供に加えて、インテリジェント ラベリング機能も提供し、開発者のラベリング コストを大幅に削減します。開発者は、ラベル付けされていないデータを直接アップロードして、この機能を体験できます。

図: インテリジェントテキスト注釈の概略図

10月24日、Baidu AI Fast Track [ PaddlePaddle Open Source Framework Advanced Camp ]オフラインコースが上海駅で「フラッシュ」され、「魔法都市プログラマー」と「上海プログラマー」を上海市徐匯区瑞平路230号Poly Time B1-09-LOFAS集会スペースに招待し、Baiduの上級エンジニアや業界の開発者と集まりました。上海ステーションのコンテンツは、絶対にあなたを空手にすることはありません。開発プロセス全体、展開ツール、高精度のターゲット検出、モデル最適化ソリューションが1つずつ紹介されています。また、「オールラウンド」OCRと金メダル推奨アルゴリズムもあります。一緒にハードコアパーティーをしましょう!

ERNIE の背後にある技術的原理を知りたいですか?

NLP モデル開発の方法とテクニックをさらに早く習得したいですか?

Baidu の上級 R&D スタッフやさまざまな業界の開発者とオフラインで深いコミュニケーションを取りたいですか?

今週の土曜日の午前中上海市徐匯区復興路1199号Aビル5階のBaidu AI Expressway [ EasyDLゼロ閾値モデルトレーニングキャンプ]で、上級R&DエンジニアがNLPの技術的機能を詳しく説明し、現場での実践的な操作と対面式の質疑応答を提供し、3時間でEasyDLのNLPモデル開発の秘密を習得できるようお手伝いします。

下のリンクをクリックして体験してください!

https://paddle.wjx.cn/m/93404058.aspx?udsid=798299

<<:  データセンターの物理的セキュリティに AI を活用する方法

>>:  技術革新により、AI人材が全国各地で活躍できるようになった

ブログ    

推薦する

自動運転のセキュリティ確保 - 主流のミドルウェア設計について

国内外の新車メーカーの急速な台頭により、自動車の知能レベルは向上し続けています。車両の中央コンピュー...

孤独を研究していますか? Reddit のホットな話題: AI のゴッドファーザー、ヤン・ルカンが提案した「エネルギー モデル」とは一体何でしょうか?

「エネルギー自己教師学習っていったい何?」と多くのRedditネットユーザーがコメントした。ちょう...

GitHub の最も有名な 20 の Python 機械学習プロジェクトは収集する価値があります。

オープンソースは技術革新と急速な発展の中核です。この投稿では、Python 機械学習のオープンソース...

マスク氏はまたも常識に反する発言をしました。自動運転は普及初期段階では渋滞を増加させるでしょう。

自動運転の普及初期には交通渋滞が悪化するだろう。これは、自動運転についてのあなたの理解と異なりますか...

中国チームが超伝導において新たな大きな進歩を遂げました! LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

室温超伝導に新たな進歩はありますか?華南理工大学、中南大学、中国電子科技大学の研究者らは12月19日...

写真を3Dに変換する品質が急上昇! GitHub がショートポジションをオープンしたところ、300 人以上がスターを付けました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

研究者は人工知能を使ってSARS-CoV-2のような次のウイルスを見つける

ジョージタウン大学の科学者が率いる国際研究チームは、COVID-19パンデミックの原因ウイルスである...

...

...

自動車AI市場は2027年までに70億ドルに達する

世界の自動車人工知能市場規模は、2022年の23億米ドルから2027年には70億米ドルに成長すると予...

容量はGPT-2の1.7倍! Google がニューラル会話モデル Meena を開発

Google は、これは「真の」会話型 AI への試みであると述べた。チャットボットは高度に専門化さ...

人工知能とビッグデータの違い

人工知能とビッグデータは人々がよく知っている流行語ですが、混乱が生じることもあります。 AI とビッ...

ディープニューラルネットワークを使用してNER固有表現抽出の問題を解決する

この記事は次のように構成されています。固有表現抽出 (NER) とはどのように識別しますか? cs2...

2022年の展望: 自動化におけるイノベーションと機会

テクノロジーへの関心と導入が多様化するにつれ、多くの企業が将来の進路を決める岐路に立たされています。...

人工知能はプログラムを記述するためにコードを「盗む」ほど賢いが、プログラマーは職を失うことを心配する必要はない

人工知能システムはますます賢くなってきています。囲碁をしたり株を取引したりできるだけでなく、今ではコ...