言語は機械と人間をつなぐ重要な経路であり、機械が現実世界を深く理解するためには知識が必要です。 8月31日、2019年世界人工知能大会開発者デーが上海で開催されました。大会には、百度のAI技術プラットフォームシステムの執行役員である呉天氏が招待され、AI産業化における百度の言語知識技術の新たな進歩と突破口を明らかにしました。 呉天氏は「自然言語理解は人工知能分野で最も難しい問題の一つだ。業界の開発者が技術的な課題に直面する際、実際の場面における問題の蓄積と総括に注意を払い、ニーズに応じて技術を継続的に改善し、イノベーションで未来に対応していく必要がある」と述べた。 業界のニーズに的確に応える言語・知識技術プラットフォームの構築 呉天氏はスピーチの冒頭で、百度AI同時通訳と百度地図音声対話の実例を来場者に披露し、1964年に出版された『機械翻訳入門』で描かれた未来が実現したと述べた。壇上の講演者がどの国の人であっても、聴衆はヘッドフォンを通じてその国の言語を聞くことができる。百度が言語と知識技術分野にもたらした驚きは、これらをはるかに超えています。現在、百度の言語と知識技術は、インテリジェント検索、詳細な質疑応答、対話システム、インテリジェントライティング、機械翻訳など、さまざまなシーンに展開されており、ユーザーは日常の使用で言語と知識技術がもたらす利便性を実感できます。 現在、業界の開発者はもはや単一点の技術を必要としておらず、優れた応用効果、効率的な研究開発効率、柔軟なサービス展開、および対応するシナリオでAI技術を実装するための効果的なパスを必要としています。これは、Baidu Brainの言語および知識技術プラットフォームを公開した当初の意図と一致しています。このため、Baidu Brainの言語・知識技術オープンプラットフォームは、技術利用の敷居を継続的に下げ、PaddlePaddleを基盤技術サポートとするプラットフォームを構築し、言語・知識基礎技術層、応用レベルプラットフォーム層、サービス方式、シナリオソリューションなどを含み、第一線の業界開発者が「便利な」AIツールを使用して、関連技術を応用シナリオに迅速に展開できるようにしています。 Baidu はテクノロジーの「先駆者」となり、言語と知識のテクノロジーを実装プロセス全体に統合します。 言語・知識技術は、機械が人間の意図を理解するための最も重要な技術の一つであり、国内外のテクノロジー大手の戦場となっている。 Baidu は長年にわたり言語と知識技術に深く関わっており、バベルの塔のより高いレベルに立っていると言えます。 2019年、百度は継続学習セマンティック理解フレームワークERNIE 2.0をリリースし、継続学習における新たなブレークスルーを達成しました。新しいタスクが導入されるたびに、フレームワークは以前に学習した情報を忘れることなくタスクを学習できます。現在、ERNIE は合計 16 の中国語と英語のタスクで BERT と XLNet を上回り、SOTA の結果を達成しています。 ERNIE 2.0 は学術分野での価値に加え、無視できない産業的価値も持っています。特に現在の国際貿易と技術の文脈において、ERNIE 2.0 に代表される教師なし事前トレーニング済み言語モデルは、産業上非常に重要な位置にあります。 さらに、ERNIE はディープラーニング プラットフォーム PaddlePaddle の基盤サポートも備えています。 GPU マルチレベル マルチカード トレーニングでは、PaddlePaddle に基づいてトレーニングされた ERNIE モデルのマルチマシン加速率が 77% に達し、他の主流の実装よりもはるかに高くなりました。事前トレーニング済みモデルの読み込みに関しては、Paddle の事前トレーニング済みモデル管理および転移学習コンポーネントである PaddleHub を使用すると、産業グレードの事前トレーニング済みモデルをワンクリックで読み込むことができます。 PaddleHub コンポーネントを使用すると、ERNIE セマンティック表現モデルは、1 行のコードで事前トレーニング済みモデルの予測を完了し、10 行のコードで大規模な事前トレーニング済みモデルの転移学習を完了できます。 PaddleNLPは、PaddlePaddle自然言語処理モデルライブラリであり、PaddlePaddleに基づいて構築された産業グレードの中国語NLPオープンソースツールセットです。業界で現在非常に効果的な中国語意味表現モデルと、数百億レベルのビッグデータトレーニングに基づく事前トレーニング済みモデルを備えています。開発プロセスにおけるユーザーの反復作業を大幅に削減し、業界の実践に基づいてより良いアプリケーション効果を得ることができます。 アプリケーションレベルのプラットフォームに関しては、Wu Tian 氏は UNIT (Understanding and Interaction Technology) プラットフォームを例に挙げ、そのようなプラットフォームのインテリジェンスと利便性を分析しました。インテリジェントな顧客サービスやインテリジェントな運転などのシナリオでは、人間とコンピューターの対話の流暢さと正確さに厳しい課題が課せられます。UNIT プラットフォームは、対話システム向けにカスタマイズされた専門的で低コストのフルリンク技術とサービス プラットフォームの作成に取り組んでおり、金融や教育などの業界にソリューションとサービスを提供しています。 UNITプラットフォームのコア技術には、意味理解、読解、対話管理などが含まれます。その中でも、ERNIE SLUは、同じ理解精度で注釈の量を37%から72%削減できます。DataKitは、データ生成効率を8倍に高めることができます。意味理解SLUカスタマイズを使用すると、対話スキルの総合的な研究開発コストを60%削減できます。現在、UNITプラットフォームは68,000のカスタマイズスキルを実現し、累計インタラクション数は570億回に達し、インテリジェントカスタマーサービス、インテリジェントトラベル、インテリジェントオフィスなどのインテリジェントインタラクションシナリオを包括的にカバーし、最前線の開発者がAIの産業化を実現するための強力なツールを提供しています。 言語・知識技術の「次の50年」を見据えてイノベーションを継続 「50年以上前になされた予言は現実になったが、それは技術の飛躍と革新によるものだ」とウー・ティエン氏は信じている。30以上の技術ツール、多様で柔軟かつカスタマイズ可能なサービス方法、包括的な先進技術とより高い効率を備えた言語と知識技術のオープンプラットフォームとして、Baiduは革新的なAI機能をアプリケーションの最前線に継続的に提供し、真の飛躍的革新、オープンソースとオープン性、そして未来への賢明な先見性を実現すべきだ。 革新とオープン性を堅持することは、言語および知識技術分野における百度の長期的な開発目標です。近年、百度はこの分野でも継続的に技術革新を達成し、開発者や関連分野に優れた技術サポートを提供し続け、技術とアプリケーションの統合を深め、より多くのシナリオでのAI技術の実装を促進し、産業インテリジェンスのプロセスを加速してきました。 |
<<: TensorFlow と PyTorch: ディープラーニングに最適なフレームワークはどれですか?
>>: ジャック・マーとイーロン・マスクは「愛し合い、憎み合っている」:人間とテクノロジーの競争の勝者は誰か?
Mozilla の調査により、YouTube の推奨アルゴリズムは、ヘイトスピーチ、政治的および科学...
広く認識されている機械学習の形式には、教師あり学習、教師なし学習、半教師あり学習、強化学習の 4 つ...
11月21日、2020年中国5G+産業インターネット会議成果発表会で、国家産業情報セキュリティ開発研...
サムスンの待望のスマートヒューマンプロジェクト「Neon」が、ついにCES 2020でデビューしまし...
概要: 顔認識を実現するための 1 行のコード、1. まず、システムに認識させたいすべての人の写真が...
バフェット氏は「正確に間違っているよりも、おおよそ正しい方が良い」と述べています。機械学習では、過剰...
[[401868]]今日のディープラーニングの成功には大量のデータが必要であり、これは不可欠な前提条...
スマートホームはテクノロジーを活用して、居住者にさらなる利便性、節約、快適性、セキュリティを提供しま...
誰もが美を愛しますが、誰もが生まれながらに美しさを持っているわけではないので、さまざまな種類の写真美...