自然言語理解(NLP)は「人工知能の最高傑作」として知られており、これは言語や知識などの認知面における技術革新がAIのさらなる発展を促進することも意味します。 8月25日、「知識を習得し、言語を理解し、知性を身につける」をテーマにした百度脳言語知識技術サミットが開催された。百度CTOの王海鋒氏が基調講演を行い、百度の言語知識技術の発展の歴史と最新の成果を解説し、技術と産業の発展の動向と展望を産業界、学界、研究界と共有した。百度グループ副社長の呉天氏と百度技術委員会の呉華委員長はそれぞれ、百度の言語知識技術シリーズ製品とデータセットの共同構築計画を発表し、AI技術の大規模応用を全面的に加速するための5つの新製品のリリースを開始した。これは、百度の言語と知識の分野における10年間の技術蓄積と産業実践を体現する壮大なイベントであり、間違いなく広範囲にわたる影響を及ぼすでしょう。
百度 CTO 王海鋒 10年間: 開拓者、耕作者、リーダー 言語と知識技術は、人工知能の認知能力の中核です。 2010年に百度は自然言語処理部門を設立し、常に先進的な技術と産業構造をリードし、革新を続けてきました。過去10年間、中国における自然言語処理の発展の旗印となってきました。 首脳会談で、王海鋒氏は「百度の言語・知識技術の配置と発展において、我々は常に技術発展のトレンドと産業発展のトレンドという2つのトレンドを把握することを重視し、トレンドをリードするよう努めてきた」と振り返った。 百度の言語知識技術の発展の歴史を、研究方法、研究対象、研究方向、産業応用などの面から見ると、そのレイアウトは完全で、絶えず洗練され成熟しており、常に開発動向やアプリケーションのニーズ、そして業界と一致しています。 過去10年間、百度ブレインは言語と知識技術において実りある成果を達成し、国家科学技術進歩賞を含む20以上の賞、30以上の国際競技大会優勝、300以上の学術論文の発表、2,000以上の特許申請を行っています。当社は、技術の進歩と革新を継続的に進めるとともに、革新的な製品を模索し、先進的な技術を開発者やパートナーに輸出して、さまざまな業界のインテリジェンスレベルの向上に努めています。 言語と知識技術の成果の包括的な共有 王海鋒氏は、百度の言語・知識技術における全体的なレイアウトと最新の成果を包括的に共有しました。 まず、ナレッジグラフは機械が世界を理解するための重要な基盤です。Baidu は 50 億以上のエンティティと 5,500 億の事実を含む世界最大のナレッジグラフを作成し、常に進化と更新を続けています。 Baidu Knowledge Graph はさまざまな業界で利用されており、1 日に 400 億回以上呼び出されています。 第二に、知識の統合に基づいて、言語理解能力が継続的に強化されます。 2019年3月、百度はディープラーニングに基づく知識を組み込み、継続的な学習能力を備えた知識強化型意味理解フレームワークERNIEを提唱し、世界権威データセットのGLUEリストでトップに立ち、初めて90ポイントの大台を突破し、リストの新記録を樹立しました。ナレッジグラフと意味表現に基づいて、読解、会話理解、クロスモーダルな深い意味理解などの技術で画期的な進歩が遂げられています。 第三に、言語生成は言語および知識技術の重要な要素です。百度は事前トレーニング技術の成功経験に基づき、単語やフレーズなどの異なる粒度の意味情報を考慮し、生成効果を大幅に向上させるマルチストリームメカニズムに基づく言語生成事前トレーニング技術を提案しました。 Baidu は、グラフ構造の意味表現を通じてテキスト知識を導入し、複数ドキュメントの要約生成も研究しており、これにより単一ドキュメントと複数ドキュメントの両方の要約生成の結果が向上しました。 アプリケーションシステムレベルでは、対話システムと機械翻訳が優れた成果を上げています。 Baiduは、ナレッジグラフ駆動型の対話制御技術と、潜在空間に基づく初の大規模オープンドメイン対話モデルPLATOを提案し、開発者がインテリジェント対話システムを効率的に構築し、大規模なアプリケーションを実現できるように、インテリジェント対話カスタマイズおよびサービスプラットフォームUNITを立ち上げました。 Baidu Translateは200以上の言語をサポートし、毎日1000億文字以上の翻訳リクエストに応答し、40万以上のサードパーティアプリケーションをサポートしています。技術的には、マルチエージェント共同学習、意味単位に基づく同時通訳モデル、希少言語グループ化混合トレーニングアルゴリズムを提案しています。 Baidu Brain は、言語と知識技術の分野で継続的な探求と革新を行っており、業界で目覚ましい成果を上げています。同時に、これらの技術はプラットフォームベースで出力され、数千の業界に力を与え、産業インテリジェンスのレベルを継続的に向上させています。 5つの新製品の発売と2つの主要計画 王海鋒氏は、百度ブレインの言語・知識製品の概要を初めて公開した。百度グループの副社長である呉天氏は、意味理解技術とプラットフォーム「文心」、インテリジェント文書分析プラットフォーム「TextMind」、AI同時通訳会議ソリューションの3つの新製品を相次いで発表した。同時に、インテリジェント作成プラットフォームの3つのシナリオソリューションと、インテリジェント対話カスタマイズおよびサービスプラットフォーム「UNIT」の3つの新しいアップグレードを含む6つのアップグレードも発表した。
百度グループ副社長 ウー・ティエン Wu Tian 氏は、「当社は、言語と知識の技術を一連の技術プラットフォームと製品に統合し、アプリケーションで多くの価値を生み出し、開発者と業界の実務家向けに言語と知識の技術を活用した一連の製品を提供することに尽力してきました」と述べています。 Baidu が立ち上げた意味理解テクノロジーおよびプラットフォームである Wenxin は、ディープラーニング プラットフォーム PaddlePaddle 上に構築されています。意味理解の最先端のコア テクノロジーを基盤とし、優れた事前トレーニング済みモデル、包括的な NLP アルゴリズム セット、エンドツーエンドの開発キットとプラットフォームを統合して、ワンストップの NLP 開発とサービスを提供し、開発者がエンタープライズ レベルの NLP モデルをよりシンプルかつ効率的にカスタマイズできるようにします。 Wenxin は、多数の実際のアプリケーション シナリオによって強化されており、優れた産業グレードの実装機能を備えています。 新しくリリースされたインテリジェント文書分析プラットフォーム TextMind は、OCR と NLP 技術をベースとし、文書分析を中核機能としています。文書の比較と文書のレビューをサポートし、「より多く、より速く、より良く、より安く」という中核的な利点を備え、企業オフィスのインテリジェント化を促進します。 Baidu Brainのインテリジェント作成プラットフォームは、メディアアプリケーションシナリオ向けに再度アップグレードされ、インテリジェントプランニング、インテリジェント編集とコンパイル、インテリジェント校正の3つの新しいメディアシナリオソリューションを発表しました。これにより、メディア専門家がより迅速かつ優れた作成を行うことがさらに可能となり、メディア専門家の「悩みの種」を解決できると言えます。 インテリジェントな会話カスタマイズおよびサービス プラットフォーム UNIT は、よりスマートなタスクベースの会話理解、非常に便利なフォームベースの Q&A、ユニバーサル機能を統合した新しい会話エンジンという 3 つの主要機能をアップグレードしました。 UNIT の新たにアップグレードされた 3 つの機能により、タスクベースのダイアログとインテリジェントな質疑応答のカスタマイズ コストがさらに削減され、一般的なダイアログ機能が統合されてインタラクティブなエクスペリエンスが向上します。 新たにリリースされたAI同時通訳会議ソリューションは、会議のあらゆるシナリオとプロセスをカバーし、ユーザーのための「会議同時通訳の専門家」を育成することを目指しています。 Wu Tian 氏は、コンピューターと携帯電話だけを使用して同時通訳サービスを迅速に設定する方法をその場で実演しました。マウスをクリックしていくつかの単語を入力するだけで、すぐにプロフェッショナルな同時通訳サービスを受けることができます。 データ不足と計算能力の不足は、言語および知識技術の研究開発において常にボトルネックとなってきました。このボトルネックを打破するために、百度は中国コンピューター学会および中国情報処理学会と共同で、データ不足の問題を解決する中国語自然言語処理データ共同構築計画「千眼」を立ち上げた。千眼第一段階は、国内11の大学と企業のデータリソース開発者が共同で構築したもので、オープンドメイン対話や読解など7つの主要タスクと20以上の中国オープンソースデータセットをカバーしています。
百度技術委員会の呉華委員長(中央)、中国中国語情報処理学会副会長兼事務局長の孫楽氏(左)、中国コンピュータ学会自然言語処理委員会の周国東主任(右)が、千語プロジェクトを正式に立ち上げた。 呉華氏はまた、百度言語・知識技術コンピューティングパワー共有計画を立ち上げ、百度AI STUDIOプラットフォームを通じてコンピューティングパワーのサポートを提供し、開発者がコンピューティングパワーの束縛から解放され、技術革新に集中できるようにした。 過去10年間、百度は言語と知識技術の開発において数多くの世界トップクラスの人材を育成し、引き付けてきました。会議で、百度は王海鋒氏を代表とする百度NLP「十年十人」を立ち上げた。彼らは10年間、初心を忘れず、「技術への信念」を貫き、勇敢に技術の頂点に登り、機械が世界をよりよく理解し、人々にさらに役立つように尽力してきた。
王海鋒氏は「我々は、学術界や産業界とより緊密に連携し、言語・知識技術の発展を推進し、人工知能技術の継続的な進歩を促進し、産業のインテリジェント化と社会経済の高品質な発展に貢献することに尽力しています。我々は将来に自信に満ちており、機械が知識を習得し、言語を理解し、知能を身につけることができるよう、研究開発を続け、引き続き画期的な進歩と革新を遂げ、技術と社会の進歩にさらに貢献していきます」と述べた。 |
<<: ドローンは倉庫・物流業界の発展をどのように加速させているのでしょうか?
新型コロナウイルス感染症のパンデミックが新たな課題をもたらしているため、組織はパンデミックによるビジ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ビッグデータと人工知能は、今日最も新しく、最も有用なテクノロジーの 2 つです。人工知能は10年以上...
ロボティック・プロセス・オートメーションは現在、業界全体のデジタル化を推進するデジタル変革の中核とな...
最近、主要プラットフォームのホームページには、生地をこねる、餡を作る、型から外す、焼くまで、月餅を作...
大きな言語モデルの中には世界モデルがあるのでしょうか? LLM には空間感覚がありますか?そして、こ...
[[279415]]この記事のイラストはすべて、AIアートの第一人者であるドイツ人アーティスト、マ...
2021年スタンフォードAIインデックスレポートが正式にリリースされ、過去1年間のAIの全体的な発...
[[349302]]今日、職場での学習は課題に直面しています。高度な分析、人工知能、ロボットが職場...
[[323304]] [51CTO.com クイック翻訳] 疫病の影響により、多くの企業従業員がリモ...