音声とテキストの両方における自然言語処理 (NLP) の改善は、主流のテクノロジーの進歩に役立ちます。たとえば、電子メールが自然な人間の発音で読み上げられるときに、ユーザーがスプレッドシートのデータについて質問すると、Excel は関連する質問にグラフやピボット テーブルの形式で自動的に回答します。
NLP がより正確になり、広く使用されるようになると、事前に設定されたトピックでチャットボットを強化するだけでなく、半構造化データや非構造化データを処理できるようになります。ナレッジマイニング機能は、ユーザーがビジネスプロセス、資産、負債に関する洞察を得るのに役立ち、より合理的なワークフローを作成し、よりリアルタイムに企業運営を監視するのに役立ちます。 NLP には、翻訳や言語生成、分類や集約、感情分析、その他の情報抽出、さらには Siri などの仮想アシスタントなど、幅広い用途があります。スペルチェックや電子メールやメッセージへの返信の提案などのシンプルな NLP は、今日すでに広く使用されています。 「NLP は単語を最も基本的な形に分解し、パターン、ルール、単語間のつながりを識別します」と、Apexanalytix のアプリケーションおよび先進技術担当上級副社長である Walt Kristick 氏は説明します。「書き言葉や話し言葉の人間の言語は、コンピューター アルゴリズムによって解析および解釈され、システムが人間の言語を学習して理解できるようになります。テキストや非コンテキスト データ ソースから意味を分析して抽出する NLP の能力を向上させることは、特にヘルスケアやライフ サイエンス分野のユーザーにとっての焦点となっています。」 以下では、NLPの現状とその適用範囲について紹介します。 1. NLPサービスの利点 Python NLTK、Sanford CoreNLP、Apache OpenNLP などのフレームワークに加えて、多くのアルゴリズムを使用して NLP タスクを構築することもできますが、多くの場合、モデルの効率が高くなるほど、その規模が大きくなります。 170 億のパラメータを持つ Microsoft の Turing 自然言語生成モデルは、これまでにリリースされたモデルの中で最大のものです。BERT や GPT-2 でさえ、数十億のパラメータがあります。 企業内にNLPの専門家がいたとしても、自社の状況に応じて適切なモデルをカスタマイズするのは依然として課題です。マイクロソフトの会話型 AI 担当副社長、リリ・チェン氏は次のように警告している。「これらのモデルを使用するだけでは、企業内で起こっている複雑な状況には対応できません。多くの企業にとって、これらの大規模なモデルをホストし、効果的に管理し、適切に稼働させ続けることは非常に困難です。一部の企業はこれを実行する意思がありますが、より多くの顧客がターゲットを絞った方法でカスタマイズし、情報を追加したいと考えていると考えています。」 リーダーが特定のタスクに必要な人材を迅速かつ具体的に募集し始めると、それは変化が始まったことを意味します。これら 3 つのアプローチはすべて、リーダーがより良いニューノーマルを構築するのに役立ちます。 AI の才能を持つ企業でも、プロの開発者やビジネス ユーザーがテクノロジーを活用できるように、Microsoft、Amazon、Google、IBM などのプロバイダーから NLP サービスを購入することがよくあります。 Microsoft の顧客である Telefonica には、社内に AI チームがあります。それでも、Telefonica は Microsoft の Power Platform を使用して、開発の専門知識を持たないビジネス ユーザーが Q&A Maker などのサービスを使用して独自のツールを作成できるようにしています。 「ユーザーが検索や会話形式で質問し、回答を得られるよう、FAQ の PDF 版または Web 版をユーザーに提示することができます」と Cheng 氏は言います。 NLP の主要なアプリケーションの 1 つはチャットボットです。チャットボットは、注文を受けたり、よくある質問に回答したり、ルートの問い合わせをしたり、会議を予約したり、必要に応じて人間と会話したりするのに役立ちます。 Confirmit の製品管理担当シニアディレクター、ポール・クイン氏は、NLP は企業が大量のテキストや音声データから顧客の洞察を得るのに役立つ強力なツールであると述べています。 「組織は通常、コールセンターのアラートから顧客メール、アンケートレビューに至るまで、100TB を超える非構造化データを保有しています」と同氏は述べた。「企業が顧客体験を改善したり、自社ブランドに関する詳細な洞察を得たりしたい場合、NLP を使用して大量のデータをふるいにかけ、必要な洞察を見つけることができます。」 IBMの研究者でAIのチーフアーキテクトであるダクシ・アグラワル氏は、小売業界だけでなく、他の顧客対応業界もNLPの恩恵を受けることができると語った。顧客とやり取りするあらゆる企業は、NLP を使用してやり取りから洞察を得ることができます。 「多くの企業が、社内の従業員や人事部門とのやり取りだけでなく、社外の顧客やパートナーとのやり取りにもこの技術を活用している」とアグラワル氏は言う。 顧客がさまざまな用語を使用して報告する場合に質問をより正確にグループ化するために、キーワード抽出に加えて、文章埋め込みなどの NLP 技術をトピック集約で使用することもできます。これは、傾向にある問題や繰り返し発生する問題を特定するのに役立ちます。 英国の運輸業界の独立監視団体であるトランスポート・フォーカスは、すでにシグノイを利用して、さまざまな鉄道サービスに関する通勤者や乗客の最大の懸念を調査している。たとえば、ビジネス旅行者は混雑した電車に不満を抱いていますが、電車で旅行する人はより便利な駐車スペースや、荷物や自転車のためのより広いスペースを望んでいます。 Microsoft の Power BI ビジネス分析サービスと Salesforce.com の Tableau はどちらも、結果を説明するために独自の言語を生成する NLP 機能を提供します。これらのサービスでは、ユーザーがデータに関する質問を入力した後にグラフや自動分析を提供できます。 2. ビジネスが何を知っているかを理解する NLP は、企業がすでに知っていることを理解するのに役立ちます。 ABBY の契約テキスト分析、Exigent の契約管理ソリューション、Seal の契約検出および分析などの AI を活用した専門ツールは、契約から条件と期限を抽出し、企業が約束した内容を理解するのに役立ちます。 XML の共同発明者である Jean Paoli 氏は、Docugami というスタートアップ企業を設立しました。同社は、構造化されていない文書でもこれを可能にすることを目標に設立されました。 「企業データのわずか 15% がデータベースに保存されています」と Paoli 氏は言います。「私たちはすべて、テキスト、メール、文書でコミュニケーションをとっています。構造化されたデータベースは真実を語ってくれませんが、文書は真実を語ってくれます。商業用不動産のように文書を大量に使用するビジネスの場合、最前線のビジネス ユーザーは平均して 1 週間に 15 件のリース契約書を作成します。月曜日には、マネージャーが質問攻めに合います。『何をしましたか? 期限はいつですか? 駐車場の問題はありますか? 所有権を当社に保持させたいのですか?』文書に署名すると、企業は従う義務があり、残念ながらその情報は書類の海に埋もれてしまうことがよくあります。」 スターバックスが地主に賃貸契約の再交渉を求めたり、レストランが保険契約の内容を理解する必要が生じたりと、今や多くのことが重要になっている。そして、この「隠れたデータ」は月曜日の朝の会議に代わるものとなり、ビジネスの俊敏性を向上させることができます。 「企業が現在ビジネスモデルを見直している中、ビジネス文書の分析に NLP を使用することは特に重要です」とパオリ氏は言う。「企業はあらゆることを再交渉しなければならない可能性があり、義務とリスクを理解する必要があります。」プロフェッショナル サービス企業のアクセンチュアはまさにそれを実行し、NLP を使用して 100 万件を超える契約を分析し、コミットメントと責任を理解しました。 自社に NLP の専門家がいない企業にとって、Docugami の SaaS 製品は良い選択です。30 種類のサンプル ドキュメントが用意されており、ビジネス ドキュメントが保存されているフォルダーから自動的に選択して、30 分以内にドキュメントを作成したビジネス ユーザーにフィードバックを提供します。 Docugami は情報をデータベースに保存し、ブラウザで表示したり、Excel や Tableau と統合したりできるダッシュボードの作成に役立ちます。 3. 会議のメッセージを明確にする 企業内の通話は必要に応じて録音されますが、分析されることはほとんどありません。問題の核心は、会議や会話から有用な情報を抽出することが、大変な手作業であるということです。会議でのスピーチを通じてプロジェクトの進捗状況や期限を知る企業はどれくらいあるでしょうか? 従業員は勤務時間の 30% 以上を会議に費やしていますが、会議で得られる大量の情報は、他のビジネス データのようには収集できません。 PowerPoint スライドや Teams 会議のライブ キャプション、および Azure Streams ブロードキャスト プラットフォームの検索可能なライブ会議の文字起こしにより、手動で記録する必要なく効率的な文字起こしも実現できます。 これらのプラットフォームは、画像認識に加えて、将来的には文字起こしや文書分析も利用して会議の主な内容を要約・抽出し、チームが会議後のフォローアップ作業で参照できるようにします。過去 15 年間、ブリッジウォーター アソシエイツは社内会議をすべて記録し、その記録を全従業員が利用できるようにしてきました。それにもかかわらず、記録の取得が難しいこともあり、それらに目を通した人はほとんどいません。この問題に対処するために、Bridgewater は Otter を使用してこれらの会議コンテンツを抽出し始めました。 音声テキスト変換機能を備えた Azure Cognitive Services API は、まもなく OneDrive にアップロードされた音声ファイルの文字起こしができるようになります。これらの API を使用する文字起こしアプリはすでに作成されていますが、この機能をプラットフォームに直接組み込むことで、より幅広い使用が可能になることは間違いありません。 4. 分析と正確性 ユーザーはタイムライン形式でコンテンツを検索できますが、NLP の最適な使用法は逐語的な書き起こしではありません。 Otter は抽出されたタグを要約として使用し、ユーザーがテキストの内容を理解しやすくします。自動的に作成された文書の要約は、IBM Watson の自然言語理解などのツールの一部になりつつあります。 Otter も開発中ですが、アクセスするにはユーザーが関連するコンテンツを覚えておく必要があります。 NLP は将来的に会議分析機能を追加する予定です。例えば、同じ話題が継続して議論されるのか、締め切りが継続的に延期されるのか、などです。 転写の精度はこれらすべてにおいて生命線であり、精度の測定は極めて複雑です。 NLP システムは現在、多くの分野で人間と同等の精度を備えていますが、まだ開始していない作業を正確に比較できない、統一された測定基準がないなどの欠点が残っています。 「現在、マルチモーダル システムではさまざまな機能が組み合わされていますが、その統合がうまく機能しない場合があります」と Microsoft の研究者は述べています。「たとえば、ユーザーは会話型システムをすばらしいと思うかもしれませんが、音声、言語、視覚、ドキュメントが統合されると、会話型システムは実際にはうまく機能しません。」 録音の品質、背景のノイズ、アクセント、会話の内容はすべて、文字起こしの精度に影響を与える可能性があります。背景が静かで話者が英語を母国語とする人であれば、正確度は 95% を超えます。実際の使用においては、転写はある程度の効果はあるものの、まだ完璧には程遠い。 NLP を使用する前に、ユーザーは許容できるエラー率を明確にする必要があります。さらに、正確に識別されるためには、ユーザーは業界用語、製品名、従業員名、対応する概念や関連語彙も慎重に準備する必要があります。これはどの NLP ツールにも当てはまります。 マイクロソフトの研究者は次のように述べている。「期待しすぎてはいけません。人工知能はすべての問題を解決できるわけではありませんが、自然言語ツールは多くの問題を改善できます。文書からより多くの情報を掘り出すために情報を効果的に整理する方法と、専門家に指導してもらう方法が、今日の企業が直面している最大の問題です。」 |
<<: TikTokの買収者は、コアアルゴリズムの削除を含む4つの買収オプションについて議論している
>>: サポートベクターマシンとニューラルネットワークが出会うとき: SVMとGANの距離の関係
[[388691]]被害の程度を軽減することは地震研究者にとって重要な目標です。破壊的な地震が発生し...
[[220982]]人工知能とロボットはどちらも破壊的であり、人類社会の発展の新たな時代を導くでし...
GenAI は人間に取って代わるのではなく、熟練労働者、つまり GenAI を管理し最大限に活用する...
SOFAJRaftとは何ですか? SOFAJRaft は、 Raftコンセンサス アルゴリズムに基づ...
Covid-19パンデミックの発生に伴い、あらゆる業界の企業が先進技術を活用して、私たちの働き方や生...
LiBai モデル ライブラリは、Hugging Face、Megatron-LM、DeepSpe...
今年初めから現在まで、ToFセンサーはApple、Samsung、GD、AMSなどのセンサー企業やス...
ChatGPTが11月下旬にリリースされて以来、テクノロジー業界の多くの人々は、OpenAIの資金...
AI生成の指示を使用してAlpacaモデルを微調整すると、数学的能力はChatGPTを超える—— M...
[[384924]]今日は、ナレッジ グラフに関する記事を書いています。これは、ナレッジ グラフに...
倉庫業界では、パンデミックによる受注量の増加と労働力不足を考慮して、自動化の取り組みを強化している。...
2020年、突然の公衆衛生事件により、医療用ロボットに大きな注目が集まりました。医療用ロボットは、...