自然言語処理 (NLP) 開発で注目に値するオープン ソース ツールにはどのようなものがありますか?

自然言語処理 (NLP) 開発で注目に値するオープン ソース ツールにはどのようなものがありますか?

インテリジェント音声アシスタントとチャットボットは、現在人工知能のホットスポットであり、画期的な進歩ですが、すべての企業が、NLPアプリケーション、特に最も難しい会話型NLPアプリケーションを開発するためのGoogle、Facebook、Amazon、Appleなどの企業のような経済的、技術的な強みを持っているわけではありません。

幸いなことに、現在の NLP のオープン ソース テクノロジは非常に強力なので、少人数の専門家チームと適切なプラットフォーム アプローチだけで、簡単に「巨人の肩の上に立って」、驚くほど効果的な NLP アプリケーションを開発できます。

[[246706]]

次の表は、調査する価値のある現在のオープンソース ツールの一部を示しています。

第二に、これほど優れたテクノロジーが豊富にあるにもかかわらず、フロントエンドの NLP (AI というとほとんどの人が思い浮かべる「会話型」) を開発するには、依然としてビジョンと粘り強さが必要です。なぜなら、高度な機能の一部で利益を得るには、多額の先行投資が必要になることが多いからです。

バックエンドNLPはより簡単で、より即時のROIをもたらします

NLP ベースのビジネス改善には、必ずしも会話型のフロントエンドは必要ありません。バックエンド主導型または言語分析プロジェクトは、短期的には NLP を使用する最も迅速で、最もコスト効率が高く、最も高い収益が得られる方法であることが多いです。このようなプロジェクトの開発には、多くの場合 2 ~ 3 人のチームのみが必要であり、数か月以内に完了します。

Cloudera の機械学習担当ゼネラルマネージャーである Hilary Mason 氏は、最近の Strata カンファレンスの基調講演で、バックエンド NLP の優れた例を紹介しました。 Mason 氏は、Cloudera が NLP を使用してコールセンターのコストを削減し、顧客満足度を向上させた方法について説明します。彼らはコールセンターから録音された通話の統計サンプルを採取し、それをテキストに書き起こしました。彼らはコーパスのテキスト分析を実施し、特定の問題や問題解決の手順に関連する発話パターンを探しました。次に、この分析に基づいた予測モデルをコールセンター システムに導入しました。顧客が電話をかけると、基盤となるアルゴリズムが音声パターンを認識し、顧客の話に合わせて可能な解決策を顧客サービス担当者に積極的に推奨します。

会話型NLPはより高価であり、戦略的思考と長期投資を必要とする

会話型 NLP (または AI) に取り組む場合、機械と人間のやりとりに人間と同じ流動性と曖昧さを持たせる必要がありますが、これは技術的に非常に困難でコストがかかります。ここで話題にしているのは、特定のタスクのために比較的構造化された会話に従うことができ、Facebook Messenger などの事前定義された環境にある非常にシンプルなプログラムであるチャットボットのことではありません。会話型 AI は Alexa とはまったく異なり、どこにでも存在し (どこにでもある)、複数のアプリケーション (インテントとも呼ばれる) を処理でき、さまざまな応答を処理できます。また、今日の天気に関する情報の提供からレストランの予約まで、コンテキストを素早く切り替えることもできます。

すでにいくつかのオープンソース プラットフォームが存在しています (上記)。これにより、チームは妥当な期間とプラスの利益をもたらすコストで、機能的な (完璧ではないものの) AI を構築できます。 Apple、Google、Microsoft、Amazon などの企業は、毎年数億ドルを投資し、地球上で最も優秀な博士号取得者を高度な NLP インターフェースの開発に投入しています。これらのオープンソースライブラリにより、一般的な企業やチームは、約 50 万ドルの総投資で、3 ~ 4 人のチームで約 1 年かけて、シンプルな会話型 AI の基本プラットフォームを開発できるようになります。これらの初期のプラットフォームには、いくつかの簡単なコンテキスト会話機能がありましたが、事前にユーザーをプロファイリングすることはなく (セキュリティ システムとのインターフェイスが必要)、以前のユーザー セッションの記憶もありませんでした。このプラットフォームを出発点として、新しいシンプルなシナリオ ダイアログを開発するコストは約 10,000 ドルです。

企業は会話型 NLP の基本プラットフォームを長期的な投資と見なす必要があります。新しい会話機能が追加されるたびに、プラットフォーム全体のコストが下がります。たとえば、パスワードの紛失や忘れ、その他の単純な IT の問題をユーザーがセルフサービスで解決できるようにすることで、年間少なくとも 1 人の IT 運用スタッフを節約できます。 Excel の IRR 関数を使用して簡単な計算を行い、役割のコストが年間 10 万ドルであると仮定すると、この「複雑な」アプリケーションの 1 年間の ROI は約 260% となり、明らかに実行する価値があります。コストは会話機能の開発の優先順位を決定する際に考慮する要素の 1 つに過ぎず、明確な ROI や非常に高い ROI がなくても、戦略的に重要な会話機能に投資する必要がある場合もあります。

<<:  李開復氏:若者は人工知能に取って代わられない仕事を探すべきだ

>>:  ビッグデータとAIの未来は1つに集約される

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

「人工知能」の時代が来るのか?将来的には「産業の新たな高地」となると予想され、多くの国がすでに計画を立てている。

[[415258]] 2017年、サウジアラビアの首都リヤドで開催された未来投資イニシアチブ会議に...

ビジネスオートメーション、斗山の市場成功の鍵

ますます激化する競争の中で、どのように効率的に生産するかと問われれば、答えは自動化の助けを借りること...

AI開発は断片化に直面しており、ディープラーニングフレームワークの統一が必要

人工知能の急速な発展の背後には、大手メーカー間の秘密戦争の始まりがあります。誰もが開発者をめぐって競...

スタンフォードグローバルAIレポート:人材需要は2年間で35倍に増加し、中国のロボット導入は500%増加

先ほど、スタンフォード グローバル AI レポートが正式に発表されました。スタンフォード大学は昨年か...

...

通信分野における人工知能:世界の状況を変える

通信市場における AI は、2022 年から 2031 年の間に 41.4% の CAGR で成長し...

ハードウェアとコードを分離し、APIを安定化したPyTorch Lightning 1.0.0が正式リリース

Keras と PyTorch はどちらも初心者にとても優しいディープラーニング フレームワークです...

...

負荷分散アルゴリズムの完全なリスト

負荷分散の開発基盤は負荷分散アルゴリズムです。次に、サーバーごとに持つ機能や必要な機能が異なるため、...

3つの主要な要因の影響を受けて、自動運転トラックの開発は加速し続けています

近年、自動運転は幅広い注目を集め、熱い議論を呼んでいます。自動運転は自動車産業の将来のトレンドである...

人工知能はビッグデータの保存と管理の効率をどのように向上させるのでしょうか?

ビッグデータのソースが多数存在し、企業が利用できるデータの量も増加しているため、ストレージ管理者にと...

AI、ブロックチェーン、IoT、5Gの未来は統合だ

企業は業務を最適化し、現在の誇大宣伝サイクルを活用するために AI の導入に躍起になっています。報告...

CPU、TPU、GPU、DPU、QPUについて学ぶ

AIの人気に伴い、CPU、TPU、GPU、DPU、QPUなどの略語がさまざまなメディアで飛び交ってい...

...

中国の博士が強化学習を使ってSpaceXのロケットを回収

[[435329]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...