Cloudera Greater Chinaのテクニカルディレクター、Liu Lifang氏:より正確なAIにはより正確なデータが必要

Cloudera Greater Chinaのテクニカルディレクター、Liu Lifang氏:より正確なAIにはより正確なデータが必要

アプリケーションの可観測性と AI の信頼、リスク、セキュリティ管理は、ガートナーが 2023 年に発表した戦略的テクノロジー トレンドのトップ 10 に含まれています。 「データによって今日不可能なことが明日可能になる」と信じている Cloudera は、この 2 つのトレンドにおいて独自の優位性を持っているようです。

最近、Cloudera Greater China のテクニカル ディレクターである Liu Lifang が、Cloudera の新しい既製の大規模言語モデル (LLM) ブループリントと、CDP 展開を監視および最適化するための新しいサービスである Cloudera Observability を 51CTO やその他のメディアで紹介しました。

CML: AIを信頼するには、まずデータを信頼することから始まる

「これは Cloudera にとって非常に良い機会です。」

AI時代について語る劉立芳氏は、Clouderaプラットフォームで管理されるデータは2500万TBを超えており、これはハイパースケールサービスプロバイダーのデータ量に匹敵すると述べた。以前、Cloudera Greater Chinaの副社長であるWang Gang氏は次のように述べました。「生成AIと大規模言語モデルの有効性は、受け取るトレーニングデータに依存し、適切なコンテキストが必要です。これらのモデルとAIが成功するには、信頼される必要がありますが、AIを信頼することは、データを信頼することから始まります。」

今年初めから、多くのパートナーや顧客が、会話型ロボットや機械学習、ディープラーニングなどのテクノロジーを自社のシステムに組み込みたいと考え、Cloudera に支援を求めてきました。

ChatGPT は非常に人気があり、誰もがそれを使用していますが、なぜ企業はパブリック クラウド上のモデルを直接使用するのではなく、パートナーと話し合う必要があるのでしょうか。 Liu Lifang 氏は、企業は適切なコンテキストで独自のデータに基づいたインタラクティブなエクスペリエンスを構築し、外部のサービスとデータを共有しない必要があると説明しました。 Cloudera プラットフォームでは、すべての顧客にとって最も重要で価値のあるデータは常に顧客の手元にあります。これが、Cloudera が顧客の AI 構築に深く関与できる重要な理由の 1 つです。

企業にとって、データの関連性と正確性も重要です。会話型ロボットが起こすエラーは、仕事や生産性に大きな影響を与えます。 「ChatGPTには、知識ベースにトレーニングの答えがない場合、答えをでっち上げるという戦略があります。この現象はAI幻覚と呼ばれています。」劉立芳氏は、今日のAIは映画で見るほど魔法のようなものではないと述べた。AIがより正確な答えを出すためには、データの品質を確保する必要がある。

Cloudera は過去 2 年間、データ ウィービングに基づいて顧客がデータ ガバナンスと制御を実現できるよう支援する機能に重点を置いてきました。しかし、将来的には、Cloudera は AI プラットフォームへと変革します。

劉立芳氏は、ClouderaのAIプラットフォームCML(CDP機械学習)は3つの重要な部分で構成されていると紹介した。1つはCDP基本データ、つまり顧客トレーニングデータの基本データであり、顧客の将来の分析システムにデータサポートを提供する。2つ目はデータの処理、抽出、変換である。Clouderaのデータ処理プロセスはもともとビッグデータ処理に使用されており、AIでもデータ処理が必要である。3つ目は大規模な言語モデルを埋め込み、そのモデルに基づいてAIアプリケーションを構築および展開することです。

「Cloudera AI プラットフォームは、実際のビッグデータ モデルに基づいて、コンプライアンスに準拠した方法で信頼できる結果を生成する機能を提供すると思います。」

可観測性: ハイブリッドクラウドのコストの最適化

ハイブリッドクラウドやマルチクラウドを選択する企業が増えるにつれ、さまざまな部門やコストセンターにわたるインフラストラクチャとサービスの支出を完全に把握して管理することがますます困難になっています。

Liu Lifang 氏は、ハイブリッド クラウドの導入管理における課題は主に 3 つの側面にあると紹介しました。1 つ目は、プラットフォームの制御性と安定性です。コンテナ、スケジューラ、サービスなどで構成される複雑なシステムは、運用および保守担当者に高い知識を要求します。2 つ目は、リソースの管理と制御です。リソースの消費と効率の可視性が限られているため、無駄や過剰支出につながります。3 つ目は、サポートの強さと経験です。サポート担当者は頻繁に行き来する必要があり、トラブルシューティング プロセスも面倒です。

Cloudera Observability はこれらの問題を解決します。 Cloudera Observability は今年 6 月、パブリックまたはプライベート クラウド環境で Cloudera Data Platform (CDP) を使用しているすべての顧客に公開すると発表しました。ハイブリッド データ ソリューションにおけるCloudera の経験を基に構築されたこのソリューションにより、顧客はCDP の展開を監視、理解、最適化できるようになります。顧客は、カスタマイズ可能な自動化と事前構築されたアクションを通じて、アラートを発し、問題を積極的に回避し、ワークロードを最適化することもできます。

ワークロードのチューニングに重点を置いた Cloudera の以前の製品である Workload Management と比較すると、Cloudera Observability はハイブリッド クラウド環境においてより包括的な機能を備えています。 Liu Lifang 氏は、Observability によって、財務ガバナンス、プロアクティブなシステム監視、サービス健全性監視、ワークロード最適化、セルフサービス分析、問題解決の迅速化などの機能が実現されると紹介しました。

Cloudera Observability は、CDP の全機能をコスト効率よく利用できるようにすることで、エンタープライズ ユーザー エクスペリエンスを向上させます。これは、さまざまなハイブリッド クラウドやマルチクラウド環境で大規模な言語モデルやその他の AI プロジェクトに基礎データを提供するためにデータ管理を改善している企業にとって、ますます重要になっています。

さらに、Liu Lifang 氏は Cloudera Observability の利点について言及し、既存の対象顧客のプラットフォーム上で Cloudera が実施したデータ分析のデモンストレーションも行いました。 Observability を導入した後、クラスターの使用率が 30% 以上増加し、インフラストラクチャへの投資収益率が向上しました。SLA と SLO のコンプライアンスが 43% 向上し、収益が直接増加しました。RCA とトラブルシューティングの速度が 50 倍向上し、運用コストが削減されました。

現在、Cloudera Observability はパブリック クラウド上で SaaS バージョンのみをリリースしており、展開をサポートするにはインターネット接続も必要です。しかし、劉立芳氏は、一部の業界の厳しい規制とデータの機密性を考慮して、Clouderaはまもなくローカル展開バージョンをリリースすることを明らかにした。

<<:  ロボット工学と自動化の台頭:スマートホームセキュリティの変革

>>:  「1 枚の画像から 3D メッシュを再構築」により、遅延がなくなり、30 分から 45 秒にスピードアップしました。浙江大学、カリフォルニア大学などが共同でOne-2-3-45をリリース:オンラインデモを試用可能

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

再帰アルゴリズムにおけるリンクリスト操作

今日は、問題をさらに一歩進めて、再帰プロセスに対応する操作を追加する予定です。 (免責事項: 以下の...

教師あり学習、教師なし学習、強化学習とは何ですか?ついに誰かが明らかにした

[[337832]] 01 用語このセクションでは、機械学習の概要とその 3 つの分類 (教師あり学...

...

アルトマン:解雇されて戻ってくるのは辛かったが、OpenAIにとっては良いことだ

1月8日、OpenAIのCEOサム・アルトマン氏は、タイム誌編集長とのインタビューで、昨年末に同社と...

10億枚の画像で訓練されたFacebookの新しいAIモデルは、コンピュータービジョンに革命を起こす可能性がある

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

2021 年に注目すべき最新テクノロジー トレンド トップ 10

世界中で大きなデジタル革命が起こっています。技術の進歩により、イノベーション、俊敏性、市場開発が加速...

Googleの新しいアルゴリズムのおかげで、ロボットが歩くことを学習するのに平均3.5時間しかかからない。

[[317667]]写真: 中空の玄関マットの上で動くレインボーダッシュこの記事はLeiphone...

...

人工知能の舞台裏:マイクロソフトとOpenAIのスーパーコンピューターはアイオワ州で大量の水を消費している

9月10日、マイクロソフトとOpenAIが共同開発した人工知能システム「ChatGPT」のトレーニ...

銀行は人工知能を導入し、スマートな顧客サービス以上のものを提供している

[[433578]]最近、ある有名なメディア関係者が銀行からカスタマーサービスに電話を受け、しばらく...

...

人工知能によりデータの痕跡を監視できるようになりました。このとき、ユーザーのプライバシーとセキュリティをどのように維持できるのでしょうか?

近年、ソーシャル ネットワーキング プラットフォームのユーザー数は飛躍的に増加しています。これらのプ...