イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

[51CTO.com からのオリジナル記事] 今日の情報化社会には、さまざまな情報リソースが溢れています。さまざまな情報リソースをいかに効果的に管理し、活用するかは、科学研究や意思決定管理の前提条件です。データ処理は、管理情報システムの不可欠な中核部分です。手動管理段階からファイルシステム段階、そして現在のデータベースシステム段階に至るまで、データ処理はここ数十年で質的な飛躍を遂げてきました。

欧州科技のCEOである張磊氏は、最近51CTOとの独占インタビューで、新世代のデータベースはAI脳レベルに対応し、人工知能の応用シナリオにより適したものになるはずだと語った。そこで、欧州科技はこのチャンスを捉え、HAWQをベースとした第4世代データウェアハウスの開発に着手し、エンジェルラウンドとRedpointとSequoiaが主導するAラウンドの2回の資金調達を獲得しました。

データベースの進化

新しい世代のデータベースについて話す前に、まずデータベースの進化について見てみましょう。データベースシステムの研究開発から現在に至るまで、数十年を経てきました。共有ストレージデータベースの第 1 世代から、MPP データベースの第 2 世代、ストレージとコンピューティングを分離したアーキテクチャを持つデータベースの第 3 世代まで、3 つの進化を遂げてきました。

共有ストレージ データベース: リソースを節約し、開発者のコ​​ストを削減するために、共有ストレージ データベースが登場しました。データはハイエンドの共有ストレージに保存されます。従来の Oracle データベースやその他の共有ストレージ データベースも、最も古いトランザクション データベースです。このタイプのデータベースでは、ノードの数が多いとストレージがボトルネックになります。

MPP データベースは現在、Teradata や Vertica を含む多数の企業で使用されています。オペレーティング システムやファイル システムなどの基盤となるインフラストラクチャがあまり成熟していないため、Teradata は独自のハードウェアを使用し、ハードウェアとソフトウェアが統合されたマシンに重点を置き、大量のオペレーティング システムとファイル システム コードを変更してきました。 2000 年頃には、Vertica、Greenplum など、x86 アーキテクチャに基づく MPP データベースが登場しました。これらの x86 ベースの MPP データベースは通常のサーバーを使用し、独自のハードウェア サポートはありません。ソフトウェア アーキテクチャは Teradata に似ています。

ストレージとコンピューティングが分離されたアーキテクチャを持つデータベース。このタイプのデータベースの代表的なものとしては、HAWQ や Hive などがあります。第 3 世代データ ウェアハウスの利点は優れたスケーラビリティですが、Hive などのほとんどのエンジンはパフォーマンスが低く、互換性も低いため、顧客が使用するのは困難です。

人工知能シナリオにおける HAWQ に基づく新世代の分析データベース

チャン・レイ氏は、1990年代頃のデータ処理はデータの保存と管理に限定されず、ユーザーが必要とするさまざまなデータ処理方法に重点が置かれるようになったと述べた。分析データベースは、分析アプリケーション用のデータベースです。オンライン統計、オンライン分析、ランダムクエリなどのタスクを実行して、情報データの価値を調査できます。大量のデータの処理には一定の利点があります。しかし、人工知能のシナリオでは、ほとんどの分析データベースがまだ苦戦しており、反復的なイノベーションが差し迫っています。 Oushu Technology が開発した HAWQ ベースの Oushu データベースは、人工知能向けの大量データ処理において独自の利点を備えています。

新世代の分析データベースは、さまざまな分野のデータ処理のボトルネックを解決します

ビッグデータと人工知能アプリケーションの出現により、新世代のデータベースの膨大なデータ処理および分析機能に対する要件がさらに高まっています。金融、セキュリティ、製造業などの業界では、データベースのパフォーマンスを向上させることが急務となっています。新世代の分析データベースの誕生により、このニーズは解決されました。

セキュリティ分野などの人工知能の応用場面では、新世代のデータベースは、画像認識や顔認識を通じてより深い認知と推論を行うことができます。個人の身元認識や人間の軌跡分析の面では、ビデオ、写真、電子ナンバープレートなどのさまざまな種類のデータを分析、照合して潜在的なつながりを発見し、貴重な情報を抽出し、疑わしい行動に対して早期警告を発し、ケースをリンクして公安部門によるケース検出の効率を向上させることができます。

リアルタイム データや、企業内のさまざまなレベルにわたるリアルタイム IoT センサー データなどのその他の実用的なケースでは、新世代のデータベースは Storm などの面倒なソリューションを放棄し、大量のプログラミングや IoT センサー データに完全に適応できないという問題を解決しました。

さらに、新世代のデータ ウェアハウスは、グローバル規模の展開のニーズも解決します。現在、あらゆるコアアプリケーションはデータ分析と人工知能と切り離すことはできません。たとえば、従来の銀行の取引システムやクレジットカードの不正防止システムは、データウェアハウス内の2か所に3つのセンター、異なる場所でのマルチアクティブを実現する必要があり、これはPBレベルのデータを管理するデータウェアハウスシステムにとって大きな課題となっています。

次世代分析データベースの応用シナリオ

Chang Lei 氏は、現在のデータベース アプリケーションの需要は大きく変化しており、これはデータベース市場が大きな変化のチャンスを持つことを示していると考えています。これを機に、Oushu TechnologyはOushu DatabaseとLittleBoyという2つのコア製品を発表しました。Oushu DatabaseはApache HAWQをベースにしており、LittleBoyはOushu Databaseとシームレスに統合された人工知能製品です。金融、税務データ、治安、司法データ、電力網データなど、膨大なデータを扱う分野に適用できます。

金融分野では、企業が銀行から融資を受けるという伝統的な業務では、まず銀行が企業に対してデューデリジェンスと審査を行い、その後、審査員による評価を受ける必要があります。これらの審査プロセスは、完全に手作業で行われています。個人向け融資や中小零細企業向け融資の場合、借り手情報は比較的簡単に入手できるため、借り手情報を自動的に審査できます。法人向け業務の場合は、膨大な量のデータが関係するため、銀行はすべての内部データと外部データを一元管理し、内部データを主題ごとに統合し、外部データセットを統合する必要があります。 Oushu Technology は、データの保存、管理、分析、人工知能アルゴリズム モデリングを使用して、顧客がモデル プロセスを簡単に構築し、モデルを管理および起動できるように支援します。以前の複雑なレビュー プロセスは不要になり、レビュー時間が大幅に短縮されます。

インタビューの中で、張磊氏は次のように述べた。「Microsoft Accelerator は欧樹科技にとって大きな助けとなっています。一方では、Microsoft Accelerator と欧樹科技は研究開発で協力関係を築き、欧樹科技は自社製品を Microsoft Accelerator の Azure パブリック クラウドに移植しました。他方では、Microsoft Accelerator はさまざまな業界の多くの顧客リソースを紹介し、管理、財務、採用、広報、その他のトレーニングの側面でも欧樹科技に指導を提供しました。」

<<:  機械翻訳の3つのコア技術原則 | AI知識の普及

>>:  ブロックチェーン科学: 非対称暗号化、楕円曲線暗号

ブログ    
ブログ    

推薦する

ディープQ学習ネットワーク: 仮想ゲームから現実世界のアプリケーションへのギャップを埋める

翻訳者 |李睿レビュー | Chonglou人工知能と機械学習は、ヘルスケア、金融、エネルギー、輸送...

...

企業チームのスキルは AI 導入の障壁となるのでしょうか?

人工知能は驚くべきことを実現できますが、いくつかの障害にも直面しています。 2021年に3,500人...

C# データ暗号化を実現する対称暗号化アルゴリズム

以下は、対称暗号化アルゴリズムの C# データ暗号化実装コードです。必要に応じて、さまざまなアルゴリ...

一般開発者もBaidu Brain Industry Application Innovation Challengeに参加して大きな賞金を獲得できる

[51CTO.comからのオリジナル記事] 2018年、人工知能の発展は消費者向け人工知能から企業向...

人工知能とビッグデータは私たちの生活をこのように変えるだろう

現在、知能ロボットが急速に発展していますが、機械を知能化するための鍵は実はビッグデータです。ビッグデ...

...

顔認識を完了するための3行のPythonコード

顔認識パッケージこれは世界で最もシンプルな顔認識ライブラリです。 Python リファレンスまたはコ...

ETHは、画像の超解像と画像の再スケーリングを考慮して、新しい統合フレームワークHCFlowを提案しています。

[[423154]]近年、正規化フローモデルは、画像超解像(画像SR)[SRFlow、ECCV20...

...

CIO 向けガイド: ジェネレーティブ AI の「ハイライト モーメント」を実現する 5 つの方法

あらゆる誇大宣伝と主流の採用率の高さにもかかわらず、生成 AI は生産性のピークに到達する前に、幻滅...

李碩:AIは産業知能の波を促進する

2020年12月29日、2020年産業インターネットイノベーション大会(第4回)が盛大に開幕しました...

NLP タスクに最適な 6 つの Python ライブラリ

この記事では、自然言語処理タスクに最適な 6 つの Python ライブラリを紹介します。初心者でも...

DeepMindがMuJoCoをオープンソース化!メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

「クルミで遊んでいる」骸骨の手を見たことがありますか? この魔法の「手」は、Meta が新たにリリー...

テスラがFSDベータ版のメジャーアップデートをリリース、完全自動運転に近づく

テスラは2020年10月からFSDベータ版を徐々に展開しており、選ばれた自動車所有者のグループでテス...