イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

[51CTO.com からのオリジナル記事] 今日の情報化社会には、さまざまな情報リソースが溢れています。さまざまな情報リソースをいかに効果的に管理し、活用するかは、科学研究や意思決定管理の前提条件です。データ処理は、管理情報システムの不可欠な中核部分です。手動管理段階からファイルシステム段階、そして現在のデータベースシステム段階に至るまで、データ処理はここ数十年で質的な飛躍を遂げてきました。

欧州科技のCEOである張磊氏は、最近51CTOとの独占インタビューで、新世代のデータベースはAI脳レベルに対応し、人工知能の応用シナリオにより適したものになるはずだと語った。そこで、欧州科技はこのチャンスを捉え、HAWQをベースとした第4世代データウェアハウスの開発に着手し、エンジェルラウンドとRedpointとSequoiaが主導するAラウンドの2回の資金調達を獲得しました。

データベースの進化

新しい世代のデータベースについて話す前に、まずデータベースの進化について見てみましょう。データベースシステムの研究開発から現在に至るまで、数十年を経てきました。共有ストレージデータベースの第 1 世代から、MPP データベースの第 2 世代、ストレージとコンピューティングを分離したアーキテクチャを持つデータベースの第 3 世代まで、3 つの進化を遂げてきました。

共有ストレージデータベース: リソースを節約し、開発者のコストを削減するために、共有ストレージデータベースが登場しました。データはハイエンドの共有ストレージに保存されます。従来の Oracle データベースやその他の共有ストレージデータベースも、最も古いトランザクションデータベースです。このタイプのデータベースでは、ノードの数が多いとストレージがボトルネックになります。

MPP データベースは現在、Teradata や Vertica を含む多数の企業で使用されています。オペレーティングシステムやファイルシステムなどの基盤となるインフラストラクチャがあまり成熟していないため、Teradata は独自のハードウェアを使用し、ハードウェアとソフトウェアが統合されたマシンに重点を置き、大量のオペレーティングシステムとファイルシステムコードを変更してきました。 2000 年頃には、Vertica、Greenplum など、x86 アーキテクチャに基づく MPP データベースが登場しました。これらの x86 ベースの MPP データベースは通常のサーバーを使用し、独自のハードウェアサポートはありません。ソフトウェアアーキテクチャは Teradata に似ています。

ストレージとコンピューティングが分離されたアーキテクチャを持つデータベース。このタイプのデータベースの代表的なものとしては、HAWQ や Hive などがあります。第 3 世代データウェアハウスの利点は優れたスケーラビリティですが、Hive などのほとんどのエンジンはパフォーマンスが低く、互換性も低いため、顧客が使用するのは困難です。

人工知能シナリオにおける HAWQ に基づく新世代の分析データベース

チャン・レイ氏は、1990年代頃のデータ処理はデータの保存と管理に限定されず、ユーザーが必要とするさまざまなデータ処理方法に重点が置かれるようになったと述べた。分析データベースは、分析アプリケーション用のデータベースです。オンライン統計、オンライン分析、ランダムクエリなどのタスクを実行して、情報データの価値を調査できます。大量のデータの処理には一定の利点があります。しかし、人工知能のシナリオでは、ほとんどの分析データベースがまだ苦戦しており、反復的なイノベーションが差し迫っています。 Oushu Technology が開発した HAWQ ベースの Oushu データベースは、人工知能向けの大量データ処理において独自の利点を備えています。

新世代の分析データベースは、さまざまな分野のデータ処理のボトルネックを解決します

ビッグデータと人工知能アプリケーションの出現により、新世代のデータベースの膨大なデータ処理および分析機能に対する要件がさらに高まっています。金融、セキュリティ、製造業などの業界では、データベースのパフォーマンスを向上させることが急務となっています。新世代の分析データベースの誕生により、このニーズは解決されました。

セキュリティ分野などの人工知能の応用場面では、新世代のデータベースは、画像認識や顔認識を通じてより深い認知と推論を行うことができます。個人の身元認識や人間の軌跡分析の面では、ビデオ、写真、電子ナンバープレートなどのさまざまな種類のデータを分析、照合して潜在的なつながりを発見し、貴重な情報を抽出し、疑わしい行動に対して早期警告を発し、ケースをリンクして公安部門によるケース検出の効率を向上させることができます。

リアルタイムデータや、企業内のさまざまなレベルにわたるリアルタイム IoT センサーデータなどのその他の実用的なケースでは、新世代のデータベースは Storm などの面倒なソリューションを放棄し、大量のプログラミングや IoT センサーデータに完全に適応できないという問題を解決しました。

さらに、新世代のデータウェアハウスは、グローバル規模の展開のニーズも解決します。現在、あらゆるコアアプリケーションはデータ分析と人工知能と切り離すことはできません。たとえば、従来の銀行の取引システムやクレジットカードの不正防止システムは、データウェアハウス内の2か所に3つのセンター、異なる場所でのマルチアクティブを実現する必要があり、これはPBレベルのデータを管理するデータウェアハウスシステムにとって大きな課題となっています。

次世代分析データベースの応用シナリオ

Chang Lei 氏は、現在のデータベースアプリケーションの需要は大きく変化しており、これはデータベース市場が大きな変化のチャンスを持つことを示していると考えています。これを機に、Oushu TechnologyはOushu DatabaseとLittleBoyという2つのコア製品を発表しました。Oushu DatabaseはApache HAWQをベースにしており、LittleBoyはOushu Databaseとシームレスに統合された人工知能製品です。金融、税務データ、治安、司法データ、電力網データなど、膨大なデータを扱う分野に適用できます。

金融分野では、企業が銀行から融資を受けるという伝統的な業務では、まず銀行が企業に対してデューデリジェンスと審査を行い、その後、審査員による評価を受ける必要があります。これらの審査プロセスは、完全に手作業で行われています。個人向け融資や中小零細企業向け融資の場合、借り手情報は比較的簡単に入手できるため、借り手情報を自動的に審査できます。法人向け業務の場合は、膨大な量のデータが関係するため、銀行はすべての内部データと外部データを一元管理し、内部データを主題ごとに統合し、外部データセットを統合する必要があります。 Oushu Technology は、データの保存、管理、分析、人工知能アルゴリズムモデリングを使用して、顧客がモデルプロセスを簡単に構築し、モデルを管理および起動できるように支援します。以前の複雑なレビュープロセスは不要になり、レビュー時間が大幅に短縮されます。

インタビューの中で、張磊氏は次のように述べた。「Microsoft Accelerator は欧樹科技にとって大きな助けとなっています。一方では、Microsoft Accelerator と欧樹科技は研究開発で協力関係を築き、欧樹科技は自社製品を Microsoft Accelerator の Azure パブリッククラウドに移植しました。他方では、Microsoft Accelerator はさまざまな業界の多くの顧客リソースを紹介し、管理、財務、採用、広報、その他のトレーニングの側面でも欧樹科技に指導を提供しました。」

<<: 機械翻訳の3つのコア技術原則 | AI知識の普及

>>: ブロックチェーン科学: 非対称暗号化、楕円曲線暗号