MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

データベース市場でMySQLの地位を揺るがすようなデータベースが登場したのは久しぶりのようです。主要なデータベースランキングでMySQLがトップの座を占めているのを見るのは慣れっこです。 MySQL は確かに優れたオープンソース データベースであり、現在最も広く使用されているデータベースです。業界の多くの人々も、未来は MySQL にあると信じていますが、本当にそうでしょうか?

[[214237]]

この問題を探るために、この記事ではSQream Technologies の CEO である Ami Gal 氏を特別に招きました。彼の見解では、 GPU データベースは将来のトレンドです。その理由を見てみましょう。

Ami は、強力な技術的バックグラウンドを持ち、20 年を超えるテクノロジーおよび起業家としての経験を有しています。Magic Software (MGIC) で事業開発担当副社長を務め、高性能で複雑なデータ統合環境における新たな成長エンジンを生み出してきました。彼がこのアイデアを思いついた理由は単純です。GPU は CPU よりもはるかに高速にデータを読み取り、処理することができ、そのパフォーマンスは毎年約 40% (データの増加率に等しい) 向上します。

現時点では、ディープラーニング、仮想現実、自動運転車などのいくつかのコア領域以外でのコンピューティングにおけるグラフィックス プロセッシング ユニット (GPU) の機能は、まだあまり知られていません。実際、ほとんどの人にとって、GPU をグラフィック以外のコンピューティングに使用するという考えも聞いたことがありません。ただし、この考え方は、GPU データベースから始めてすぐに変更できます。

多くの人が、 GPU が CPU よりも優れたコンピューティング リソースであることを知っています。複雑な画像を画面上にレンダリングすることは並列化可能な問題、つまり複数の命令ストリームからの命令を同時に処理できる問題であるとエンジニアやアーキテクトが認識したとき、GPU が CPU の現実的な代替手段として登場しました。

当初の解決策は、より複雑でない数千のコアと、より高速で高帯域幅のコアを備えた新しい処理ユニットを作成することでした。その努力の結果、データの読み取りと処理の両方で CPU をはるかに上回る新しい処理ユニットが誕生しました。 (これで、GPU がデータベースに適している理由がおわかりいただけると思います。結局のところ、GPU はデータの読み取りと処理に優れているのです)

実際、GPU データベースはすでに非常によく発達しています。

2016 年の時点では、データは年間約 40% の割合で増加しており、加速傾向が明確に見られました。 1TBのストレージを搭載したスマートフォンの登場により、企業が処理するデータ規模はPBレベルにまで増大しましたが、CPUは毎年10%~20%の増加にとどまっています。データの増加率はCPUが処理できるデータ量をはるかに上回り、GPUデータベースの誕生を可能にしました。

当初、データベース業界で働く多くの人々は、GPU データベースは単なる一時的な流行であり、ニッチな分野やインメモリ データでの使用にのみ適していると考え、GPU データベースに対して楽観的ではありませんでした。

将来も従来のデータベースが主流になると確信している一方で、新しいテクノロジーの受け入れが常に限られていた政府機関を含む多くの業界で、GPU データベースがひっそりと採用されてきました。米国郵政公社が良い例です。同社のデータベースは、20 万の配達ルートにわたる 1 億 5,400 万件の住所を管理しており、郵便配達員の位置データも含まれています。このデータベースがいかに大きいかは想像がつくでしょう。 GPU データベースを使用すると、郵便局は Web ページの読み込みにかかる時間と同じ時間で、複雑なクエリを迅速に処理できます。

[[214238]]

さらに、 GPU データベースは、金融、通信、小売、セキュリティなどの業界で広く使用されています。

現在 CPU と GPU が処理できる生の FLOPS を見てみましょう。

  • CPU - 200 ギガフロップス - 1 秒あたり 200 億回の浮動小数点演算

  • GPU - 120 テラフロップス - 1 秒あたり 120 兆回の浮動小数点演算

GPU は多数の計算を同時に処理できるため、分割して処理することが可能です。大きな問題は小さな問題に分割され、一つずつ解決されます。一方、CPU ベースのデータベースは、コアの数によって制限され、シリアル化された計算を実行するように最適化されています。この結果、データベースは一度に少数のクエリしか処理できなくなるため、クエリを 1 つずつ順番に実行する必要があります。

将来的には、多くの人が GPU データベースの革新的で強力な機能に気づき始めるでしょう。

GPU データベースには、各 GPU ごとに数千個のコアが含まれています。これにより、データベースは数千のクエリを同時に実行し、起動時により高い帯域幅のメモリを使用できるようになります。

ほとんどのビジネスには投資収益率があります。フル GPU サーバーは高価になる可能性がありますが、従来の CPU サーバーの数十台、あるいは数百台に相当する計算能力を実現できます。

GPU データはどのように実装されますか?

ほとんどの GPU データベースはクラウドで実行され、IBM Bluemix から Amazon AWS に至るまでのさまざまな環境で利用できます。データベースが構築されたら、業界標準のドライバーを使用して標準 SQL でデータをクエリできます。ドライバーには次のものがあります。

  • JDBC と ODBC

  • Python、Jupyter、sklearn など。

  • Rおよびその他の機械学習ライブラリ

ほとんどの GPU データベースは構築が簡単で、高度なスキルを必要とせず、既存のエコシステムと互換性があることがよくあります。データ サイエンス作業の場合、作業負荷を数時間から数分以下に短縮できます。

これらすべてが、GPU データベースの開発にとって非常に説得力のある根拠となり、近い将来に GPU データベースが広く採用されるようになるかもしれません。

<<:  ディープラーニングに加えて、これらの開発の方向性も理解する必要があります

>>:  ディープニューラルネットワークのトレーニングが難しいのはなぜですか?

ブログ    
ブログ    

推薦する

金融業界のデータ管理はどこへ向かうのでしょうか?

近年、インターネット金融の波は伝統的な金融業界に課題をもたらしています。同時に、伝統的な金融企業の情...

ニューラル放射フィールドはポイントベースで、NeRFよりも30倍高速なトレーニング速度と優れたレンダリング品質を備えています。

2020 年はボリューメトリック ニューラル レンダリングが爆発的に普及する年です。たとえば、Ne...

SelfOcc: 純粋な視覚に基づく初の自己教師あり 3D 占有予測 (清華大学)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

AIが侵害後の疲労を防ぐ方法

データ侵害疲労は長年の課題です。最高情報セキュリティ責任者 (CISO) は、絶え間ない問​​題解決...

国産大型モデルの推論能力がGPT-3.5を超えた! OpenAI評価リストの第1層に入る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

[[421266]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

アントチェーン、AI + ブロックチェーン技術でオリジナル作品を共同保護するデジタル著作権サービスプラットフォームの開設を発表

10月22日、アントチェーンはデジタル著作権サービスプラットフォームを社会全体に開放することを正式に...

英国メディアが人工知能の軍事応用とそのリスクを分析

[[440377]]はじめに12月7日、英国のドローン戦争ウェブサイトは、人工知能が各国の軍事部門に...

...

アマゾンのドローン配送部門の主要メンバーが目標未達成で辞任

アマゾンのドローン配送部門プライムエアで安全、飛行運用、規制業務を担当していたショーン・キャシディ氏...

ガートナー:2025年にはベンチャーキャピタル投資の75%がAIを活用する

報道によると、権威ある調査機関ガートナーは本日発表したホワイトペーパーで、投資家による人工知能(AI...

NLP モデルは人間の言語を理解できないのでしょうか? Microsoft AdaTestはエラーの検出効率が5倍向上

自然言語処理 (NLP) モデルは人間の言語を理解できず、テキストを反対の意味として解釈しますが、こ...