Google Cloud、パンデミック対策のAIモデル構築に向けCOVID-19データセットをリリース

Google Cloud、パンデミック対策のAIモデル構築に向けCOVID-19データセットをリリース

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

3月31日、GoogleはCOVID-19 Public Datasetsと呼ばれるプロジェクトの立ち上げを正式に発表した。このプロジェクトは、流行に関連する公開データのリポジトリをホストし、外部からの自由なアクセスと分析に公開するものである。

[[320452]]

Google 社は、障壁を取り除き、研究者が大きなデータファイルを検索したり持ち運んだりすることなく、重要な情報に迅速かつ簡単にアクセスできるようにすることを目標としていると述べた。

Leifeng.com(公式アカウント:Leifeng.com)は、このいわゆるパブリックデータセットプロジェクトのデータには、ジョンズホプキンス大学システム科学工学センター(JHU CSSE)のデータセット、世界銀行のグローバルヘルスデータ、OpenStreetMapデータが含まれており、これらはすべてGoogle Cloudに無料で保存されることを知りました。また、Googleはこれらのデータセットの背後にある組織に事前に連絡を取ると述べました。

Google の取り決めにより、これらのデータセットには「COVID-19」のラベル、説明、いくつかのサンプルクエリが付属し、Google Cloud Console Marketplace と BigQuery ユーザー インターフェースから検索できます。BigQuery では「freebqcovid」というラベルが付けられます。

研究者は Google の BigQuery ML サービスを利用できることも特筆に値します。このサービスにより、ユーザーは SQL クエリを使用して BigQuery (完全に管理されたデータ ウェアハウス) で機械学習モデルを作成および実行し、COVID-19 データセットで機械学習モデルをトレーニングできます。

このプロジェクトの公開性に基づき、ユーザーは完全に無料でクエリを実行でき、無料クエリ ポリシーは 9 月 15 日まで継続されます。しかし、Google は、データセットが COVID-19 以外のデータセットと結合された場合、処理されたバイト数は BigQuery Sandbox にカウントされ、1 か月あたり 10 GB のストレージと 1 TB のクエリ制限があり、不正使用を防ぐために 1 人当たりの料金が請求されると指摘しています。

Google BigQuery プロダクト マネージャー兼 GIS リーダーの Chad W. Jennings 氏と、開発者アドボケートの Shane Glass 氏は、ブログ投稿で次のように述べています。

これらのデータセットの内容は、教育および研究目的に限って一般に公開されており、Google Cloud チームは、COVID-19 公開データセット プロジェクトによって、病気の蔓延を阻止するためのより優れた、より迅速な研究が可能になることを心から願っています。

Leifeng.comは、COVID-19公開データセットプロジェクトに加えて、Googleが新型コロナウイルスと戦うために他の多くの取り組みも行っていることを知りました。

たとえば、Google はウイルスと闘う組織に 8 億ドルの広告費と融資を寄付し、コロナウイルスのヒントを提供する Google アシスタントのショートカットを追加し、Microsoft および Palantir と提携して英国の国民保健サービス向けの情報配信デスクを構築しました。

さらに、グーグルはCOVID-19に関するリソースを整理するための専用ページと検索ポータルを立ち上げており、このテクノロジー大手の親会社であるアルファベットもベイエリアでの病気検査プログラムを強化している。

<<:  中国の独立知的財産TianyuanディープラーニングエンジンとTensorFlowおよびPyTorchの比較を体験

>>:  ハイテク:米国は1キロメートル以内のターゲット認識を実現する長距離顔認識システムを開発

ブログ    
ブログ    
ブログ    

推薦する

AI ビデオ カットアウトの威力: 映画レベルの効果を実現するのに「グリーン スクリーン」は不要

今朝早く、ネットユーザーが私に人気の AI プロジェクトを勧めてくれました。世界中を旅して、アンジェ...

AIはITに顧客体験の向上における優位性を与える

パンデミックにより、IT 部門がデジタル顧客体験を向上させる必要性がさらに高まりました。 IT リー...

最新のAIはプログラマーを失業させるでしょうか?

現在、AI は追加のトレーニングを必要とせずに、任意の言語でコーディングできます。 [[334827...

トランスワープテクノロジーの孫元浩氏が「中国の人工知能起業家30人」の一人に選出

2020 年は特別な年であり、World Innovators Meet (WIM) の 6 年目と...

RNNに注目メカニズムを導入し、5つの主要分野におけるシーケンス予測問題を解決する

[[198915]]エンコーダー/デコーダー アーキテクチャは、多くの分野で最先端のパフォーマンスを...

Python の高度なアルゴリズムとデータ構造: treap を使用してデュアル インデックスを実装する (パート 1)

\上記で紹介したヒープ構造では、データを部分的にしかソートできません。つまり、一部の要素のソートし...

30年以上前の主張が覆された?大規模モデルは人間レベルのシステム一般化能力を持つ

人間には「類推による学習」能力があることがわかっています。つまり、新しい概念を学習した後、すぐにそれ...

...

データは今日のビジネスに競争上の優位性をもたらすことができるのでしょうか?

データは今やさまざまな産業に統合され、世界市場のハイライトとなっています。現在の経済成長はデータと切...

...

ソフトウェア開発者ガイド: 独自のデータで ChatGPT をトレーニングする

翻訳者 | 李睿レビュー | Chonglou制作:51CTO テクノロジースタック(WeChat ...

画像解析アプリケーション向けの大規模サンプルフィルタリングソリューション

画像解析アプリケーションでは、大量の画像サンプルを効果的かつ自動的にフィルタリングすることが重要な基...

この記事では、ロボットが視覚を通じてターゲット追跡を実現する方法を説明します。

概要: 視覚追跡技術は、コンピュータービジョン(人工知能の一分野)の分野における重要なトピックであり...

...

Caffeでのディープラーニングトレーニングの全プロセス

[[189573]]今日の目標は、Caffe を使用してディープラーニング トレーニングの全プロセス...