Amazon Rekognition の紹介

Amazon Rekognition の紹介

Amazon Rekognition を使用すると、アプリケーションに画像およびビデオ分析機能を簡単に追加できます。 Rekognition API に画像またはビデオを提供するだけで、サービスがオブジェクト、人物、テキスト、シーン、アクティビティを識別し、不適切なコンテンツを検出します。 Amazon Rekognition は、画像やビデオに対して非常に正確な顔分析と顔認識機能も提供します。ユーザーの確認、人数カウント、公共の安全など、さまざまなユースケースで顔を検出、分析、比較できます。

[[241016]]

Amazon Rekognition は、Amazon のコンピューター ビジョン サイエンティストによって開発された、実績のある高度にスケーラブルなディープラーニング テクノロジーに基づいており、機械学習の専門知識を必要とせずに 1 日あたり数十億の画像やビデオを分析できます。 Amazon Rekognition は、Amazon S3 に保存されている画像やビデオファイルをすばやく分析できる使いやすい API です。 Amazon Rekognition は常に新しいデータから学習しており、新しいラベルと顔認識機能をサービスに継続的に追加しています。

利点

簡単に統合できる

Amazon Rekognition を使用すると、機械学習の専門知識がなくても、使いやすい API を通じてアプリケーションに視覚分析機能を簡単に追加できます。

継続的な学習

このサービスは、新しいデータを使用して継続的にトレーニングされ、オブジェクト、シーン、アクティビティを認識する能力が拡張され、それらを正確に識別する能力が向上します。

完全管理

Amazon Rekognition は、リクエストの数に関係なく、一貫した応答時間を提供します。リクエストの量が数千万リクエストにまで増加しても、アプリケーションのレイテンシは一定に保たれます。

バッチおよびリアルタイム分析

Amazon Kinesis Video Streams からのビデオをリアルタイムで分析したり、Amazon S3 にアップロードされた画像を分析したりできます。大規模なジョブの場合は、AWS Batch を使用して何千もの画像やビデオを分析します。

低コスト

Amazon Rekognition では、分析した画像またはビデオの時間数と、顔認識用に保存した顔データに対してのみ料金をお支払いいただきます。 ***料金なし、事前の義務なし。

セキュリティとアイデンティティ

顔ベースのユーザー認証を新規または既存のアプリケーションに簡単に統合できます。これは 1 つの API のみを使用する単純なプロセスです。

主な特徴

物体、シーン、アクティビティの検出

Amazon Rekognition を使用すると、何千ものオブジェクト (自転車、電話、建物など) やシーン (駐車場、ビーチ、都市など) を認識できます。ビデオを分析すると、「荷物の配達」や「サッカーのプレー」など、フレーム内で発生している特定のアクティビティを識別することもできます。

顔認識

Rekognition の高速かつ正確な検索により、顔画像のプライベート リポジトリを使用して、写真やビデオに写っている人物を識別できます。

顔分析

提供された画像やビデオの顔の属性を分析して、幸福度、年齢範囲、目の開き具合、眼鏡、ひげなどを判断できます。動画では、俳優の感情のタイムラインを作成するなど、時間の経過とともにこれらの側面がどのように変化するかを測定することもできます。

軌道

Amazon Rekognition をビデオファイルで使用すると、シーン内の人物の軌跡をキャプチャできます。たとえば、試合中の選手の動きを活用して戦術を決定し、試合後の分析を行うことができます。

安全でないコンテンツの検出

Amazon Rekognition は、画像や動画アセット内の潜在的に危険または不適切なコンテンツを識別し、詳細なラベル付けを提供して、許可するコンテンツを正確に制御できるようにします。

有名人の認知

ビデオや画像のライブラリで有名人をすばやく識別し、マーケティング、広告、メディア業界のユースケース向けに映像や写真をカタログ化できます。

画像内のテキスト

Rekognition は現実世界の画像を処理するように特別に設計されており、通り名、キャプション、製品名、ナンバープレートなどの画像内のテキストを検出して認識できます。

<<:  Amazon SageMaker について

>>:  Amazon Pollyについて

ブログ    
ブログ    
ブログ    

推薦する

DALL·Eの超進化により、写真の品質と芸術性が大幅に向上し、写真をシームレスに修正することもできるようになりました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Uni-TTS音声合成モデルのアップグレード:1つの音声、複数の言語、高忠実度、高効率

最近、マイクロソフトは最新の Azure ニューラル ネットワーク音声合成技術 Uni-TTSv3 ...

...

GPT-4Vと人間のデモンストレーションによるロボットのトレーニング:目が学習し、手がそれに従う

言語/視覚入力をロボットの動作に変換するにはどうすればよいでしょうか?カスタムモデルをトレーニングす...

私たちの重要なインフラは人工知能に対応できるでしょうか?

ChatGPT を楽しみや機能のために使用する個人から、タスクの自動化に人工知能 (AI) を適用...

AIビッグモデルにおける言語の不平等:英語は最も安価、他の言語ははるかに高価

7月31日、ユーザーが使用する言語が大規模言語モデル(LLM)のコストに大きな影響を与え、英語話者と...

百度研究所が新しいAIツールを発表:10分以内に記事を自動的に動画に変換可能

[[322859]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

NLPモデル「包括的分析+評価ランキング」、CMUの最新ツールが優れたアイデアを見つけるのに役立ちます

[[396522]] CMU は、復旦大学とオハイオ州立大学の研究者と共同で、モデルの理解度分析と...

正義がアルゴリズムを採用したとき、最後に笑うのは正義か、それともテクノロジーか?

2017年4月11日、米国のロバーツ最高裁判所長官は、ニューヨークのレンセラー工科大学の学長との会...

バイトダンスの最新のテキスト生成画像AIには、トレーニングセットにテキスト説明付きの画像が含まれていません。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Googleの人工知能学習により低ピクセル画像も鮮明に

【環球網智能報記者張洋】過去2年間で、人工知能技術が次のホットスポットとなり、多くの有名なテクノロジ...

天才少年・志慧君が志遠ロボットとともに会場に入場!脳としてAIモデル、目標価格は20万以下

Huaweiの才能あふれる若者Zhihuiの起業家デビューがついに登場!観衆の注目が集まる中、「Ex...

自動運転のための不確実性を考慮した動作計画:強化学習ベースのアプローチ

[[429196]] 2021年10月1日にarXivにアップロードされた論文「強化学習を使用した不...

最大65万ドル! 2021年の米国大手企業のプログラマーの収入をみる

アメリカのテクノロジー大手は、この流行に対して全力で対応し、その力は衰えるどこ​​ろか増した。これら...