データ爆発の時代では、データの収集だけでは不十分です。ビジネスを運営し、成長させるための洞察を得るには、データを処理し、細分化する必要があります。残念ながら、現在世界で入手可能なデータのほとんどは構造化されておらず、隠されているため、人間の多大な関与なしには処理することが困難です。メディア業界のデータのほとんどはこのカテゴリに分類されますが、状況は変わり始めています。 どのビデオ ファイルにも、その構造に多くの非構造化データが織り込まれており、それを理解して解読するには人間の密接な関与が必要です。配信準備完了とマークされる前に、コンテンツの管理、処理、解釈、品質チェックなどの最も基本的な作業を実行するために人手が必要です。興味深いことに、AI および ML アルゴリズム、特にディープラーニングは現在、これらのタスクのほとんどを大規模に実行できる人間レベルの精度に達しています。 AI は、ワークフロー アクティビティを自動化し、隠れた資産「データ」から膨大な洞察を得るのに適しています。その結果、メディア業界では、自然言語処理 (NLP)、顔認識、異常検出などの分野で AI が比類のない効率で大規模な自動化を可能にし、数々の勝利を収めてきました。 2107 年は、放送、コンテンツ管理、ポストプロダクション、広告など、多くの分野で AI が大きな利益をもたらし始める重要な年となります。これは AI の旅の始まりに過ぎないと言われています。 予測分析とディープラーニング予測分析では、将来の行動は過去の傾向に影響を受ける可能性があるという重要な前提を採用しており、ほとんどの場合、その前提は時間の経過とともに維持されます。これらの予測モデルの基礎では、一連の仮定によって複数の独立変数 (コンテンツのパーソナライゼーションの場合、年齢、性別、経済状況、教育、コンテンツの興味などの変数) が組み合わされ、統計的な相関関係が確立されます。将来の行動を予測するのは、これらの相関関係の総合的な強さと大きさです。予測分析の詳細については、こちらをご覧ください。最近では、ニューラル ネットワークを使用して人間の脳と同様の分析能力を生み出すディープラーニングにより、機械はより高度な認知能力を学習できるようになりました。ディープラーニングは、人間の脳が状況にどのように反応するかをエミュレートすることで、旧来の力ずくの決定木からより現実的なものへと大きな変化をもたらします。 メディアとエンターテインメントにおける機械学習の重点分野AI と ML は数十年にわたって学術界と研究開発の領域で研究されてきましたが、実際の業界統合が始まったのはここ数年のことです。人工知能は、人手を要するタスクのほとんどを自動化できるテクノロジーをもたらし、スケーラビリティ、計算速度、再現性などの利点をもたらします。コンテンツ管理、メディア運用における既存のタスクを自動化し、顧客エンゲージメントとエクスペリエンスを向上させることで、大幅なコスト削減を実現できる可能性を秘めています。たとえば、AI は複雑なオーディオ/ビデオ同期タスクを自動化できるため、手作業を大幅に削減し、人的エラーを削減できます。メディアおよびエンターテインメント業界における AI 変革のトップ 10 領域をご紹介します。 1. 詳細なビデオ分析、翻訳、文字起こし、タグ付け- AI は手書き文字認識を完成させるのに数年かかり、すぐに自然言語理解 (NLU) に移行しました。現在では、自然言語処理やメタデータ処理を超えて、コンテンツを深く分析できるようになりました。機械主導の自動化により、音声が読みやすいテキストに変換され、ほぼリアルタイムで文字起こしが行われます。私たちは皆、Alexa、Cortana、Google Voice の初期の登場を目にしてきました。ニューラル ネットワーク トレーニング システムは、新しいコンテキストと意図関連の次元を追加することで、従来の単語翻訳に取って代わります。今後 3 年間で、AI が文字起こしと翻訳の作業を完全に引き継ぎ、日常生活で使用されるオーディオ デバイスに搭載されることが予想されます。 ディープ ビデオ分析は、シーンの変化、場所の参照、音声、顔、オブジェクトの認識を学習することでビデオの洞察を多面的に拡張する、もう 1 つの興味深い領域です。このインテリジェンスは、コンテンツの分類を強化し、コンテンツに適切にタグを付ける上で大いに役立ち、コンテンツのリンク、検索、関連付けの精度が向上します。ここで、AI は、機械駆動のインデックス作成、メタデータのタグ付け、カタログ作成などを通じてコンテンツ管理の全体的な状況を大きく変え、手動のプロセスを高度に自動化されたワークフローに変換しています。複数の言語や方言へのビデオ翻訳、および多言語字幕により、コンテンツのターゲット市場がこれまで以上に多くの視聴者に拡大されます。 2. 音声ベースの仮想アシスタント– 過去 2 年間で、Alexa、Google Home などの音声アシスタントや、Siri や Roku などの音声リモコンは、基本的なメニュー ナビゲーション機能を完璧にすることで、扱いにくいテレビのリモコンを排除し始めました。次に、ユーザーのフォローアップ コマンドの助けを借りて、コンテンツの検索と検出のためのインテリジェンスが提供されます。教師あり学習アルゴリズムを使用する人工知能は、仮想アシスタントを強化し、消費者のナレッジグラフ、地理座標、音声入力、リッチ コンテンツのメタデータ (キャスト リスト、概要、引用、場所など) を組み合わせて、パーソナライズされた推奨事項を提供できるようになりました。仮想アシスタントは言語特性、感情、ユーザーの意図を理解できるため、よりスマートになり、直感的で成熟した会話システムにより、顧客体験が向上します。個人的なデジタル関係がより深まるにつれて、 3. 最適化されたビデオ エンコーディングと伝送- アダプティブ ビットレート (ABR) ストリーミングの導入により、ビデオ ストリーミングには大きな利点があります。 ABR エンコーディングでは、元のファイルの小さなチャンクをさまざまなビットレートで作成し、利用可能な帯域幅に基づいてクライアントに提供します (ストリーミングの詳細については、こちらをお読みください)。 AI は、固定ビットレートのチャンク化をシーンベースのエンコーディングに改善する技術を導入することで、これにさらに力を入れています。複数の品質メトリックにわたってシーンの複雑さを学習することにより、AI は必要な圧縮レベルを決定でき、エンコードされたビデオが与えられると、システムは品質を追跡しながらフレームレベルの複雑さと最適な圧縮パラメータを決定できます。 Netflix はこの技術を習得しており、低いビットレートでも正確にエンコードされたストリームを生成できます。この新しいエンコード方式は、携帯電話の低帯域幅ネットワークがビデオ視聴の主なプラットフォームとなっている新興経済国で増加する視聴者に途切れることなくビデオを配信する方法に革命をもたらします。 AI は、視聴者の場所、ネットワークの混雑状況などに基づいて必要なビットレートを最適化することで、オンライン メディア プレーヤーのパフォーマンスも向上させます。 4. 視覚認識- 顔認識と物体認識は、視覚処理を重視する AI 分野です。ビデオや静止画像内の人物や物体の認識、および時間の経過に伴うそれらの相対的な変化を扱います。この種の視覚処理は人間にとっては自然なことですが、機械にとって、大量のデータの変化を圧縮して望ましいレベルの精度を達成するのは難しい作業です。最近、AI と機械学習は視覚認識、つまり顔やパターンの認識を習得できるようになり、コンテンツ編集や自動コンテンツ作成の豊かな道を切り開いています。 Facebook や数多くの写真アプリが友達の写真タグを驚くほどうまく処理しているのは不思議です。すべて AI と ML のおかげなのです。 5. 異常検出- オンライン ビデオは過去数年間で不釣り合いなほど成長しました。 YouTube、Facebook、オンライン ネットワークにより、アマチュアやプロがコンテンツ クリエイターになり、大勢の視聴者にリーチできる無限の機会が生まれました。今日では、毎秒生成される動画や画像の量が膨大であるため、不適切なコンテンツ(海賊版、暴力、アダルトなど)を監視してフラグを立てることは人間には不可能になっています。これは、この分野で実績のある機械学習サービスであり、ほとんどのネットワークがアップロード時に AI ベースの自動検出ツールを作成しています。 Google の Cloud Vision API は、コンテンツのラベル付けに適切な改善を加えるサービスです。偽コンテンツの作成が人工知能による脅威として増大する中、この AI テクノロジーは悪意のある行為を制限する上で救いの手を差し伸べています。 6. コンテンツ フィンガープリンティング- サンプル コンテンツ スニペットをキャプチャして識別用の一意のフィンガープリントを作成するという原理に基づいて、コンテンツ フィンガープリンティングはメディア業界で大きな進歩を遂げてきました。コンテンツがマルチチャネル配信で増加し続けるにつれて、AI ベースのフィンガープリンティング技術がアプリケーションで重要な役割を果たします。いくつかの使用例を挙げると
Shazamは、効率的な検索を通じて、正確かつ類似したプロフィールを見つけるためのライブモデルです。 ブロックチェーンを使用して、支払いと使用状況の追跡のためにコンテンツをマイクロライセンスする 消費者の視聴行動を特定・追跡し、広告を測定する イベント発生を確認するためのブロードキャスト監視 音声、動画、画像のコンテンツ保護、不正配信の追跡
7. ビデオ品質の評価- ビデオ圧縮は、ビデオの適切な伝送速度を実現するために重要です。ただし、圧縮は非可逆であり、損傷やアーティファクトなどのアーティファクトが発生する可能性があります。ビデオ品質評価は、コンテンツ配信前の重要なプロセスであり、マルチチャネル配信とともに徐々に拡大してきました。従来、品質評価には 2 つの標準的なアプローチが単独または組み合わせて使用されてきました。コンテンツを再生してエラーをチェックすることで人間による視覚分析が可能になり、VQM、PSNR、MSE、SSIM などのメトリックを使用してより自動化された参照ベースの評価も可能になります。前者は多くの人手を必要としますが、後者は正確性、非リアルタイム性、参照モデルへの依存といった点で課題に直面しています。人工知能と機械学習は、非参照ベースのビデオ品質評価を習得することで、これらすべてを変えています。 AI は、幅広い機能セットを使用し、エラー パターンから学習することで、ほぼリアルタイムの品質評価を提供できます。ビデオワークフローの品質管理を自動化し、コンテンツのリリーススケジュールを短縮する比類のない効率をもたらす大きな可能性 8. 仮想現実と拡張現実– AR/VR 市場には大きな可能性がありますが、コスト、コンテンツの成熟度、使いやすさなどの課題により、この技術は期待どおりの成果を上げていません。仮想現実 (VR) は 360 度の没入型体験の作成に重点を置いているのに対し、拡張現実 (AR) はコンピューター グラフィックス要素と現実世界の要素のオーバーレイを扱います。まだ非常に未熟な VR/AR アプリケーションやサービスの大部分にとって、AI はデータ品質と意思決定を改善することで新たな活力をもたらします。 AI は、画像の精度、ユーザー入力と意図のより深い理解、コンテンツの関連付け、コンテキスト化、コンテンツの作成に役立ち、ユーザーにとってより没入感のあるエクスペリエンスを生み出します。 9. ポストプロダクション- クリエイティブプロセスの多くは定義されたルールとテクニックに基づいているため、機械学習アルゴリズムによって習得できます。人工知能システムは、プロットの認識、シーンの選択、スクリプト作成など、さまざまなクリエイティブ プロセスに必要な基礎作業を自動的に実行できます。モーガンって聞いたことありますか?昨年9月に公開されたAIベースのSF映画には、映画自体の主題と共通点がある。映画の予告編は人間の編集者によって作成されましたが、IBM Watson を使用した AI によって提案されました。ここでワトソンは、同様の主題の予告編から学習し、映画の重要なシーンを選択するよう訓練され、その後、それらのシーンがつなぎ合わされて最終的な予告編が作られました。良い例としては、AI がシーンを選択し、視覚効果を挿入し、予告編のような説得力のある人間による編集を構築する方法が挙げられます。 AIが参入する分野は他にもある
ビデオ コンテンツの構造的および意味的分析を実行して、ニュース、ビデオのセグメンテーション、ファン エンゲージメントのための特別な関心のコンテンツ用の短い形式のビデオ スニペットの作成を支援します。 脚本の校正、コンテンツの整理、シーンの順序付け、およびフィルム編集の最初のパス。スクリプトのコンテキストに基づいて、評価を選択して複数のシーンのパフォーマンスを作成します。 スローモーションコンテンツキャプチャでビデオを閲覧し、参照専用コンテンツを作成する IBM は最近、全米オープンと提携し、試合の重要な瞬間を認識してスポーツのハイライトを提供しました。スポーツやニュースのコンテンツを素早く識別し、関連コンテンツを集約する AI の能力は、現在のスポーツやニュースの報道ビジネスに革命をもたらす可能性があります。
コンテンツ構造とオブジェクトベースの分析により、AI が実際のコンテンツ開発を支援する新しい方法が開拓されました。 AI システムは、画面上のキャラクターの行動、動き、話し方、あらゆる表情の詳細を学習し、仮想パフォーマンスを作成できます。いかにして生き生きとしたパフォーマンスが生み出されるかは驚くべきことです。想像の余地がほとんどない、実際には行われなかったバラク・オバマ米大統領の演説のクリップをご覧ください。人工知能はコンテンツ制作の世界ではまだ浸透しつつあり、制作プロセスにメリットをもたらす領域は数多くあります。 人気セレブの特徴、表情、ペルソナ、スタイルを学習して、仮想の人間のキャラクター(デジタルアバターのみ)を作成します。 アニメーション映画のコンピュータグラフィックス作業を自動化し、人間中心のキャラクターアニメーションを置き換えて、効率を高めます。
まとめAI と機械学習は、一連のルールに基づいており、機械がパターンを構築して学習できるあらゆるものに影響を与える可能性があります。 AI および ML テクノロジーにはそれぞれ未開拓の領域と障害がありますが、より大きな目標を達成し、比類のない機能を約束する立場にあります。金融サービス、ハイテク、通信業界で AI が急速に導入される中、メディアおよびエンターテインメント業界もワークフローの自動化で遅れをとっていません。 |