機械学習 (ML) とディープラーニング (DL) の技術を包括する用語である人工知能 (AI) は、ライブ ストリーミングを含む人間の生活のあらゆる側面を変えると期待されています。 Facebookのようなテクノロジー大手にとって、人工知能は当たり前のものとなっている。このサイトでは、ユーザーが写真をアップロードするたびに、自動的にユーザーの顔を認識するためにこれを使用しています。 Facebook の顔認識プログラム「DeepFace」は、FBI のものより驚くほどはるかに正確です。なぜでしょうか? Facebook の膨大な写真データベースは日々成長しており、そのため AI アルゴリズムは常に改善されているからです。 AI はライブストリーミングにどのような革命をもたらすのでしょうか? 現在、ストリーミングはすべてのコンピューティング データの大部分を占めており、2022 年までにビデオはすべてのインターネット トラフィックの 82% を占めると予測されています。 AI を活用して、データをエンコード、配布、整理するより効率的な方法を見つけ、合理化されたデジタル分析を実現します。違法コンテンツの規制から著作権侵害の防止まで、AIはストリーミング業界で重要な役割を果たすことが期待されています。 人工知能 vs. 機械学習 vs. ディープラーニング 機械学習と人工知能は同じ意味で使用されることもありますが、微妙に異なる概念を指します。 「人工知能」とは、最も広い意味では、認識された知的な方法でタスクを実行する機械を指します。通常は人間を必要とする作業、つまり知覚、推論、行動、適応を実行する能力はすべて、人工知能の領域に含まれます。 機械学習はこれをさらに一歩進め、データへの露出を通じて自動的に知識を獲得する機械を指します。明示的な指示ではなくパターンに依存する計算は機械学習と呼ばれます。機械学習により、コンピューターは事前にプログラムされたルールに頼るのではなく、独自のルールを定義できるようになります。 最後に、ディープラーニングに移ります。ここで人工ニューラルネットワークが役立ちます。人間の脳をモデルにしたこれらのネットワークは、ネットワーク全体で情報を処理および送信するように設計された、相互接続された数千のノード (ニューロン) で構成されています。これらは、複数の積み重ねられたレイヤーで構成されており、画像認識、音声認識、自然言語処理などの計算集約的な機能を可能にするため、ディープであると言われています。 ライブビデオストリーミングに人工知能 (AI) が必要な理由 AI には多くの複雑な学習プロセスが含まれるため、その能力は膨大です。業界のリーダーたちは、ライブビデオストリーミングで発生する問題のいくつかを解決するためにこれを使い始めています。 今日のライブ ストリーミング テクノロジーにより、ほぼ誰でもライブ ビデオを投稿したり視聴したりできるようになりました。録画デバイス(スマートフォンやノートパソコンなど)があり、インターネットに接続できる場合は、ライブビデオのストリームには数秒しかかかりません。 動画コンテンツレビュー手法としてのAIオブジェクト検出 娯楽目的でよく使用されますが、物体検出には実用的な利点もあります。 AI は、この形式のテクノロジーを利用した検閲を通じてコンテンツ規制への道を開き、人間による監視に取って代わると期待されています。 過去には、コンテンツをチェックするためのインフラが貧弱だったため、違法ビデオストリーミングが非常に普及しました。具体的には、Facebook はコミュニティの規定に違反するライブ放送を中断するために審査員チームに依存しています。機械学習とディープラーニングを通じて、Facebook や Google などの組織は、より速く、よりスマートに、より効果的に行動できるようになります。 AI がストリーミング コンテンツを解釈し、メタデータを自動的に抽出することが期待できます。そこから、有害なコンテンツをより効果的に監視し、被害者のプライバシーを保護することができるようになります。 人工知能はデジタル世界をより安全にすると期待されていますが、それだけではありません。 AIコンテンツインデックスでユーザーエクスペリエンスを向上 人々はこれまで以上に多くのビデオを制作しているため、ストリームをリアルタイムでカタログ化する必要があります。 TikTok などの人気のソーシャル メディア アプリは、AI を活用してこれを実現し、コンテンツのパーソナライゼーションを通じてこれを強化しています。アプリの親会社であるByteDanceの代表者は、これについて次のように説明した。 「当社は、自然言語処理とコンピュータービジョン技術を使用して、テキスト、画像、動画を理解し、分析できるインテリジェントマシンを構築しています。これにより、ユーザーに最も興味深いコンテンツを提供することができ、クリエイターは日常生活で重要な瞬間を世界中の視聴者と共有することができます。」ByteDanceが世界で最も価値のあるスタートアップとしてランク付けされていることは、彼らが何か正しいことをしているに違いないことを示唆しています。 AI ツールはパーソナライゼーションの向上のために音楽ストリーミングにも適用されています。現在、アルゴリズムは曲のピッチ、テンポ、コード進行、ボーカルスタイル、そしてユーザーの履歴を考慮して、類似のコンテンツを提案することができます。 人工知能が著作権侵害を防ぐ ライブコンテンツを扱う場合、著作権保護は難しくなります。スポーツイベントやポップソングの著作権侵害を防止するために、規制当局は AI テクノロジーに注目しています。 AI がコンテンツのインデックス作成を改善し、違法コンテンツにフラグを立てるのと同様に、学習ベースのビデオ ツールは、著作権で保護された素材のライブ ビデオを分析するためにますます使用されるようになります。 とはいえ、AI がこの目標をどの程度達成できるかは不明瞭なままです。 音楽業界における著作権侵害に関して、この AI の使用は「盗作の定義は何か」という疑問を提起します。 コンテンツ認識エンコーディング Netflix のようなビデオストリーミング大手は、AI を使用して、各ビデオの複雑さに基づいて適切なエンコード設定を決定します。これにより、リソースとビデオ品質が最適化されます。とても簡単です。可能な限り低いビットレートでストリームをエンコードすると、コストを最小限に抑え、帯域幅を節約できますが、スポーツイベントやアクション満載の映像では、動きのペースに合わせるために高いビットレートが必要になります。 Netflix は、機械学習を利用して、Video Multi-method Assessment Fusion (VMAF) を使用することで、各タイプのビデオのエンコードをカスタマイズしています。同様に、YouTube はニューラル ネットワークを使用してエンコード プロセスを改善します。 結論 私たちは、ライブストリーミングに AI を適用する方法の実験を始めたばかりです。あなたが今日行っている仕事は、いつか AI の範疇に入るでしょう。脚本、編集、字幕作成などしたがって、それを利用するのが最善の策です。 リスクも伴う可能性があります。一例として、Google の物体認識ツールが黒人の写真をゴリラと誤分類したケースが挙げられます。将来このような不快な間違いを防ぐため、IBMは企業が自社のAIシステムをスキャンして差別的行動を特定し、適切な調整を行える「偏見除去ツールキット」をリリースした。 AI は人間の発明であるため、人間の偏見がシステムに組み込まれる可能性があります。 これらの問題はすべて解決する必要があります。しかし、ライブストリーミングが普及するにつれて、それをエンコード、インデックス付け、レビューするために同様に強力なコンピューティング能力が必要になります。全体として、業界には AI が必要です。 |
<<: テンセントのロボットファミリーに新しいメンバーが加わりました。「新年の挨拶をして紅包をお願いする」ことができるロボット犬を見たことがありますか?
1 11月2日、雲旗会議において、Ant FinancialはmPaaSが正式にバージョン5.0にア...
ご存知のとおり、大規模言語モデル (LLM) の動作ロジックでは、サイズが大きくなるにつれて言語生成...
AIはこれまで3つの発展の波を経験してきました。最初の2つの波は当時の技術環境やその他の理由により...
海外メディアの報道によると、マイクロソフトは水曜日、小規模な人工知能スタートアップ企業であるボンサイ...
[[433049]]数式ビルダーのテーブルバージョンが登場しました。交通大学の ACM クラスを卒業...
3か月前、同社のAIチームは、写真や動画に映る有名人やランドマークを分析するために機械学習を活用する...
建設業界は、他の多くの業界と同様に、より環境に優しくなる瀬戸際にあります。環境に優しいプロジェクトに...
12月7日水曜日、米国現地時間、Googleは新世代の人工知能モデル「Gemini」をリリースした。...
ケータリング業界における人件費は、事業者を悩ませる大きな問題です。レストランなどのケータリングのシナ...
暑い夏には、スーパーマーケットにちょっとしたおやつを買いに行くだけでも大量の汗をかきます。扇風機を使...
序文エンジニアリングでは、キーバリューストアを構築する方法が複数あり、それぞれの設計では使用パターン...
「時期尚早な最適化は諸悪の根源である。」 —ドナルド・アーヴィン・クヌース、コンピュータ科学者、数...
概要: ソートとは、一連の「順序付けられていない」レコードシーケンスを「順序付けられた」レコードシー...