[原文は51CTO.comより] 最近、AI分野のブラックテクノロジーは、人々の人工知能に対する認識を絶えず刷新しています。ジャッキー・チュンのコンサートでの逃亡者の顔認識から、杭州でツァイニャオが試験的に導入したスマートロッカーの顔認識ピックアップサービス、西渓湿地風景区への顔認識入場まで、アリババの顔認識は、電子商取引、通信、速達、旅行、ライブストリーミングなど、アリババプラットフォーム上の60以上のビジネスシーンに適用されており、人工知能技術はさまざまな業界に十分な力を与え始めています。 Youku AIテクノロジーは、さまざまな分野での深いエンパワーメントの技術ベンチマークとなっています。 今年6月のワールドカップ生中継で、YoukuはAIとクラウドビデオの強力な実力を世界に示しました。ワールドカップの生中継権を獲得した史上初の主流ビデオプラットフォームとして、Youkuのワールドカップ生中継の成功は、Youkuが独自に開発した「インテリジェントメディアブレイン」、Alibaba Cloudの高密度CDNノード、巨大な帯域幅の余裕に支えられており、本質的にはコンテンツ業界を取り巻く技術アップグレードの波でした。 この批判の波が収まったと思ったら、Youkuからの採用通知が再び話題になった。 「エンターテインメント データ ラベラー」は、通称「キスシーン鑑定士」とも呼ばれ、次のような職務内容があります。1 つ目はビデオ データをラベル付けして整理すること、2 つ目はデータ品質の検証を担当すること、3 つ目はエンターテインメント分野における顔認識モデルのトレーニングとアルゴリズムの最適化を支援することです。一見、AI関連の職業は、長期間の職務経験は必要なく、顔が見えない、有名人をたくさん知っている、バラエティ番組やオンラインドラマ、映画をたくさん見ている、機械学習を理解しているなどの条件を満たしている必要があります。とても印象的です! Youku による「エンターテインメント データ ラベラー」の採用は、Youku の機械学習技術が業界に多大な力を与えていることを示すもう 1 つのベンチマーク事例であると言えます。 「キスシーン鑑定士」という称号は不当なものではありません。その主な役割は、インテリジェントなビデオ編集のニーズを満たし、ビデオを画像に分割してラベルを付けることです。たとえば、コンピューターにキスシーンを認識させるには、画像に「キス」と「非キス」のラベルを付ける必要があるのです。 Youkuのタグライブラリのタグは、大まかに3つのレベルに分けられると報告されています。タグの種類の数は数万に達し、よく使われるタグが1000以上、機械が理解できるタグが100以上あります。
キスシーンにタグを付ける Youkuの上級アルゴリズムエンジニアであるJi Hengshan氏は、動画にラベルを付ける需要は以前から存在していたと述べた。以前は、人気ドラマのラベル付けは手作業で行われ、粒度はそれほど細かくなかった。 AI により、手動によるラベル付けが部分的にインテリジェントな方法に置き換えられます。まず、ラベル付けの効率が向上し、次に、処理の粒度がより細かくなります。 Youkuのアルゴリズム専門家である郭良氏は、「AIインテリジェンスは主に、さまざまな側面を持つビデオの内容を理解することです。お気に入りのスター、お気に入りのビデオのカテゴリやシーンなど、ユーザーの好みを収集することで、ユーザーの好みにもっと合ったビデオを推奨します」と述べています。 「機械を使って動画内のキスやハグなどのクリップを理解する鍵は、動画内の感情を理解し、より矛盾する関心ポイントをマークし、リストに推奨することです。機械によるラベル付けにより、推奨の精度が大幅に向上します。ドラマ全体に手動でラベルを付けると、すべてにラベルを付けるのは難しいです。機械認識の利点は、スケール効果を形成できることです。ラベルが詳細であればあるほど、メリットは大きくなります。」Youkuのシニア技術専門家である謝金氏は、「Youkuビデオのシリーズ予告編や再生クリップは、視覚理解技術によって自動的に作成できます。現在、手動制作と機械制作の比率は7:3です。両者は互いに補完し合っています。非常に人気の高い動画は手動で推奨されますが、完全に機械に置き換えられることはありません。」と紹介しました。 もちろん、顔認識モデルは精度を向上させるために継続的なトレーニングが必要です。機械は大量のコンテンツシナリオを学習する必要があります。データアノテーターは機械認識の教師に相当し、どの画像が「キスシーン」、「格闘シーン」、「ゴール」などであるかを機械が理解したり、ビデオにどのスターが含まれているかを理解し、有名人の顔やネットセレブの顔を識別するのに役立ちます。さまざまなシナリオやさまざまな角度で繰り返し学習して初めて、精度は使用可能なレベルに到達できます。 実際、キスシーンは、正面、横、後ろのショットなど、多くの種類のショットに分かれています。キスシーンの99%以上は、1本の動画です。ショット単位で記録できる連続したシーンです。キャラクターと顔が一体化すると、ビジネス精度は非常に高いレベルに達することができます。動画を分割することで、著名人を識別し、1エピソードの中で特定の著名人が登場する時間をカウントすることができます。著名人が登場するショットを分割し、その著名人を好むユーザーに推奨することができます。「その人だけを見る」機能は技術的には可能ですが、まだ一般には公開されていません。
ネットセレブの顔はどの角度から見ても見分けがつかない そういえば、編集者から質問があります。有名人、特にネットセレブの顔はどうやって見分けるのでしょうか? 芸能界には似たような顔の有名人が多く、見分けるのが難しい場合が多いのですが、機械はどうやって認識できるのでしょうか?季衡山氏は、画像分類認識モデルは現在主流のTensorFlowとアリババの内部フレームワークに基づいて開発されたと明らかにした。機械認識の精度を確保するために、技術者が一律に閾値を調整する。有名人が多い場合は、有名人に合わせて微調整を行う。認識精度の確保は、一方ではデータに依存し、他方では分類モデルに依存します。画像データの量が 10,000 に達し、精度が約 80% に達すると、評価または制作のために編集者に引き渡すことができます。現在、画像データの量は数万に達しており、精度はますます高くなっています。 Youkuは現在、主にエンターテインメントデータラベラーとスポーツデータラベラーの2つのカテゴリーを募集していると報じられています。この2つの分野に興味があり、機械学習についてある程度の理解があるプログラマーは、ぜひ挑戦してみてはいかがでしょうか。 技術チームは強固な基盤を持ち、YoukuのAI技術は業界の最先端にあります。 Youkuの機械認識モデルのトレーニング時間について尋ねられた時、Ji Hengshan氏は、モデルは今のところ2か月以上しかトレーニングされていないと述べました。これほど短いトレーニング時間でアプリケーションを提供できるという事実は、その背後にある技術チームに多くの人々の興味を引いています。 現在、アリババは数年にわたってAI技術を研究してきたことが分かっている。早くも2015年10月、アリババセキュリティ部門は人工知能を使って、ポルノや暴力を含むインターネット上の違法情報を識別し始めた。それは「アリAIポルノ検査官」と呼ばれていた。現在までに、インテリジェントポルノ識別モデルで実行されている正常画像とポルノ画像の数は数千万に達した。アリババのAIポルノ鑑定機は、ポルノ映画や画像を識別するだけでなく、エロティックな情報を含む音声コンテンツも認識できる。もちろん、AI ポルノ検出は手動検出を完全に置き換えることはできません。最適なレビュー方法は、インテリジェンスを主な方法として、手動作業を補助的な方法として使用することです。手作業によるポルノ検査官のグループは AI 検査官に置き換えられ、疑わしい画像にラベルを付けて検査する任務を負う。これは Youku が雇用したデータラベル付け担当者の機能に似ている。 今年のワールドカップでは、ワールドカップ生中継の許可を得てからワールドカップが始まるまで、わずか2週間しかかかりませんでした。Youkuの生中継をサポートするチームには、製品技術チーム、Alibaba Cloudチーム、そしてTmall Double ElevenのAlibabaテクニカルサポートチームが含まれていました。複数のチームの共同支援により、6月14日のワールドカップ開幕戦は、Youkuのモバイル端末の新規ユーザー数を前月比で約160%増加させ、全体のデイリーアクティブユーザー数は前月比約20%増加しました。ワールドカップのライブ放送を視聴した人数は1,200万人を超え、Youkuプラットフォームでのライブ放送の新記録を樹立しました。 アリババの副社長であり、アリババの大手エンターテインメント部門であるYoukuのCTOである荘卓然氏は、次のように述べた。「ワールドカップのライブ放送は、アリババがエンターテインメント業界のさまざまな分野に機械知能を大規模に応用した縮図です。高品質のマルチメディアコンテンツのインテリジェントな制作から、大規模なネットワークリソースのインテリジェントなスケジューリング、リアルタイムストリーミングメディアのインテリジェントなエンコードとダイナミックレンダリングまで、機械知能は舞台裏で関わっています。」 AIテクノロジーはコンテンツ制作のあらゆる側面に完全に対応します 荘卓然氏は以前、「エンターテインメント業界は大きな変化の瀬戸際にあり、特に中国ではテクノロジーの発展がこの変化の原動力となっている。ワールドカップは単なる縮図に過ぎない。テクノロジーがコンテンツ業界に与える影響は多岐にわたる。機械知能、ビッグデータ、クラウドコンピューティングの発展と成熟に伴い、コンテンツ業界のあらゆるリンクが新たなアップグレードのラウンドを迎えることを私たちは深く認識している」と公に述べた。 荘卓然氏によると、高周波動画の鮮明さと滑らかさは、インターネットスポーツイベントの生中継にとって常に最大の課題でした。今回のワールドカップ生中継では、Youkuの技術チームがストリーミングメディア処理とネットワーク配信の分野での深い蓄積と、近年の機械知能技術の蓄積とブレークスルーを活用し、プロのラジオとテレビのリンクとインターネットストリーミングメディアのインテリジェントインフラストラクチャを革新的に組み合わせて、インテリジェントエンコードとデコード、インテリジェントスケジューリング、インテリジェントインタラクション、インテリジェント処理、インテリジェント制作を含むAI時代の「インテリジェントメディアブレイン」を形成しました。5つの主要なエンジンが、リアルタイムストリーミングメディアコンテンツの制作、配信、消費、インタラクションのシナリオを完全にカバーし、いつでもどこでも高解像度でスムーズな生中継を視聴できる統合体験をインターネットで初めて実現しました。 満場一致で称賛されているYoukuのワールドカップ生中継の高解像度は、インテリジェントコーデックエンジンの成果です。この技術は「Narrowband HD 2.0」とも呼ばれ、Youkuプラットフォームで広く使用されています。今回、Youkuの技術チームは、イベントの生中継のために、機械学習に基づく独自のエンコード戦略を最適化しました。たとえば、特別なエンコード戦略を使用して、サッカー、芝生、選手をそれぞれ最適化し、ゲーム画像のレイヤーと透明性を大幅に向上させました。
機械知能、ビッグデータ、クラウドコンピューティングの発展と成熟により、コンテンツ業界のあらゆるリンクは新たなアップグレードの時代を迎えるでしょう。荘卓然氏は「AIの推進により、Youkuのコンテンツ購入、企画、運営、さらには広告やマーケティングのシステム全体が再構築された」と述べた。 「コンテンツ産業は、よりインテリジェントな時代、よりパーソナライズ化と多様性の時代、より極端な体験の時代を迎えるだろう」と荘卓然氏は述べた。アリババ経済に正式に参入してから2年、技術インフラ、人材チーム、ビジネスエコロジーのさらなる統合を通じて、Youkuはこのチャンスをつかむために全力を尽くし、ハリウッド+シリコンバレーモデルの実現を加速し、中国式のイノベーションを積極的に推進し、中国の文化・娯楽産業が世界のトップに到達する新たな機会を歓迎している。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: tf.keras と Eager Execution を使用して複雑な問題を解決する方法
>>: 人工知能が登場して60年になります。人工知能について私たちはどんな誤解をしているのでしょうか?
多くの資産運用会社やヘッジファンドにとって、人工知能は成功にとって非常に重要であるため、彼らは新しい...
ITS114の統計によると、2019年のわが国のセキュリティとスノーブライトプロジェクトの数千万プ...
[[430918]]今日、機械学習 (ML) モデルは大規模に使用され、影響力がますます高まっていま...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
人工知能は新たな変化を先導しています。近年、人工知能はテクノロジー業界から始まり、急速に生活の各分野...
ペンシルベニア大学医学部が最近実施した研究では、人工知能がオピオイド乱用と戦うためにどのように使用で...
人工知能 (AI) は、デジタル顧客サービス アシスタント、自動運転車、無人倉庫のロボットなど、多く...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
学際的な共同プロジェクトによる研究によると、人工知能は専門家の評価を必要とせずに、アンケートや脳スキ...
画像マッティングとは、画像内の正確な前景を抽出することを指します。現在の自動方法では、画像内のすべて...
[[381014]]近年、AIの波が全国を席巻し、さまざまな業界で人間の仕事がAIに置き換わっていま...
坂を下るのと同じように、損失関数の最低点を見つけます。 [[336501]]ニューラル ネットワーク...
昨日、工業情報化部が突然、人工知能に関するもう一つの重要な赤字文書を発行しました!文書では、2018...