独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

2013年頃、Kuaishouは純粋なツールアプリケーションから、毎日1万人のアクティブユーザーを抱える短編動画コミュニティへと徐々に変化しました。 2018年12月現在、快手には1日あたり1億6000万人以上のアクティブユーザーと3億人の月間アクティブユーザーがおり、毎日1500万本以上の短編動画がアップロードされ、80億本以上の短編動画が保管されています。 Kuaishouが短期間でこのような成果を達成できたのは、独自のロジックと堅実なAI技術によるものです。

快手ショート動画のロジックは非常にユニークで、公平性とアクセシビリティ、一般動画制作者の保護、撮影内容と視聴ニーズの多様性という4つの部分のクローズドループを巧みに構築しています。

「Kmoji」の魔法のような表情を支えるAI技術

かわいい魔法の絵文字がKuaishouでリリースされて以来、大多数のユーザーに好評を得ていると報告されています。この機能により、ユーザーはカメラを使用して自分専用の顔AR仮想画像を生成すると同時に、ユーザーの表情を捉え、まばたき、口を開ける、眉を上げる、舌を出すなどの微妙な動きを正確に再現することができます。

ユーザーがかわいいKmojiを使って作った手作りのGeng画像

「Kmoji」の背後には、Kuaishou 技術チームによる多くの研究開発作業があります。まず、「Kmoji」は顔のキーポイントや画像特徴抽出などのAI技術を基盤としており、iPhoneXなどのデバイスがサポートする3D構造化光情報を必要としません。2D視覚情報のみでユーザーの髪型、顔の形、顔の特徴、肌の色、口紅の色、ひげなどの顔の属性情報を認識し、ユーザー固有の3D AR画像を構築し、その3D画像を操作して表情パラメータを通じてさまざまな微妙な表情を作ります。例えば、笑う、目を閉じる、口を開ける、舌を出すなど、50以上の表情を作ります。これはマルチモーダル技術の成功した応用です。

さらに、「Kmoji Cute Face」は物理ベースのリアルなレンダリングアルゴリズムを採用しており、金属や革などのモデル素材をよりリアルで質感のあるものにし、モデルの表現力を大幅に向上させています。同時に、Kuaishou技術チームはアルゴリズムの最適化を通じて「Kmoji」の実行に占有されるCPUとGPUリソ​​ースを大幅に削減し、動作効率を向上させ、一般的な千元クラスの携帯電話でもスムーズに動作できるようになりました。

快手コンテンツ制作におけるAI技術の応用

Kuaishouは、顔のキーポイント認識、体のキーポイント認識、ジェスチャー認識、視覚慣性オドメトリ、髪のセグメンテーション、背景のセグメンテーションなどの人工知能技術を使用して、美容装飾効果、ダンスマシンゲーム、雨制御効果、AR効果、髪の染色効果、背景の置き換えなどの魔法のような表現を実現し、ユーザーに新しい録画体験をもたらします。

快手はまた、写真やビデオに映る手の位置や21個の主要関節の位置を識別できる手のキーポイント技術を独自に開発しました。この技術ソリューションは、あらゆるジェスチャーの重要なポイントの予測をサポートすると同時に、革新的なネットワーク設計を採用しているため、モデル計算の量が大幅に削減され、iPhone と Android フォンの両方でリアルタイムに監視できます。業界で同様の機能を備えたソフトウェア プラットフォームは他にありません。

コンテンツ制作に AI 技術を適用することが難しいのは、Kuaishou のユーザー カバレッジが非常に広いためです。不完全な統計によると、Kuaishouユーザーが使用している携帯電話のモデルは5万以上あり、これらの携帯電話の多くは比較的性能が限られています。高度なAI技術には、デバイスに非常に高い計算能力が必要です。より多くのユーザーが高度な技術を体験できるように、Kuaishouは基盤となるプラットフォームをカスタマイズし、独自のYCNN深層推論学習エンジンを開発しました。これにより、AI テクノロジの動作がユーザー デバイスの計算能力によって制限されるという問題が解決されます。評価によると、Kuaishou YCNN は既知のエンジンよりも 50% 高速に実行されます。

報道によると、2018年12月、快手YCNN深層推論学習エンジンは、人工知能技術メディア[Machine Heart]が創設したSynced Machine Intelligence Awards 2018「トップ30ベストAI応用事例」賞を受賞した。

過去2年間で、短編動画の人気は爆発的に高まり、インターネットメディアの発展のトレンドをリードし、急速に競争の激しい業界になりました。 2019年1月10日、中国インターネット視聴覚番組サービス協会は、ショートビデオの配信手順をさらに標準化するために、「オンラインショートビデオコンテンツ審査基準の詳細規則」と「オンラインショートビデオプラットフォーム管理基準」の100条を正式に発表しました。これにより、一部の製品コンテンツのアップグレードが促進され、一部の企業が他社を追い抜く絶好の時期でもあります。おそらく、このような政策監督の下では、すべてのショートビデオ企業はコンテンツの品質にもっと注意を払うようになるでしょう。Kuaishouが独自のロジックを堅持し、より多くのAI技術を統合して最高のユーザーエクスペリエンスを生み出し、さらに前進することを願っています。

<<:  Kmojiの魔法の表情を支えるAI技術

>>:  2018年の世界人工知能データから将来の発展傾向を見る

ブログ    
ブログ    
ブログ    

推薦する

機械学習について学びたい方はこちらをご覧ください。1ステップで専門家になる方法をお教えします!

パターン認識や機械学習のファンであれば、機械学習では避けられない重要な問題であるサポートベクターマシ...

【受賞討論会】「スマート運用・保守」がトレンドに。運用・保守エンジニアは人工知能に置き換えられるのか?

特にインフラとして重要な役割を担うデータセンターにおいては、運用・保守は決して軽視できるものではなく...

...

人工知能は祝福か、それとも呪いなのか?事故は急増しており、アップルとグーグルも例外ではない

人工知能は現代の大きな発展のトレンドであり、世界中のほぼすべてのハイテク企業が AI 分野の技術を研...

...

...

この記事では人工知能とは何かを徹底的に解説します!

人工知能 (AI) は、自然科学のさまざまな分野を網羅しており、主に特定の種類の知的な人間の活動をモ...

...

人工知能は気候変動の転換点を明らかにするかもしれない

ウォータールー大学の応用数学教授であるクリス・バウチ氏は、新しいディープラーニングアルゴリズムの結果...

「天宮2.0」MoE大型モデル発売

2月6日、崑崙万為はMoE大規模言語モデルの新バージョン「天宮2.0」と「天宮AIスマートアシスタン...

AI時代に従業員がIT業務の価値を証明する方法

[[251301]]ロボットがあなたの仕事を奪う可能性はありますか? あなたはロボットの仕事を手伝う...

ML プロジェクトを実行するときに、タスクが多数あり、些細な場合はどうすればよいでしょうか?このセルフチェックリストはあなたの心を整理するのに役立ちます

機械学習プロジェクトには、データ処理、モデルの最適化など、多くの要素が関係します。開発者は混乱したり...

...

CreditEase の R&D ディレクター、張振氏: 運用・保守ロボットのタスク決定システムの進化

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

...