独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

2013年頃、Kuaishouは純粋なツールアプリケーションから、毎日1万人のアクティブユーザーを抱える短編動画コミュニティへと徐々に変化しました。 2018年12月現在、快手には1日あたり1億6000万人以上のアクティブユーザーと3億人の月間アクティブユーザーがおり、毎日1500万本以上の短編動画がアップロードされ、80億本以上の短編動画が保管されています。 Kuaishouが短期間でこのような成果を達成できたのは、独自のロジックと堅実なAI技術によるものです。

快手ショート動画のロジックは非常にユニークで、公平性とアクセシビリティ、一般動画制作者の保護、撮影内容と視聴ニーズの多様性という4つの部分のクローズドループを巧みに構築しています。

「Kmoji」の魔法のような表情を支えるAI技術

かわいい魔法の絵文字がKuaishouでリリースされて以来、大多数のユーザーに好評を得ていると報告されています。この機能により、ユーザーはカメラを使用して自分専用の顔AR仮想画像を生成すると同時に、ユーザーの表情を捉え、まばたき、口を開ける、眉を上げる、舌を出すなどの微妙な動きを正確に再現することができます。

ユーザーがかわいいKmojiを使って作った手作りのGeng画像

「Kmoji」の背後には、Kuaishou 技術チームによる多くの研究開発作業があります。まず、「Kmoji」は顔のキーポイントや画像特徴抽出などのAI技術を基盤としており、iPhoneXなどのデバイスがサポートする3D構造化光情報を必要としません。2D視覚情報のみでユーザーの髪型、顔の形、顔の特徴、肌の色、口紅の色、ひげなどの顔の属性情報を認識し、ユーザー固有の3D AR画像を構築し、その3D画像を操作して表情パラメータを通じてさまざまな微妙な表情を作ります。例えば、笑う、目を閉じる、口を開ける、舌を出すなど、50以上の表情を作ります。これはマルチモーダル技術の成功した応用です。

さらに、「Kmoji Cute Face」は物理ベースのリアルなレンダリングアルゴリズムを採用しており、金属や革などのモデル素材をよりリアルで質感のあるものにし、モデルの表現力を大幅に向上させています。同時に、Kuaishou技術チームはアルゴリズムの最適化を通じて「Kmoji」の実行に占有されるCPUとGPUリソ​​ースを大幅に削減し、動作効率を向上させ、一般的な千元クラスの携帯電話でもスムーズに動作できるようになりました。

快手コンテンツ制作におけるAI技術の応用

Kuaishouは、顔のキーポイント認識、体のキーポイント認識、ジェスチャー認識、視覚慣性オドメトリ、髪のセグメンテーション、背景のセグメンテーションなどの人工知能技術を使用して、美容装飾効果、ダンスマシンゲーム、雨制御効果、AR効果、髪の染色効果、背景の置き換えなどの魔法のような表現を実現し、ユーザーに新しい録画体験をもたらします。

快手はまた、写真やビデオに映る手の位置や21個の主要関節の位置を識別できる手のキーポイント技術を独自に開発しました。この技術ソリューションは、あらゆるジェスチャーの重要なポイントの予測をサポートすると同時に、革新的なネットワーク設計を採用しているため、モデル計算の量が大幅に削減され、iPhone と Android フォンの両方でリアルタイムに監視できます。業界で同様の機能を備えたソフトウェア プラットフォームは他にありません。

コンテンツ制作に AI 技術を適用することが難しいのは、Kuaishou のユーザー カバレッジが非常に広いためです。不完全な統計によると、Kuaishouユーザーが使用している携帯電話のモデルは5万以上あり、これらの携帯電話の多くは比較的性能が限られています。高度なAI技術には、デバイスに非常に高い計算能力が必要です。より多くのユーザーが高度な技術を体験できるように、Kuaishouは基盤となるプラットフォームをカスタマイズし、独自のYCNN深層推論学習エンジンを開発しました。これにより、AI テクノロジの動作がユーザー デバイスの計算能力によって制限されるという問題が解決されます。評価によると、Kuaishou YCNN は既知のエンジンよりも 50% 高速に実行されます。

報道によると、2018年12月、快手YCNN深層推論学習エンジンは、人工知能技術メディア[Machine Heart]が創設したSynced Machine Intelligence Awards 2018「トップ30ベストAI応用事例」賞を受賞した。

過去2年間で、短編動画の人気は爆発的に高まり、インターネットメディアの発展のトレンドをリードし、急速に競争の激しい業界になりました。 2019年1月10日、中国インターネット視聴覚番組サービス協会は、ショートビデオの配信手順をさらに標準化するために、「オンラインショートビデオコンテンツ審査基準の詳細規則」と「オンラインショートビデオプラットフォーム管理基準」の100条を正式に発表しました。これにより、一部の製品コンテンツのアップグレードが促進され、一部の企業が他社を追い抜く絶好の時期でもあります。おそらく、このような政策監督の下では、すべてのショートビデオ企業はコンテンツの品質にもっと注意を払うようになるでしょう。Kuaishouが独自のロジックを堅持し、より多くのAI技術を統合して最高のユーザーエクスペリエンスを生み出し、さらに前進することを願っています。

<<:  Kmojiの魔法の表情を支えるAI技術

>>:  2018年の世界人工知能データから将来の発展傾向を見る

ブログ    

推薦する

...

製造業における人工知能の8つの応用シナリオ

人工知能の概念は、60年以上前の1950年代に初めて提案されました。しかし、モノのインターネット、ビ...

...

AIとIoT:この2つの強力なテクノロジーが将来のビジネスモデルをどう変えるのか

無人ドローンや機械学習が一般的になる前、ジェームズ・キャメロンは1984年に自身の夢のプロジェクトで...

AI+サイエンス: PaddlePaddle をベースにした AlphaFold2 でタンパク質構造予測を実現

1958 年、FHC クリックは、生物学における重要なセントラルドグマである DNA -> R...

Python 補間アルゴリズムの完全な説明

[[411126]]この記事はWeChatの公開アカウント「Python Chinese Commu...

困難な選択のターミネーター: さまざまな問題に対する機械学習アルゴリズム

データサイエンスを学び始めた頃、特定の問題に対してどのアルゴリズムを選択すればよいのかという疑問によ...

...

専門家:歩行者の安全問題を解決するために都市は自動運転だけに頼ることはできない

自動運転技術が業界全体で開発のマイルストーンに到達し続ける一方で、都市は自動運転車(AV)の目標を補...

インテリジェントソフトウェアが現代の製造業に革命を起こす

テクノロジーが進歩を左右するこの急速に変化する時代において、製造業界は大きな変化を遂げています。この...

...

近年、「人工知能」が私たちの生活に静かに登場している

科学技術と産業技術の継続的な発展により、私たちの生活は大きく向上し、「人工知能」という言葉も徐々に私...

キャッシュに関して最も懸念される問題は何ですか?種類は何ですか?リサイクル戦略とアルゴリズム?

[[342437]]著者は、正確なタイミング タスクと遅延キュー処理機能を備えた、高同時実行シナリ...

...

チューリング賞受賞者ヨシュア・ベンジオ氏:生成フローネットワークがディープラーニングの分野を拡大

最近、「GFlowNet Foundations」と題された論文が注目を集めています。これはチューリ...