独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

2013年頃、Kuaishouは純粋なツールアプリケーションから、毎日1万人のアクティブユーザーを抱える短編動画コミュニティへと徐々に変化しました。 2018年12月現在、快手には1日あたり1億6000万人以上のアクティブユーザーと3億人の月間アクティブユーザーがおり、毎日1500万本以上の短編動画がアップロードされ、80億本以上の短編動画が保管されています。 Kuaishouが短期間でこのような成果を達成できたのは、独自のロジックと堅実なAI技術によるものです。

快手ショート動画のロジックは非常にユニークで、公平性とアクセシビリティ、一般動画制作者の保護、撮影内容と視聴ニーズの多様性という4つの部分のクローズドループを巧みに構築しています。

「Kmoji」の魔法のような表情を支えるAI技術

かわいい魔法の絵文字がKuaishouでリリースされて以来、大多数のユーザーに好評を得ていると報告されています。この機能により、ユーザーはカメラを使用して自分専用の顔AR仮想画像を生成すると同時に、ユーザーの表情を捉え、まばたき、口を開ける、眉を上げる、舌を出すなどの微妙な動きを正確に再現することができます。

ユーザーがかわいいKmojiを使って作った手作りのGeng画像

「Kmoji」の背後には、Kuaishou 技術チームによる多くの研究開発作業があります。まず、「Kmoji」は顔のキーポイントや画像特徴抽出などのAI技術を基盤としており、iPhoneXなどのデバイスがサポートする3D構造化光情報を必要としません。2D視覚情報のみでユーザーの髪型、顔の形、顔の特徴、肌の色、口紅の色、ひげなどの顔の属性情報を認識し、ユーザー固有の3D AR画像を構築し、その3D画像を操作して表情パラメータを通じてさまざまな微妙な表情を作ります。例えば、笑う、目を閉じる、口を開ける、舌を出すなど、50以上の表情を作ります。これはマルチモーダル技術の成功した応用です。

さらに、「Kmoji Cute Face」は物理ベースのリアルなレンダリングアルゴリズムを採用しており、金属や革などのモデル素材をよりリアルで質感のあるものにし、モデルの表現力を大幅に向上させています。同時に、Kuaishou技術チームはアルゴリズムの最適化を通じて「Kmoji」の実行に占有されるCPUとGPUリソ​​ースを大幅に削減し、動作効率を向上させ、一般的な千元クラスの携帯電話でもスムーズに動作できるようになりました。

快手コンテンツ制作におけるAI技術の応用

Kuaishouは、顔のキーポイント認識、体のキーポイント認識、ジェスチャー認識、視覚慣性オドメトリ、髪のセグメンテーション、背景のセグメンテーションなどの人工知能技術を使用して、美容装飾効果、ダンスマシンゲーム、雨制御効果、AR効果、髪の染色効果、背景の置き換えなどの魔法のような表現を実現し、ユーザーに新しい録画体験をもたらします。

快手はまた、写真やビデオに映る手の位置や21個の主要関節の位置を識別できる手のキーポイント技術を独自に開発しました。この技術ソリューションは、あらゆるジェスチャーの重要なポイントの予測をサポートすると同時に、革新的なネットワーク設計を採用しているため、モデル計算の量が大幅に削減され、iPhone と Android フォンの両方でリアルタイムに監視できます。業界で同様の機能を備えたソフトウェア プラットフォームは他にありません。

コンテンツ制作に AI 技術を適用することが難しいのは、Kuaishou のユーザー カバレッジが非常に広いためです。不完全な統計によると、Kuaishouユーザーが使用している携帯電話のモデルは5万以上あり、これらの携帯電話の多くは比較的性能が限られています。高度なAI技術には、デバイスに非常に高い計算能力が必要です。より多くのユーザーが高度な技術を体験できるように、Kuaishouは基盤となるプラットフォームをカスタマイズし、独自のYCNN深層推論学習エンジンを開発しました。これにより、AI テクノロジの動作がユーザー デバイスの計算能力によって制限されるという問題が解決されます。評価によると、Kuaishou YCNN は既知のエンジンよりも 50% 高速に実行されます。

報道によると、2018年12月、快手YCNN深層推論学習エンジンは、人工知能技術メディア[Machine Heart]が創設したSynced Machine Intelligence Awards 2018「トップ30ベストAI応用事例」賞を受賞した。

過去2年間で、短編動画の人気は爆発的に高まり、インターネットメディアの発展のトレンドをリードし、急速に競争の激しい業界になりました。 2019年1月10日、中国インターネット視聴覚番組サービス協会は、ショートビデオの配信手順をさらに標準化するために、「オンラインショートビデオコンテンツ審査基準の詳細規則」と「オンラインショートビデオプラットフォーム管理基準」の100条を正式に発表しました。これにより、一部の製品コンテンツのアップグレードが促進され、一部の企業が他社を追い抜く絶好の時期でもあります。おそらく、このような政策監督の下では、すべてのショートビデオ企業はコンテンツの品質にもっと注意を払うようになるでしょう。Kuaishouが独自のロジックを堅持し、より多くのAI技術を統合して最高のユーザーエクスペリエンスを生み出し、さらに前進することを願っています。

<<:  Kmojiの魔法の表情を支えるAI技術

>>:  2018年の世界人工知能データから将来の発展傾向を見る

ブログ    
ブログ    

推薦する

自動運転車は生後7か月の赤ちゃんよりも賢いのでしょうか?

生後 7 か月までに、ほとんどの子供は、物体は見えなくても存在するということを学びます。おもちゃを毛...

...

LoraHubはレゴのように組み立てることができ、LoRAのモジュール特性を探索することができます。

低ランク適応 (LoRA) は、基本的な LLM が特定のタスクに効率的に適応できるようにする、一般...

人工知能技術の登場によるデジタル変革をどう理解すればよいのでしょうか?

デジタル化は、意思決定レベルから産業レベルまでの変化において中心的な課題になりつつあります。科学技術...

...

...

...

最短経路問題の探究: ダイクストラのアルゴリズム

[[386543]]前回、データ構造としてのグラフについて書きましたが、グラフ アルゴリズムのテスト...

機械学習アルゴリズム入門: 線形モデルからニューラルネットワークまで

最近、「機械学習」という言葉をよく耳にするようになりました(通常は予測分析や人工知能の文脈で)。過去...

AIと機械学習がDevOpsをどう変えるのか

人工知能と機械学習が DevOps に新たな自動化機能をもたらすにつれて、これらのテクノロジーが組織...

IDC、2021年以降のITトレンドトップ10を発表

2020年に世界的に発生したCOVID-19パンデミックによる混乱にもかかわらず、ほとんどの製品やサ...

...

機械学習が詐欺防止に優れたツールである理由は何ですか?

現代技術の発展と向上により、生活はますます快適になりました。以前は複雑な操作を同時に実行することは不...

AIがフィンテックを変える4つの方法

[[432805]]金融業界の企業は、人工知能 (AI) を使用して複数のソースからのデータを分析お...

NTRU 1.2 リリース Java 用 NTRU 暗号化アルゴリズム ライブラリ

NTRU 1.2 バージョンには多くの機能強化とバグ修正が含まれていますが、このバージョンは以前のバ...