謎の AI 顔変更ソフトウェアが世界中のソーシャル ネットワークに侵入!マスク氏は数秒でルネサンス貴族になる

謎の AI 顔変更ソフトウェアが世界中のソーシャル ネットワークに侵入!マスク氏は数秒でルネサンス貴族になる

[[410798]]

FaceAppの人気は過ぎ去り、最近では、あなたの顔を数秒で「ディズニー」に変身させることができる別のアプリが世界中のソーシャルネットワークで人気を集めています。

「AIによる顔の変形」の効果をテストするのに、古くからの友人であるLeCunがいなくてはならなかった。

実際のテスト結果はかなり良好で、確かに「ディズニー」風味が感じられます。「ピクサー スタイル」だと考える人もいますが、ソフトウェアではこれを「3D カートゥーン」と呼んでいます。

LeCun のぼやけたクラシックな写真で 2D 漫画効果を試してみませんか?

解像度が低い場合でも、高品質の出力を生成することができ、「無料」ソフトウェアとしては非常に優れています。

「ディズニー風」のほかに、下の編集者(犬の頭)のような「ルネッサンス風」もあります。

LeCun がまた登場。効果は先ほどの 2D のものよりずっと良く、彼の気質が完璧に捉えられています。

しかし、編集者は大量の写真をテストした結果、このソフトウェアは世論が言うほど強力ではないことを発見しました。たまに、数枚の写真が許容範囲内に収まりましたが、生成された他のほとんどの写真は奇妙に見えました。

トレーニングデータのせいかどうかは分かりませんが、公式が挙げている有名人の事例がとてもすごいです。例えば、このムスクは非常にハンサムに見え、ヨーロッパの貴族の雰囲気を漂わせているようです。

次のような若い女性もかなりハマっています。彼らが同じソフトウェアを使用しているかどうか疑問に思わざるを得ません。

これらの例は、ある意味ではなぜそれほど人気が​​あるのか​​を説明しています。写真に写っている人物を見たことがある人であれば、AI 処理後に基本的に一目で認識できるからです。

Voilà AI Artist とは誰ですか?

「Voilà AI Artist」と呼ばれるこのソフトウェアは、AIアルゴリズムのサポートにより、ポートレート写真をアップロードするだけで、3D漫画(ディズニースタイル)、2D漫画、ルネッサンス絵画、漫画キャラクターの4つのフィルタースタイルの画像を取得できます。

Voilà には有名人の写真のデータベースもあります。アプリで検索して、有名人の顔を入れ替えた効果を直接確認できます。

しかし残念なことに、ユーザーは目や口、髪の毛を調整したり、色やコントラストを変更したりするなど、画像を編集することはできません。

実験室モデルと比較すると、パッケージ化されたアプリケーションは明らかに使いやすい。海外メディアは、このアプリが「ウイルス」のように急速に広がっているとさえ表現した。

VoilàのiOS版は発売から約3か月で、多くの国と地域で無料ランキング1位を獲得し、TikTok、Instagram、Snapchatなどの強力な競合アプリを打ち負かした。

Android 版では、Voilà は Google Play ストアで 1,000 万回以上ダウンロードされ、26 の国と地域で人気チャートのトップ 10 にランクインしています。

公式Facebookアカウントは6月13日、ユーザー数2000万人達成を祝うメッセージを投稿した。

謎の首謀者

「Voilà AI Artist」の親会社は「Wemagine.AI」で、今年1月に英国ロンドンで登記され、設立から2か月も経たないうちにこのアプリをリリースしたと報じられている。

しかし、この会社についてこれ以上詳しい情報はほとんどありません。しかし、フォックス・カロライナは同社に連絡を取ったと述べている。Wemagine.AIは、本社はカナダにあるが、チームは小規模で、世界各地でリモートワークをしていると述べた。

英国の企業検索サイト「Company Check」のデータによると、同社の創設者はリム・エリスカ氏とウィルソン・チョア氏である。さらに、二人ともインドネシアに住んでおり、年齢は35歳以下です。

プライバシーコレクター「Xijiayi」

FaceApp事件以降、ユーザーはこの種のソフトウェアのプライバシー条件にさらに注意を払うようになりました。残念ながら、試してみたい場合は、心の準備を整えてください。以下はそのほんの一部です。

Voilà は、アプリの最終使用から 24 ~ 48 時間後に写真を削除すると主張しており、プライバシー規約では、情報を第三者 (協力者を除く) に提供しないことを明記しています。

また、アプリが最後に使用されてから 24 ~ 48 時間以内に写真とそれに関連付けられた情報を削除するように Google Cloud Platform を構成しました。

当社は、その他の状況においてもお客様の情報を開示することがあります。

当社の子会社および関連会社へ。

当社の事業をサポートする請負業者、サービスプロバイダー、および第三者。

しかし、Voilà は、訪問したウェブサイト、クッキー、携帯電話の機種、写真などのユーザーの個人情報を収集し、協力する広告主に提供していることを認めています。

この使用データには、インターネット プロトコル アドレス (IP アドレスなど)、ブラウザーの種類、ブラウザーのバージョン、お客様がアクセスしたサービスのページ、アクセスの日時、それらのページで費やした時間、デバイス識別子、その他の診断データが含まれる場合があります。

モバイル デバイスを使用してサービスにアクセスする場合、その使用データには、使用するモバイル デバイスの種類、固有のデバイス識別子、モバイル デバイスの IP アドレス、オペレーティング システム、使用するモバイル インターネット ブラウザーの種類、固有のデバイス識別子、その他の診断データなどの情報が含まれる場合があります。

また、Google Analytics を利用して、IP アドレス、デバイス モデル、画面解像度、オペレーティング システム、セッション期間、位置情報などのデータも収集します。このデータに基づいて、お客様のニーズと興味を分析し、サービスを改善します。

アプリの無料版をご利用の場合、アプリ内に広告が表示されます。これらの広告はパートナーによって提供され、アプリの使用状況やオンライン上の他の場所でのアクティビティに基づいてターゲット設定される場合があります。

それに、広告を見たくない場合はどうすればいいでしょうか?当然ですが、会員費を支払う必要があります。 Voilà によると、メンバーシップにより写真処理が高速化され、エクスポートされた画像のアプリ内広告や透かしが削除されるという。

料金は1週間で2.49ポンド(22.3元)、1ヶ月で4.99ポンド(44.6元)、1年で25.99ポンド(232.3元)。

しかし、Appleの中国地域ではこれをまったく販売していないため、国内ユーザーはこの問題を心配する必要はないかもしれない。 Android ユーザーは APK のダウンロード体験を見つけることができます。

生成的敵対ネットワーク

2014 年に Generative Adversarial Networks がリリースされて以来、その応用シナリオはますます広範囲になり、現在では商業的にも利用できるようになりました。

GAN は、ジェネレーター ネットワークと識別器ネットワークで構成されます。

生成ネットワークは潜在空間からランダムにサンプルを入力として取得し、その出力はトレーニング セット内の実際のサンプルを可能な限り模倣する必要があります。

判別ネットワークの入力は、実際のサンプルまたは生成ネットワークの出力です。その目的は、生成ネットワークの出力を実際のサンプルと可能な限り区別することです。生成されたネットワークは、識別ネットワークを可能な限り欺く必要があります。

2 つのネットワークは互いに競合し、パラメータを絶えず調整します。最終的な目標は、判別ネットワークが生成されたネットワークの出力結果が真であるかどうかを判断できないようにすることです。

中でも、NVIDIAが発表したStyleGANが生成した画像は非常にリアルで、ネットワーク内の各レベルの入力を個別に変更することで、大まかな姿勢、顔の形から細かい髪の色まで、そのレベルの視覚的特徴をコントロールできるという。

StyleGANによって生成された顔

StyleGAN は、リアルな肖像画だけでなく、他の動物、車、さらには部屋を生成するためにも使用できます。

アップグレード版のStyleGAN2では、アーティファクトの問題が修正され、生成される画像の品質がさらに向上します。

<<:  最も暑い夏の日がやってきました。ドローンを飛ばすのに最適な時期です

>>:  科学者は機械学習を利用して結晶構造の酸化状態の謎を解明する

ブログ    
ブログ    
ブログ    

推薦する

大規模モデルの推論速度が 3.6 倍に向上しました。「Medusa」の論文はこちらです。Jia Yangqing: 最もエレガントな加速推論ソリューションの 1 つ

ご存知のとおり、大規模言語モデル (LLM) の動作ロジックでは、サイズが大きくなるにつれて言語生成...

Baidu のディープラーニング プラットフォーム PaddlePaddle フレームワークの分析

PaddlePaddleは、Baiduが2016年8月末に一般公開したディープラーニングプラットフォ...

自然言語処理(NLP)の歴史と方向性

自然言語処理の歴史は紆余曲折に満ちた物語です。それは無駄な研究から始まり、何年にもわたる実りある研究...

...

...

人工知能と機械学習: フィンテック業界の新たな青写真

企業は AI と機械学習を十分に活用していません。フィンテック業界で人工知能(AI)と機械学習(ML...

AI 実装の倫理的な展開をどのように確保するか?

人工知能や機械学習などの自動化および機械技術の驚異的な成長は、間違いなく組織にまったく新しいレベルの...

自然言語処理必読本: 理論と実践のバランスが取れた 5 冊の本

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

インテリジェントロボットはCOVID-19の流行とどのように戦うのでしょうか?

【51CTO.comオリジナル記事】 COVID -19の流行がもたらした厳しい課題に直面して、科...

アジャイル開発が機械学習に役立つ5つの方法

[51CTO.com クイック翻訳] フレームワークと方法として、アジャイル開発は現在、ソフトウェア...

ロボットが高齢者の在宅生活を変える

ほとんどの人がロボットについて考えるとき、映画に出てくる歩くロボット、掃除機、産業用ロボットなどを想...

...

ビル・ゲイツ: 生成AIは限界に達した

ビル・ゲイツ氏の暴露は機械学習コミュニティで話題となっている。 「GPT-5 は GPT-4 よりそ...

絶対に対立なんかじゃない!短期的にはAIが人間に取って代わることができない5つの分野

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

予想外だが妥当: ガートナーの 2020 年データ サイエンスおよび機械学習プラットフォームのマジック クアドラントの解釈

最近、ガートナーはデータ サイエンスおよび機械学習 (DSML) プラットフォームに関するマジック ...