オタクなおじさんが独学でAIを学んでマスターレベルを作成し、Twitterで人気になった

オタクなおじさんが独学でAIを学んでマスターレベルを作成し、Twitterで人気になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、佐藤さんという日本のオタクおじさんが、AIで似顔絵を生成する「AI画伯」というウェブサイトを開設した。10日間でユーザー訪問数が0から100万に増加し、Twitterで大騒ぎとなった。

使い方はシンプルで簡単です。顔写真をアップロードするだけで、マスターレベルの肖像画を生成できます。

技術以上にすごいのは佐藤さん自身です。自分でAIを学んで作り出したのですから。オタクの創造力には感心するしかありません。

佐藤さんはアスペルガー症候群を患っています。アスペルガー症候群は一般に「社会恐怖症」とも呼ばれ、まさに天才病です。一般的に、このような患者は特定の分野で特別な才能を発揮しますが、普通の人々の生活に適応することができません。

もちろん佐藤のスキルポイントはAIに集中しています。

pix2pix、TensorFlow に組み込まれた cGAN モデル

今回有名になったAI技術は、かの有名なGANの変種です。

今回の顔写真生成技術は、TensorFlow に組み込まれている cGAN (条件付き敵対的生成ネットワーク) 内のpix2pixモデルをベースにおじさんが改良したものです。

GAN の技術的な汎用性とは異なり、cGAN は特定のシナリオでのパフォーマンスを重視しています。たとえば、AI Gahaku は人間の顔のみをターゲットにできます。ユーザーが猫の顔をアップロードした場合、結果を生成することはできません。

GAN の特徴は、損失関数の自己計算と自動更新であり、GAN 自体が転移学習と組み合わせられる可能性を秘めています。近年の開発の軌跡から判断すると、GAN は転移学習によって提案された目標を達成するための手段としてより多く使用されています。転移学習は、GAN の応用に具体的な方向性を提供します。

TensorFlow に組み込まれている pix2pix は、cGAN に基づいた画像間変換モデルです。モデル自体は成熟しており、直接呼び出して白黒画像の色付けや画像スタイルの変更などのシナリオに適用できます。

叔父の pix2pix モデルの使用について具体的に言えば、彼は実際にモデルをマスター ポートレートの生成に限定しており、これはモデル自体の強力なスケーラビリティも反映しています。

どのように使うかはあなた次第です。

佐藤さんの他の作品「PixelMe」でもpix2pix技術が使われていますが、8ビットのピクセルスタイルのアバターが生成され、1つのモデルで複数の用途に使用できます。

もちろん、実際の結果は人によって異なります。結局のところ、厳密に言えば、既存のモデルの二次開発を行っています。元のアルゴリズムとデータ構造は変更されていないため、パフォーマンスと効果は元のモデルによって制限されます。

オタクのAI進化の旅

叔父の人生経験は複雑だと言える。大学を中退した後、パン屋で働き、看護学校の養成コースに参加したが、どれも自分には向いていないと感じ、自分の才能を生かしてAIの道に進むことを決意した。

[[338339]]

それでは、TensorFlow の学習を始めましょう。

Google Colab のコンピューティング リソースの助けを借りて、おじさんは TensorFlow チュートリアルに従ってゼロから始めました。しかし、おじさんは AI には向いていますが、ケーキを蒸すのには向いていません。

学習の過程で、佐藤さんは自分に合った方向性を見つけました。転移学習とGANは、画像再生をよりうまく実現できます。さまざまな画像トレーニングデータセットを使用して、特定のシナリオを学習および生成できます。

GAN は典型的な教師なし学習法です。その基本原理は、2 つのニューラル ネットワークを「互いに競争」させ、パラメータを継続的に最適化することで最良の結果を得て、自己ゲームを実現することです。

この技術は主にコンピュータービジョンの分野で使用されており、佐藤氏がGANを選んだ主な理由でもあります。

Google の寛大さのおかげで、叔父が使用するウェブサイトのサーバーとコンピューティング リソースは、1 日あたり約 20 ドルと比較的安価です。叔父は、許容できる容量の範囲内であれば、短期的には商用化を求めないと述べました。

みんなのためのAI!

有名になってからも、叔父は浮かれることはなかった。

彼はそれを金銭的利益のためではなく、自分が興味のあることとして捉えている。

テクノロジーに対する情熱から佐藤氏は独自の AI の旅を始め、2 年後にはオンラインでアプリケーションを立ち上げることができました。

夢に向かってあきらめずに努力するこの精神こそが、本当に学ぶ価値のあるものです。

結局のところ、誰もが AI を独学する勇気を持っているわけではありません。

<<:  AIoT分野におけるセキュリティリスクを知っておく必要があります!

>>:  クラウドコンピューティング機械学習プラットフォームの選び方

推薦する

...

Google に行ったが、ディープラーニングはできなかった。Facebook の Tian Yuandong が人生の課題と選択について語る

初めての15分間のスピーチの準備に2か月を要し、卒業後すぐにGoogleに入社したものの歯車の一部に...

6軸産業用ロボットの制御方法と特性

[[187760]]産業用ロボットは、産業分野における多関節マニピュレータまたは多自由度機械装置です...

工場に産業用 IoT テクノロジーを導入する 5 つの理由

モノのインターネット(IoT)はどこにでもあります。実際、ここ数年、スマート製造、サプライ チェーン...

Daguan Data: NLP の概要と自動テキスト分類アルゴリズムの詳細な説明

自然言語処理は人工知能の分野で常に重要なトピックであり、2018年も話題となりました。大量のテキスト...

...

内部テスト中です! Word、Excel、Outlookに機械学習が搭載される

マイクロソフトは、機械学習を使用して人々がより効率的に仕事を遂行できるよう支援する、多数の新機能を ...

データ サイエンティストに Kubernetes クラスターの管理を任せるのはやめましょう…

[[317899]]生産機械学習には組織的な問題があります。この問題は、生産機械学習の比較的新しい...

アルゴリズムから離れた「ジレンマ」に直面し、専門家はシナリオベースの洗練されたガバナンスの実行を提案している。

アルゴリズムは人間の行動に基づいて「ロックイン効果」を生み出します。この法律では、ユーザーにパーソナ...

データセキュリティリスクのため、米国宇宙軍はChatGPTなどの人工知能ツールの使用を一時停止

ロイターが確認したメモによると、10月12日、米宇宙軍はデータセキュリティに関する懸念から、職員によ...

iCubヒューマノイドロボットは目を動かしたり、話したり、人を抱きしめたりすることができ、今回は遠隔操作も可能だ

2011 年には、子供のような iCub ヒューマノイド ロボットについて耳にしていました。これは次...

Java はなぜ機械学習やディープラーニングを実際にサポートできないのでしょうか?何が欠けている?

チームに ML を導入させるにはどうすればよいのでしょうか。また、実行している既存のシステムと ML...

【文字列処理アルゴリズム】回文判定のアルゴリズム設計とCコード実装

1. 要件の説明文字列を入力し、その文字列が回文であるかどうかを判断するプログラムを作成します。便宜...

ガートナー:2025年にはベンチャーキャピタル投資の75%がAIを活用する

報道によると、権威ある調査機関ガートナーは本日発表したホワイトペーパーで、投資家による人工知能(AI...

自動運転が何千もの家庭に普及するまでにどれくらいの時間がかかるのでしょうか?

2019年9月に百度、海亮科技、センスタイムなどの企業が世界初の自動運転車の商用ライセンスを取得し...