MITの新しいAI研究:セーターが編めなくても問題ない、AIにやらせればいい

MITの新しいAI研究:セーターが編めなくても問題ない、AIにやらせればいい

人工知能といえば、最先端のクールなアプリケーションのほかに、この話題になると「偽物」という言葉が思い浮かぶことがよくあります。一部のグレーな業界に加えて、人工知能を使用した偽造は一種の娯楽になっています。その中で最も有名なのは、おそらくAIによる顔の改造で、これは今でもBilibiliで非常に人気があります。

[[274240]]

それどころか、AI アプリケーションは現実に「本当の」変化をほとんどもたらしていません。しかし、マサチューセッツ工科大学の研究者らは最近、「偽造」とは正反対の AI 研究を発見しました。この種の研究では、AI が実際に何か「本物」、より正確に言えば、編み込まれたものを作り出す必要があります。

この研究はちょっと意外です。機械学習の力を使ってニットウェアを再現するとは誰が想像したでしょうか?

[[274241]]

▲ 画像提供:Shima Seiki USA Inc.

まず、ある疑問に答える必要があります。なぜ、島精機製作所のような自動編み機に任せて「コピー」したり「作成」したりできないのでしょうか?

自分のセーターを何枚か取り出して見てみると、この質問の答えがわかるかもしれません。実は、多くのニット製品の表面は完全に平らではありません。個性的なニーズを満たすために、商人は通常、ニット製品にさまざまな編み模様を作り、これらの模様の織り方は他の場所と異なります。まさにこの「創造性」の部分のせいで、硬直した自動編み機はこのタスクを完了できません。

▲ 画像出典:zdnet

このため、研究者たちは新しいアイデアを思いつきました。自動編み機を使用するには「プログラム」するのに多くの専門知識が必要なので、わかりやすいソフトウェアを使用してプロセスを簡素化し、関連する経験のない人でも作品をアップロードできるようにするというアイデアを思いつきました。

しかし、それでも、指定されたパターンの編み方を設定するには多くの手作業が必要であり、ここで機械学習が興味深いのです。ニューラル逆編みネットワークを通じて、アルゴリズムを通じて編み方のテクニックを学習することができます。実際の編み方はデザインパターンと組み合わされ、自動編み機が認識できる指示に変換されます。このパターンは「計算による織り」と呼ぶことができます。

しかし、補足資料を含む論文で詳しく説明されているように、ニューラル ネットワークは 2 つの異なることを計算する必要があります。まず、表示される衣服の理想的な表現を計算し、次に、関連するステッチを計算する必要があります。

[[274242]]
▲ 画像出典:zdnet

まず、ニューラル ネットワークに 2 種類のサンプルが入力されました。1 つは著者らが最初から編んでから撮影したニット製品の実際の写真で、もう 1 つはソフトウェアで衣類の画像を合成したものです。合成された画像は、実際の写真よりもシンプルになります。

設計したパターンと実際のパターンを融合させるためには、AIが大きな役割を果たします。


▲ 画像出典:zdnet

次に、IMG2PROG を実行してパターンを命令に変換します。これは、「混合レイヤー」などのパターンの命令のエクスポートをサポートします。プロセスを簡素化するために、プログラム開発者は基本的な編み物技法の 17 個の命令ラベルを定義し、合成パターンにはこれらのラベルが付けられます。次に、ニューラル ネットワークとこれらのラベルを使用して、「クロス エントロピー」の最適化が行われます。最後に、マシン統計が完了し、パターンが自動編み機に入力されます。これで完了です。

これが AI の興味深いところです。AI は人間と機械のコミュニケーションの架け橋であり、人間の自然言語、思考、創造性を理解し、それを機械とデジタル世界の言語に変換します。

将来、多くのことの具体的な実装プロセスは理解できないかもしれませんが、十分な想像力があれば、AI がそれを実現するのに役立ちます。

<<:  父親が8歳の娘にディープラーニングを説明する:11の事実

>>:  ディープラーニング最適化アルゴリズムがどのように機能するかを知りたいですか?クリックしてください!急いで

ブログ    

推薦する

GPT-3 ハイパーパラメータは単一の GPU で解決できます。まず小さなモデルをトレーニングし、ワンクリックで移行します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

拡散モデル画像理解力がSOTAをリフレッシュ! ByteDance Fudanチームが新たな「メタプロンプト」戦略を提案

テキストから画像への (T2I) 拡散モデルは、大規模な画像とテキストのペアで事前トレーニングされて...

この線虫は単純ではありません!脳は高精度に修復され、ダイナミックに前進できる

最高精度の「線虫脳」、ここに登場。この「脳」は、Caenorhabditis elegans 線虫の...

ほんの数行の Python コードで、将来の子供がどのような外見になるかを予測できますか?強力な人工知能

今回はBaidu Smart Cloudの顔認識機能とPythonを組み合わせて実験してみました。結...

...

顔認識は「ワーテルロー」に見舞われ、ビッグデータが将来の方向性を明らかに

顔認識技術の利用が増えるにつれ、さまざまなリスクが徐々に明らかになってきています。 CCTVの「3....

...

人工知能時代の未来の人材をどう育成するか?専門家や名門校の校長はこう言う

人工知能の時代、未来の人材をどう育成するか? 10日、2019年重慶人材大会第4回大学・高校教育発展...

インダストリー4.0: ロボットがやってくる

Robotics as a Service は、産業用 IoT (IIOT) 内でますます注目を集め...

...

...

Facebookが開発した高速データ圧縮アルゴリズムZstdの使い方

[51CTO.com クイック翻訳] Zstandard (Zstd とも呼ばれる) は、Faceb...

Mistral と Microsoft が「小さな言語モデル」の波を起こしました。 Mistralのコーディング能力はGPT-4より優れており、コストは2/3に削減されます

最近、「小さな言語モデル」がにわかに話題になっています。今週月曜日、4億1500万ドルの資金調達を完...

機械学習ソートLTR:線形モデルを簡単に始める

[[207297]] LTR のエントリーレベルのモデルは線形モデルです。この記事では線形モデルを例...

真の次元削減攻撃、ソラ、ランウェイ、ピカの比較。衝撃的な効果の背後には、現実世界をシミュレートする物理エンジンがある。

昨日、OpenAI は初のテキスト生成ビデオ モデル Sora をリリースし、コミュニティに衝撃を与...