MITの新しいAI研究：セーターが編めなくても問題ない、AIにやらせればいい

人工知能といえば、最先端のクールなアプリケーションのほかに、この話題になると「偽物」という言葉が思い浮かぶことがよくあります。一部のグレーな業界に加えて、人工知能を使用した偽造は一種の娯楽になっています。その中で最も有名なのは、おそらくAIによる顔の改造で、これは今でもBilibiliで非常に人気があります。

[[274240]]

それどころか、AI アプリケーションは現実に「本当の」変化をほとんどもたらしていません。しかし、マサチューセッツ工科大学の研究者らは最近、「偽造」とは正反対の AI 研究を発見しました。この種の研究では、AI が実際に何か「本物」、より正確に言えば、編み込まれたものを作り出す必要があります。

この研究はちょっと意外です。機械学習の力を使ってニットウェアを再現するとは誰が想像したでしょうか?

[[274241]]

▲ 画像提供：Shima Seiki USA Inc.

まず、ある疑問に答える必要があります。なぜ、島精機製作所のような自動編み機に任せて「コピー」したり「作成」したりできないのでしょうか？

自分のセーターを何枚か取り出して見てみると、この質問の答えがわかるかもしれません。実は、多くのニット製品の表面は完全に平らではありません。個性的なニーズを満たすために、商人は通常、ニット製品にさまざまな編み模様を作り、これらの模様の織り方は他の場所と異なります。まさにこの「創造性」の部分のせいで、硬直した自動編み機はこのタスクを完了できません。

▲ 画像出典：zdnet

このため、研究者たちは新しいアイデアを思いつきました。自動編み機を使用するには「プログラム」するのに多くの専門知識が必要なので、わかりやすいソフトウェアを使用してプロセスを簡素化し、関連する経験のない人でも作品をアップロードできるようにするというアイデアを思いつきました。

しかし、それでも、指定されたパターンの編み方を設定するには多くの手作業が必要であり、ここで機械学習が興味深いのです。ニューラル逆編みネットワークを通じて、アルゴリズムを通じて編み方のテクニックを学習することができます。実際の編み方はデザインパターンと組み合わされ、自動編み機が認識できる指示に変換されます。このパターンは「計算による織り」と呼ぶことができます。

しかし、補足資料を含む論文で詳しく説明されているように、ニューラルネットワークは 2 つの異なることを計算する必要があります。まず、表示される衣服の理想的な表現を計算し、次に、関連するステッチを計算する必要があります。

[[274242]]
▲ 画像出典：zdnet

まず、ニューラルネットワークに 2 種類のサンプルが入力されました。1 つは著者らが最初から編んでから撮影したニット製品の実際の写真で、もう 1 つはソフトウェアで衣類の画像を合成したものです。合成された画像は、実際の写真よりもシンプルになります。

設計したパターンと実際のパターンを融合させるためには、AIが大きな役割を果たします。

▲ 画像出典：zdnet

次に、IMG2PROG を実行してパターンを命令に変換します。これは、「混合レイヤー」などのパターンの命令のエクスポートをサポートします。プロセスを簡素化するために、プログラム開発者は基本的な編み物技法の 17 個の命令ラベルを定義し、合成パターンにはこれらのラベルが付けられます。次に、ニューラルネットワークとこれらのラベルを使用して、「クロスエントロピー」の最適化が行われます。最後に、マシン統計が完了し、パターンが自動編み機に入力されます。これで完了です。

これが AI の興味深いところです。AI は人間と機械のコミュニケーションの架け橋であり、人間の自然言語、思考、創造性を理解し、それを機械とデジタル世界の言語に変換します。

将来、多くのことの具体的な実装プロセスは理解できないかもしれませんが、十分な想像力があれば、AI がそれを実現するのに役立ちます。

<<: 父親が8歳の娘にディープラーニングを説明する：11の事実

>>: ディープラーニング最適化アルゴリズムがどのように機能するかを知りたいですか?クリックしてください！急いで

Interspeech 2023 | Volcano Engine ストリーミングオーディオテクノロジー: 音声強化と AI オーディオコーディング

MITの新しいAI研究：セーターが編めなくても問題ない、AIにやらせればいい

Interspeech 2023 | Volcano Engine ストリーミングオーディオテクノロジー: 音声強化と AI オーディオコーディング

第14回51CTO中国企業年次選考の結果が出ました！

AIとIoTの完璧な組み合わせ

NeO 360: 屋外シーンのスパースビュー合成のためのニューラルフィールド

スクリーンショットからiPhoneアプリを生成し、コードに変換し、ウェブサイトを作成できます。アップグレード後、Google Bardは本当に

周紅一の2024年大模型予測は8つの点を検証し、ソラの出現は予想を超えていると述べている

AI 駆動型スマートビルは将来のトレンドになるでしょうか?

周洪義：人工知能には多くのセキュリティ上の弱点がある

アメリカがスーパーコンピューティングで世界トップの座を奪還！人類はエクサスケールのスーパーコンピューティングを実現、フロンティアが世界トップ500リストのトップに

推薦する

GPT-3 ハイパーパラメータは単一の GPU で解決できます。まず小さなモデルをトレーニングし、ワンクリックで移行します

拡散モデル画像理解力がSOTAをリフレッシュ！ ByteDance Fudanチームが新たな「メタプロンプト」戦略を提案

この線虫は単純ではありません!脳は高精度に修復され、ダイナミックに前進できる

ほんの数行の Python コードで、将来の子供がどのような外見になるかを予測できますか?強力な人工知能

顔認識は「ワーテルロー」に見舞われ、ビッグデータが将来の方向性を明らかに

人工知能時代の未来の人材をどう育成するか？専門家や名門校の校長はこう言う

インダストリー4.0: ロボットがやってくる

Facebookが開発した高速データ圧縮アルゴリズムZstdの使い方

Mistral と Microsoft が「小さな言語モデル」の波を起こしました。 Mistralのコーディング能力はGPT-4より優れており、コストは2/3に削減されます

機械学習ソートLTR:線形モデルを簡単に始める

真の次元削減攻撃、ソラ、ランウェイ、ピカの比較。衝撃的な効果の背後には、現実世界をシミュレートする物理エンジンがある。