庚子の年に流行したAIアプリのレビュー

庚子の年に流行したAIアプリのレビュー

2020年にはAIがより広く活用されるようになるでしょう。最先端の新興産業を開拓すると同時に、伝統的な産業にも浸透し、変革に貢献するでしょう。 AIは急速に成長し、私たちの生活に欠かせないものになりつつあり、AIはほぼ誰もが知る名前になりました。

新年を迎え、新たな章が始まるにあたり、過去 1 年間の AI の成果と開発動向を振り返ってみましょう。

AI は私たちを時空を超えて連れて行ってくれます。今年、人工知能分野で最も注目されているプロジェクトの 1 つは、Weibo ブロガーの @大谷 Spitzer が AI を使用して歴史的なビデオや肖像画を復元したプロジェクトです。

まず、今年5月に、彼はDAIN補間アルゴリズム、ESRGAN、DeOldifyなどのAI技術を使用して、100年前の古い北京の白黒ビデオをカラー化し、フレームレートと超解像度を復元し、人々がタイムトラベルして100年前の北京の街の風景を体験できるようにしました。

その後も彼は歴史上の人物の肖像画の「修復」を続けた。 12月にはAIを使って宋、明、清の皇帝の肖像画を作成し、WeChatモーメンツで再び人気を博した。 PaddleGAN、AI Studio、Artbreeder、そして中国科学院が開発した顔認識技術SeetaFaceは、いずれもこれらの頭脳を必要とするタスクに貢献しています。

将来的には、これらのテクノロジーは、映画やテレビ、芸術創作、歴史や文化のコミュニケーションにおいても、より大きな価値を実現するでしょう。

AIが中華民国の北京の街並みのビデオを復元、インターネットで話題に、過去へ連れて行ってくれる

[[383130]]

AIが宋、明、清の皇帝の姿を想像し、4人のモデルが実際の顔の特徴を思い描く

[[383131]]

ロボットを使って犬に命令する
さまざまな種類の犬が、捜索救助、ナビゲーション、運搬、交友、追い払い、警備、家の取り壊しなど、社会における複雑な任務を遂行することができます。では、彼らはロボットの指示を理解して従うことができるのでしょうか?

イェール大学ソーシャルロボティクス研究所は最近、IEEE の Spectrum に新しい研究を発表しました。実験では、ロボットが犬を撫でるために出した命令の方が、人間が犬を撫でるために出した命令よりも犬が従う傾向がありました (奇妙な知識ポイントが追加されました.jpg)。

イェール大学の新しい研究がIEEEに掲載:犬はロボットの命令に従う可能性が高い

[[383132]]

論文の宛先:

https://spectrum.ieee.org/automaton/robotics/robotics-software/dogs-obey-commands-given-by-social-robots

モザイクが数秒でHDに変わる
「モザイク」ピクセルレベルのヘッドショットを高解像度の写真に変換するとどうなるでしょうか?

デューク大学の研究者たちはAIアルゴリズムを使って答えを出しました。彼らが提案したアルゴリズムは、PULSE (Photo Upsampling via Latent Space Exploration) と呼ばれます。

このアルゴリズムは、ぼやけて認識できない顔の画像を、目に見える髪の毛や目尻のしわのレベルに至るまで、これまでよりも細かくリアルな詳細を持つコンピューター生成画像に変換することができます。 PULSE の想像力があれば、感動的な画質に別れを告げることも夢ではありません。

デューク大学は、低品質のモザイクを保存し、数秒で高解像度の画像に変換するAIアルゴリズムを提案しています。

[[383133]]

論文の宛先:

出典: http://arxiv.org/pdf/2003.03808.pdf

機械学習が物理学の不合格リスクを予測
新年が過ぎ、期末試験の結果が出ました。多くの学生は、困惑している物理学の授業に無事合格できるでしょうか?機械学習は実際に事前に予測することができます。

今年8月、ウェストバージニア大学とカリフォルニア工科大学の学者らがarxiv.orgに「機械学習を使用して物理学の授業で最もリスクの高い生徒を特定する」と題する研究を発表し、機械学習アルゴリズムを通じて、基礎物理学の授業を受けた生徒の卒業成績を授業や宿題の成績に基づいて評価できると提案した。

しかし、恥ずかしいことに、その予測精度はランダムな確率とほぼ同じで、わずか57%です...つまり、試験に不合格になるかどうかは、自分の感覚次第です!

期末試験はまだ終わっていないが、アルゴリズムによれば、私は間違いなく大学の物理学のコースで不合格になるだろう

論文の宛先:

https://arxiv.org/abs/2007.13575

5分で顔を変えて神聖な歌を歌おう
以前、小破局の熟練したUpマスターたちは、「一次モーションモデル」のAI顔面変更プロジェクトを利用して、独特なスタイルのさまざまなビデオを生成しました。

ジャッキー・チュン、杜甫、唐僧、パンダ頭絵文字が「ダメダネ」と「Unravel」を感動的に歌います...

Bステーションの神聖な歌「ダメダネ」:本質は顔を変えること、5分で学べる

[[383134]]

この顔を変えるツールを使えば、絵画の中の人物であっても、どんなキャラクターにもどんな表情も与えることができます。さらに、このモデルはオープンソースなので誰でも利用できます。5 分で習得できます。チュートリアルはこちらです:

https://openbayes.com/console/openbayes/public/containers/BwZQj5wr3Jp

論文の宛先:

出典: http://arxiv.org/pdf/2003.00196.pdf

オリジナルプロジェクトのGithubアドレス:

https://github.com/AliaksandrSiarohin/ファーストオーダーモデル

アルコール中毒を検知するスマートフォン
皆さんご存知のとおり、飲酒運転はしないでください。また、飲酒後に運転しないでください。しかし、自分自身をコントロールできない人もいます。

ピッツバーグ大学医学部の主任研究員であるブライアン・サフォレット氏は、熟練したドライバーが飲酒運転をしているかどうかを検知するために、スマートフォンを使って飲酒しているかどうかを検知する方法を論文「スマートフォンの加速度計を使用してアルコール中毒による歩行障害を検知する予備研究」で紹介した。被験者はスマートフォンを携帯し、2ステップのステップを踏むだけで呼気中のアルコール濃度を検知できます。

酔っているかどうかは、スマホを持って散歩すれば分かります。

[[383135]]

<<:  2021年の人工知能の注目分野

>>:  将来、運転手や運転免許証は必要なくなるのでしょうか?自動運転車はどれくらい遠いのでしょうか?

ブログ    

推薦する

機械学習のための3つの主要な学習リソースを丁寧に整理

機械学習はここしばらく話題になっていますが、それには十分な理由があります。機械学習は、将来の行動を予...

ChatGPTのサプライチェーンへの応用の可能性

IT ソリューション プロバイダーの Manhattan Associates のマネージング ディ...

機械学習エンジニアとデータサイエンティストの違い

今日では、データ サイエンティストの仕事は非常に一般的になり、機械学習もその中に完全に含まれる可能性...

...

GPT-4Vと人間のデモンストレーションによるロボットのトレーニング:目が学習し、手がそれに従う

言語/視覚入力をロボットの動作に変換するにはどうすればよいでしょうか?カスタムモデルをトレーニングす...

MITのロボットは、浸透する無線周波数を使って隠れた物体を感知する

[[391062]]海外メディアの報道によると、世界中の研究者がロボットが周囲の状況をよりよく認識...

保険詐欺防止リスク管理の実践

1. 保険業界における詐欺防止に関する問題点とよくある事例保険業界における詐欺問題はますます深刻化し...

...

ビジネス界におけるAIと自動化の変革的役割

人工知能や自動化などの破壊的技術の急速な発展により、現代の企業は変化しています。これらのテクノロジー...

440億ドル!マスク氏がツイッター買収に成功 トランプ氏「アカウントが復活してもツイッターは使わない」

4月26日、海外メディアの報道によると、2週間後、マスク氏によるツイッター買収がようやく決着した。...

...

...

DeepMind がワンクリックで「Mole」言語モデルを起動します。 2,800億のパラメータがSOTAに到達可能

太い眉毛と大きな目を持つ「強化学習の専門家」も、大規模言語モデルに取り組み始めているのでしょうか? ...

GoogleはAIの訓練のために何億人ものアメリカ人のオンラインデータを盗んだとして集団訴訟に直面している

7月13日、新たな訴訟で、Googleがチャットボット「バード」などの人工知能(AI)製品のトレーニ...