芸術作品の分類と分析は難しいことで知られており、ごく少数の専門家だけが発言権を持ち、この分野への人工知能の応用は長い間空白のままでした。しかし最近、いくつかの研究グループが機械学習と大規模な美術作品のデータベースを組み合わせて、作品を意味のある方法で分類し、説明しようと試みています。 まず、杭州にある浙江理工大学の研究者らが、複数のニューラルネットワークを比較し、芸術作品の分類におけるパフォーマンスを調べた。研究者たちは、WikiArt やその他のデジタル コレクションの画像を使用してニューラル ネットワークをトレーニングし、特定の芸術ジャンルの絵画間にどのような共通点が存在するかをモデルが理解できるようにしました。これを基に、研究者たちはさらに異なるニューラルネットワークモデルを使用して他の絵画の芸術的スタイルを識別しようと試みました。 明らかに、この作業は人間にとっても困難です。一部の絵画は、その絵画手法に非常に強いスタイルとジャンルの特徴があり、比較的簡単に識別できます。ニューラル ネットワークにとって、キュビズム派に属する作品を見つけることは問題ではありません。実際の問題は、いくつかの流派が互いに非常に類似しており、絵画制作過程における表現ポイントさえも非常に一貫しているため、プログラムが正確な判断を下すことが困難であることです。
▲ ドイツ・ベルリンで開催中の展覧会で展示されているフィンセント・ファン・ゴッホの『星月夜』。人工知能もこの研究を利用して芸術のジャンルを分類しようとしています。 さらに、芸術作品を分類するニューラル ネットワークは、都市の風景と自然の風景の違いを区別するなど、人間にはまったく影響のない多くの細かい点に直面します。人間は建物と自然の景色を何の考えもなく区別できますが、コンピューターにとってはどちらも典型的な「屋外」の要素を表しているように見え、屋外を定義する主要な特徴である「雲」と「空」は、モデルが写真の内容を真に理解するのに役立ちません。 人間の芸術愛好家にとって、芸術作品がどのジャンルまたはカテゴリーに属するかを知ることは、比較的直接的かつ客観的な判断です。ニューラルネットワークと同様に、多数の芸術作品を調べて、同じジャンルの作品に共通するパターンを見つけることができます。しかし、人間と比較すると、コンピューターがさらに一歩進んで、芸術についての独自の意見を形成し、それに対する感情を言葉で共有することは困難です。しかし、それは単に難しいだけでしょうか、それとも不可能なのでしょうか? 人工知能の基礎はトレーニングデータから生まれます。したがって、芸術的スタイルについての意見や感情的な発言を形成することを AI に教えるためには、さまざまな芸術作品についての説明コンテンツを確立するために、依然として多くの人的資源を投入する必要があります。スタンフォード大学、エコール・ポリテクニーク、キング・アル・カドゥッラー科学技術大学の研究者らは、試してみることにし、WikiArt から収集された 8 万点以上の絵画の 40 万以上の感情属性と説明を含む ArtEmis データセットを作成しました。 ArtEmisデータセットを作成するために、研究チームはボランティアに芸術作品についての直感的な感情を共有し、言葉でコメントするよう依頼しました。ご想像のとおり、同じ作品に対しても人によってまったく異なる感想を持つことはよくあります。あなたの目に映る平和で穏やかな野原の光景は、私の目には憂鬱で陰鬱に見えるかもしれません。実際、同じ絵画に対して肯定的な感情と否定的な感情の両方を抱くというパターンは非常に一般的であり、ArtEmis データベース内のすべての絵画の 61% を占めています。 次に、AIのパフォーマンスに依存します。 ArtEmis データセットでトレーニングした後、各 AI システムは特定のアート作品のタイトルを生成しようとしました。結果の中には説得力のあるものもあるが、ほとんどは完全に的外れだ。例えば、レンブラントの絵画「洗礼者ヨハネの斬首」に対する AI の説明には、「女性は幸せそうに見える」や「真ん中の男性は惨めそうに見える」などが含まれていた。写真のシーンと合わせると、これは明らかにナンセンスです。
▲ AIアルゴリズムが写真から識別した人間の感情に基づいて画像の説明を生成します。このアルゴリズムは、レンブラントの『斬首された洗礼者ヨハネ』を「女性は幸せそうに見える」と「真ん中の男性は惨めそうに見える」と表現した。 しかし、良いニュースとしては、コンピューターで生成された説明の約半数がチューリングテストに合格したということです。つまり、AI は実際に、オリジナルの芸術作品の説得力のある説明を生成することを学習できるということです。しかし、現状は完璧からは程遠い。結局のところ、ニューラルネットワークでは、絵画が自然の風景なのか都市の風景なのかを正確に判断することが難しいのだ。 多くの芸術作品は本質的に分類が難しく、絵画に対する人々の見方は極めて主観的であるため、人工知能が私たちの分類や説明の方法を理解するのがさらに困難になることを認識する必要があります。しかし、最新の研究によれば、コンピューターは特定のタスクの処理能力が向上していることが明らかになっています。芸術作品を分類し説明する能力は、おそらくまだ人間には及ばないかもしれませんが、AI プログラムはすでに追いつきつつあります。 |
<<: 人工知能に関するあまり知られていない3つの事実!古代中国にロボットは存在したのでしょうか?
>>: フードデリバリーロボット市場は11.6億規模に到達。美団は「台頭」するか?
ChatGPTの誕生により、2023年には大規模言語モデルに基づくAIの波が起こりました。それ以来...
人工知能チャットボット「ChatGPT」は最近非常に人気が高まっており、あらゆるメディアでそのニュー...
6月30日、北京地下鉄の改札口でデジタル人民元が支払いに使えるようになる。「孔坊兄弟」は再び変身し...
2021 年には、これらのトレンドがさらなるイノベーションをもたらし、新たな機会の扉を開き、私たちの...
教師あり機械学習モデルを一日中トレーニングすることはできますが、そのパフォーマンスを評価しなければ、...
機械学習の分野では、コンセプトドリフトという問題が長い間研究者を悩ませてきました。つまり、データの分...
[[374436]] 1.1 中国の数千万規模のインテリジェント交通プロジェクトの競争環境中国投資産...
顔認識技術がさまざまな分野で持つ大きな可能性は、ほとんど想像できないほどです。ただし、使用する前に、...
2023年の人工知能分野でキーワードを1つだけ選ぶとしたら、それはおそらく「ビッグモデル」でしょう。...
[[181277]]オーストリアの記号計算研究所 (RISC) の Christoph Koutsc...
時系列予測は永続的なトピックです。自然言語処理の分野での成功に触発されて、トランスフォーマー モデル...