炭素系生物は排除されます! AIがクロスワードパズルで初勝利

炭素系生物は排除されます! AIがクロスワードパズルで初勝利

先週のバーチャルクロスワードパズル「アメリカンクロスワードパズルトーナメント」には1,000人を超える参加者が参加し、その中には印象的な出場者もいました。

そして、クロスワードパズルの競争で人工知能が初めて人間を上回りました。

最新の AI の進歩は、自然言語をコンピューターで理解する可能性を示しているだけでなく、ソフトウェアがどのようにして難解なクロスワードパズルのヒントを解こうとしているかを詳しく調べることで、脳が言語で遊ぶときにどのように動作するかについて新たな洞察が得られます。

シリコンチームのもう一つの勝利!

クロスワードパズルボットのドクター・フィルにとって、これは炭素ベースのプレイヤーたちとほぼ10年間競い合った後の大きな勝利だ。

ドクター・フィルは、クロスワードパズルの作者であるコンピューター科学者マット・ギンズバーグによって作成されました。

フィル博士は 2012 年からアメリカのクロスワード コンテストに非公式に参加しており、毎年ソフトウェアを徐々に改良しています。今年、ギンズバーグ氏は、カリフォルニア大学バークレー校のダン・クライン教授が指導する大学院生と学部生のグループであるバークレー自然言語処理グループと協力しています。

[[398150]]

クライン氏と学生たちは2月にこのプロジェクトに取り組み始め、その後ギンズバーグ氏に連絡を取り、彼らの作品を今年のコンテストに組み込めるかどうか尋ねた。大会の2週間前、彼らは協力して、バークレーのグループのニューラルネットワークアルゴリズム(ヒントを解釈する)とギンズバーグのコード(クロスワードのグリッドを埋める)が連携して動作するハイブリッドシステムを完成させた。

新しく改良された Dr. Fill は、単語を解読する際に慌てているように見えるかもしれませんが、実際には、このプログラムは系統的に動作し、手がかりを分析して、最初にランク付けされた回答候補のリストを作成し、次に、他の回答との一致度などの要素に基づいて可能性を絞り込みます。正しい答えは候補リストの奥深くに埋もれているかもしれませんが、十分なコンテキストがあれば徐々に浮かび上がってくるでしょう。

フィル博士のトレーニングデータは、過去にさまざまなチャンネルに登場したクロスワードパズルから収集されています。パズルを解くために、プログラムはすでに「見た」手がかりと答えを参照します。フィル博士は人間と同じように、新たな課題に直面したときには、過去に学んだことを頼りにし、古い経験と新しい経験のつながりを見つけなければなりません。

たとえば、ウォール・ストリート・ジャーナルのクロスワード編集者マイク・シェンクが作成したコンテストの2番目の問題は、テーマに基づいて新しい空想のフレーズを作成するというもので、長い答えの後に文字「-ITY」が続きます。

フィル博士は幸運だった。なぜなら、珍しい言葉遣いにもかかわらず、答えのいくつかは2010年のロサンゼルス・タイムズ紙の同じテーマのクロスワードパズルに掲載されており、ギンズバーグ氏のデータベースには800万以上のヒントと答えが保存されているからだ。しかし、クロスワード選手権のヒントはまったく異なり、フィル博士は依然として正解を見つけるという課題に直面しています。

フィル博士? 「キル」博士!

すべての答えについて、それがゲームのテーマの一部であるかどうかに関係なく、プログラムは何千もの可能性を試して、ヒントに最も一致する候補を生成し、可能性によってランク付けし、グリッドの制約に照らしてチェックします。最上位の候補が最も適している場合もあります。たとえば、「グループを強制する」というヒントに対して、フィル博士は正解の「配列」を最上位の選択肢としてランク付けしました。 「imposing」という単語は、この単語のヒントには一度も出てきませんが、「impressive」などの同義語は出てくるので、フィル博士は意味的なつながりを推測することができます。

文字を消すと候補を絞り込むのに役立つことが多いため、5文字の答えの2番目の文字がOで、答えのヒントが「Oh, what a shame!」であることがわかれば、正解は「SO SAD」となり、リストの一番上に表示されます。

しゃれやその他の言葉遊びを含むヒントは通常は難しく、通常は先頭に疑問符が付きます。この質問で、「PERISCOPE」は「標準以下?」というヒントを得ましたが、フィル博士は最初混乱しました。主な推測としては、「サブ」はサンドイッチと関係があるということなので、「TUNA ON RYE」のような候補が出てきます。しかし、バークレーのニューラル ネットワーク システムは、疑問符の手がかりによって異常を識別することができます。クライン氏は、疑問符が何らかの意味上のトリックを担っていることをシステムに明示的に教えているわけではないが、機械学習を通じて、通常の手がかりよりも単純ではない選択肢を探す必要があることを徐々に推測できるようになると説明する。

最終的に、フィル博士はクロスワードパズルを1分以内に解くことができ、人間の競争相手よりも2分も早く解くことができました。

しかし、すべての質問に対して完璧だったわけではなく、2 つの質問で不合格となり、最後にエラーがありました。得点ペナルティにもかかわらず、フィル博士の驚異的なスピードは、最速の人間の競技者を上回り、7つの問題を解いた時点でリーダーボードのトップに立つのに十分でした。

炭素系生命は完全に滅ぼされたのでしょうか?

1978年の発足以来、毎年恒例の大会を監督してきたニューヨーク・タイムズのクロスワード編集者ウィル・ショーツ氏は、今年の大会の問題は「それぞれの答えが左から右、上から下にわかりやすい英語で読まれる」ため、フィル博士の強みを生かすかもしれないと指摘した。

ショーツ氏はまた、「フィル博士のプログラミングは非常に洗練されており、非常に難しくて扱いにくいクロスワードパズルを非常にうまく解くことができる」と述べたが、彼はすでに炭素ベースのチームが多くの面でまだ優位に立っていると信じている。「現時点では、クロスワードパズルのような複雑で非論理的な現実世界の問題に対処するのは、まだ人間の方が得意です。そしてフィル博士は、人間にはない方法でいまだに困惑している。 ”

機械学習が進歩し、より多くの質問とトレーニング データがプログラムに入力されるにつれて、フィル博士は今後さらに優れたものになるでしょう。しかし、クライン氏は、自然言語処理の分野で頻繁に発生する課題をさらに多く認識しています。

たとえば、人間の脳は、さまざまな知識を組み合わせて一連の推論を行う「マルチホップ読解」と呼ばれる処理を頻繁に実行します。そして、フィル博士が「sub」という手がかりについて混乱していることからもわかるように、彼の「脳」は、代わ​​りとなる、あまり一般的ではない意味を認識するのにまだ苦労している。たとえば、ニューヨークタイムズの誤解を招くクロスワードのヒントは次のとおりです。「ある意味で王のような」

答えは「MACABRE」です。ここでの「キング」は小説家「スティーブン・キング」を指しているからです。

クライン氏は、フィル博士を、クロスワードパズルの最も難解なヒントから意味を解き明かすための第一歩と見ている。推論の連鎖を伴うような特に扱いにくい言語サンプルに関しては、クライン氏は「人々を困惑させる同じサンプルが、このシステムをさらに混乱させる可能性がある」と述べている。

クロスワードパズルは、言語が単なる単純なコミュニケーションではなく、人格を定義するものであることを示しているため、AI にとってユニークな課題を今後も提示し続けるでしょう。

<<:  あなたが知らないかもしれないゲームにおける AI に関する 5 つの予測

>>:  AIチャットボットが保険業界に革命を起こす

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2021年第1四半期のロボット産業の新製品在庫

2021 年の最初の 3 か月間にロボット業界ではどのような新製品が登場しましたか? [[38857...

機械学習における特徴選択の3つの代替手法

ソレダッド・ガリ翻訳者:趙青棠企画丨孫淑娇、梁策インターネットで「特徴選択」を検索してみると、特徴選...

李菲菲の「具現化された知能」はどこまで進歩したのか?

2009年、当時プリンストン大学に勤務していたコンピューター科学者のフェイフェイ・リー氏が、人工知...

...

クラウド アーキテクチャに生成 AI を追加するためのヒント

デビッド・リンシカム企画 | ヤン・ジェンデータの可用性とセキュリティからモデルの選択と監視まで、生...

...

OpenAIの共同創設者Karpathyがアルパカに恋をする: 赤ちゃんLlama2を実装する純粋なCコード、MacBookが動作可能、1.6kの星を獲得

今週、Meta のオープンソース Llama2 が AI コミュニティ全体で人気を博しました。その結...

アルゴリズムのアルゴリズム: すべての機械学習アルゴリズムはニューラルネットワークとして表現できる

機械学習におけるすべての研究は、ニューラル ネットワークの作成とともに 1950 年代の初期の研究以...

データマイニングのためのK平均法アルゴリズムのグラフィカルな説明

K-means クラスタリング アルゴリズム 中国語名は「K-means クラスタリング アルゴリズ...

投資管理と AI: 顧客関係と投資収益の向上

正直に言うと、顧客はおそらく、投資マネージャーが使用する高度な AI ツールを気にしていないでしょう...

過去 2 週間で AI の進路を変える可能性が最も高い 6 つのリリース!

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)過去 2 ...

完全に無人運転? 2035年より前になる可能性は低いです!

無人運転技術の研究に対する熱意は相変わらず高いが、現実は市場に冷水を浴びせかけている。今後15年間で...

...

自然言語処理のためのディープラーニングの概要: 基本概念から最先端の研究まで

自然言語処理入門導入自然言語処理 (NLP) は、言語を処理および理解することで特定のタスクを実行で...