GPT-4は97回の対話で世界の諸問題を探り、P≠NPという結論を導き出した。

GPT-4は97回の対話で世界の諸問題を探り、P≠NPという結論を導き出した。

科学研究の分野で働く人なら、P/NP 問題についてはある程度聞いたことがあるでしょう。この問題は、クレイ数学研究所のミレニアム懸賞問題に含まれていました。この中には、よく知られているポアンカレ予想やリーマン予想を含む 7 つの主要な問題が含まれています。同団体はまた、この問題を解決できる研究者に100万ドルの報奨金も提供している。

P/NP 問題は、1971 年に Stephen A. Cook と Leonid Levin によって初めて提案されました。長年にわたり、多くの人々がこの問題の研究に専念してきました。しかし、P=NP の解決には控えめに言ってもあと 100 年かかるかもしれないと言う人もいます。

近年、P が NP に等しいか等しくないかを証明したと主張する人が多数いますが、証明のプロセスに誤りがありました。今のところ、誰もこの質問に答えられていません。

現在、AI技術の発展、特に過去1年間の大規模言語モデルの急速な反復により、AI技術を使用してこれらの世界の問題を解決しようとする研究がいくつか始まっています。

この論文では、マイクロソフト リサーチ、北京大学、北京航空航天大学などの研究者が、大規模言語モデル (LLM) を使用して P 対 NP 問題の研究を強化し、加速することを提案しました。

具体的には、この論文では、LLM が深く考え、複雑な問題を解決できるようにする一般的なフレームワーク、つまりソクラテス的推論を提案しています。このフレームワークに基づいて、LLM は問題を再帰的に発見、解決、統合すると同時に、自己評価と改善も行うことができます。

P対NP問題に関する私たちのパイロット研究では、GPT-4が証明パターンを正常に生成し、97ラウンドの対話で厳密な推論を実行し、「P≠NP」という結論に達したことが示されました。これは、(Xu and Zhou、2023)の結論と一致しています。

論文アドレス: https://arxiv.org/pdf/2309.05689.pdf

この論文の貢献は次のように要約できます。

  • LLM は、複雑な科学的課題に対処するために人間との共同パートナーとして使用され、「科学のための LLM (LLM4Science)」パラダイムが提案されています。
  • LLM が演繹、変換、分解などのパターンを使用して批判的思考を刺激することを奨励するために、「ソクラテス的推論」と呼ばれるフレームワークを導入します。
  • GPT-4 とソクラテス推論フレームワークを使用してパイロット スタディを実施し、理論コンピュータ サイエンスにおける P 対 NP 問題を解決します。
  • GPT-4は証明パターンを正常に生成し、97回の対話ターンで厳密な推論を実行し、P≠NPと結論付けました。これは、XuとZhou(2023)の最近の研究と一致しています。
  • この研究は、GPT-4 などの LLM が新しい知識を推論し、人間と協力して複雑な専門家レベルの問題を探索する可能性を示しています。
  • この論文では、特定のタスクに合わせて調整された従来の特殊な AI モデルとは異なり、LLM がドメイン全体にわたる汎用的なイノベーション リーダーであることを強調しています。
  • LLM の自然言語と数学言語を流暢に使用できる能力は、学際的な発見に不可欠です。
  • この研究は、LLM をパートナーとして活用して、多様な分野にわたる科学研究を強化および加速する方法を明らかにしています。

記事によると、彼らは古代ギリシャの哲学者ソクラテスにインスピレーションを受けたため、このフレームワークを「ソクラテス的推論」と名付けたとのこと。ソクラテスはかつてこう言いました。「私は誰にも何も教えることはできない。考えさせることしかできない。」 このフレームワークの全体的な設計思想もこれと同じです。これは、LLM が幅広いソリューション空間をナビゲートし、効率的に答えを導き出せるようにする、一般的な問題解決フレームワークです。

表1に示すように、「ソクラテス的推論」には演繹、変換、分解、検証、統合の5つのプロンプトモードがあります。これらのパターンは、新しい洞察や視点を発見し、複雑な問題をサブ問題や小さなステップに分解し、チャレンジレスポンスの回答を通じて自己改善するために使用されます。

より小さな問題 (原子問題) では、LLM は推論結果を直接与えることができます。この場合、演繹モデル (たとえば、「ステップごとに考えてみましょう...」というプロンプト) を使用して、LLM が直接結論を導き出すようにガイドします。

より複雑な問題の場合、この論文ではまず LLM が問題を新しい問題に変換するか、いくつかのサブ問題に分解することを要求します。これらのパターンは、アトミック ji 問題に到達するまで再帰的に実行されます。

新たな疑問が生じたり、新たな結論に達したりした場合は、検証モードが採用され、LLMの自己評価能力を使用してそれらを検証し、改善します。

最後に、融合モードでは、LLM がサブ質問の結果に基づいて結論を統合する必要があります。

動機付け LLM は、対象の問題が解決されるまで、一連の対話を通じて上記のプロセスを再帰的に継続します。

この作品では、ソクラテス的推論が、困難な問題に対する体系的なプロンプトの枠組みを提供します。

次の図は、「ソクラテス的推論」で P 対 NP 問題を解決するために使用される対話の例です。ケーススタディでは GPT-4 API が使用され、論文ではラウンドインデックスに基づいてパイプラインをソートすることも行われました。

この論文では、調査中に、補助証明者として 5 つの異なる役割 (確率論に精通した数学者など) を紹介しています。この実験を完了するために合計 97 ラウンドの対話が実施され、最初の 14 ラウンドの対話と最後の 83 ラウンドの対話に分けられました。

たとえば、最初のラウンドのプロンプト: P!=NP の背後にある根本的な問題を見つけることができますか?コンピュータ理論の観点からではなく、哲学的な観点から。

その他のヒントは次のとおりです:

会話は続き、最後の会話は次のようになりました。最終的に、P≠NPという結論が出されました。

興味のある読者は、詳細については原文論文を参照してください。

<<:  TensorFlowはWindows GPUのサポートを放棄し、多くのバグを抱えていると批判されている。2.0以降は徐々に消滅していくだろう。

>>:  Appleのスマートホームアプリに新機能「クリーンエネルギークエリ」が追加

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

5G悪報セキュリティ管理プラットフォームにおけるディープラーニングに基づくテキスト感情認識技術の応用

著者: Sun Yue、所属部署: 中国移動 (杭州) 情報技術有限公司 | 中国移動杭州 R&am...

...

人工知能が企業のバックオフィスへの参入を加速

人工知能は、あらゆる種類の企業のバックオフィスに大きく浸透しつつあります。バックオフィスは、ビジネス...

...

QQがスーパーQQショーを開始:3D HDモデルが顔認識AIフェイスピンチをサポート

2月10日、QQ誕生23周年にあたり、テンセントQQチームは、これまでのテスト段階を経て、スーパー...

LangChain の実践: 大規模言語モデルのコードベースの理解

著者 | 崔昊レビュー | ChonglouまとめLLM(大規模言語モデル)の開発に伴い、ソースコー...

衛星と機械学習はどのようにして海洋のプラスチック廃棄物を検出できるのでしょうか?

プラスチック廃棄物が海洋生物にとって常に恐ろしい脅威となっていることは誰もが知っているはずです。しか...

顔認識は常に私たちのそばにあり、中秋節は「ハッピースキャン」から始まります

[[424699]]中秋節が近づいており、旅行の計画を立てている方も多いと思います。この特別な期間中...

クレイジーすぎる、GPTsがオンライン:ウルトラマンがマスクの大型模型の手こすりを披露、誰かがサードパーティのマーケットを作った

数日前の開発者会議で、OpenAIは、メンバーシップを購入すれば、GPT-4大規模モデルの新バージョ...

...

...

あなたは人工知能/機械学習についてどれくらい知っていますか?

[[188835]]クイズ番組やマンマシン囲碁で人間に勝ったり、広告で人種差別的な偏見を示したとし...

チューリング賞受賞者のベンジオが新論文を発表、Redditがクラッシュ: アイデアがクラッシュ

[[403771]]機械学習における重要な研究はモデルの一般化を改善することであり、モデルをトレーニ...

画像セグメンテーションのためのディープラーニング: ネットワークアーキテクチャ設計の概要

この論文では、画像セマンティックセグメンテーションに CNN を使用する際のネットワーク構造の革新に...

LLM収益化プラットフォームが登場! LangChain+DemoGPT 協力: アイデアがあればお金が稼げる、「プログラマーが足りない」時代は終わった

大規模な言語モデルのサポートにより、開発者は多くの新しい機能を実装し、より幅広いアプリケーション シ...