大学卒業後、彼はGoogleに入社し、先駆的な作品「Thinking Chain」を執筆した。このOpenAIの新人は、学部生の質問に答えている。

「思考の連鎖（CoT）」の概念を注意深く研究したことがあるなら、おそらく Jason Wei という名前を聞いたことがあるでしょう。

写真

彼は、思考連鎖の概念に関する先駆的な研究である「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」の第一著者であり、大学卒業後に Google に入社しました。そこで彼は、思考連鎖ヒントの概念を普及させ、命令チューニングに関する初期の研究を共同で主導し、Yi Tay、Jeff Dean らとともに大規模モデルの出現力に関する論文を共同執筆しました。

写真

Jason Wei などの著者は、思考の連鎖を一連の中間推論ステップとして定義し、大規模な言語モデルが複雑な推論を実行する能力を向上させることを目指しています (より複雑な推論問題をステップに分解し、最終的な答えをステップごとに得ることによって)。 Jason Wei らによる論文は、連鎖思考を促すと相転移現象が発生することを初めて発見したものであり、大規模モデルが小規模モデルを大幅に上回る性能を示しており、さらに新たな能力の発見につながりました (「複雑な推論: 大規模言語モデルの北極星能力」で引用)。現在、思考連鎖プロンプトは大規模モデルの分野で広く使用されています。

2023 年の初めに、彼は OpenAI に入社し、他の技術者とともに ChatGPT を構築することを選択しました。

こうした熱心な学術的業績のおかげで、ジェイソン・ウェイの引用数は 8,000 件近くに達しました。

写真

若き学術界の新星として、ジェイソン・ウェイは最近多くの質問を受けています。これらの質問のほとんどは学部生から寄せられたもので、彼らが学業の初期段階で抱えている混乱の一部を表しています。 Google ドキュメントで、Jason Wei がこれらの質問のいくつかに答えています。この記事では、同じような疑問を抱いている学生たちの役に立つことを願って、こうした質問のいくつかを抜粋します。

写真

Q: AI への取り組みはどのように始まったのですか?

A: 皆さんは2022年の私の仕事を通じて私をご存知だと思いますが、私は2017年からAIの分野で働いています。

ダートマス大学の学部生だった頃、私は当初ウォール街の銀行家になりたいと思っていました。それは私の両親の世代のアメリカンドリームであり、私の故郷のほとんどの友人の選択でもありました。しかし、大学1年生（2017年）のときに金融のインターンシップを見つけるのは難しく、結局、母の友人を通じて知り合ったAIスタートアップ企業で働くことになりました。

その夏、私はマイケル・ニールソン著『ニューラルネットワークとディープラーニング』を読んで初めて AI に出会いました。私はバックプロパゲーションアルゴリズムについて学び、あらゆる種類の入力データと出力データから任意のマッピングを学習するというアイデアに魅力を感じました。この分野に対する私の情熱は、学校で学んだ他のどの科目よりも桁違いに大きかったことを今でも覚えています。

2010年代後半は論文を出版することが流行っていたので、大学時代にそれをやろうとしました。私はいつものやり方で機械学習のコースを受講し、そのコースを担当した教授に研究の指導を依頼しました。私は2年間、医療画像解析のためのディープラーニングの分野で働いてきました。私の研究結果は良好ですが、驚くほどではありません。ダートマスには活気のある AI 環境が存在せず、志を同じくするコミュニティを見つけるのは困難です。ですから、私は実際に AI に興味を持っている少数の人々に本当に感謝していますし、サム・グレイダナスは私が尊敬する人物です。

卒業が近づくにつれ、私は博士号とソフトウェアエンジニアリングの両方の職に応募しました。私は優れた論文を主要な学術会議に受理してもらい、すべての博士課程に受け入れられるだろうと思っていました。その結果、私は南カリフォルニア大学（USC）を除くほぼすべての学校から不合格になりました。大学3年生の夏休みに、BlendとDoorDashでインターンをしましたが、私は優秀なソフトウェアエンジニアではなかったし、ソフトウェアに対してそれほど情熱を持っていませんでした。

私は博士号を取得するために南カリフォルニア大学に行くところだったのですが、Google AI Residency プログラムに招待されたため考えを変えました。これは、AI の博士号を持っていない人に Google で研究を行う機会を提供する 18 か月間のプログラムです。この AI プロジェクトは、おそらくこれまでの私のキャリアの中で最大の跳躍台となったでしょう。おそらく、自然言語処理におけるデータ拡張について書いた比較的人気のある論文に基づいて入学できたのでしょう。その論文の影響は私にとって驚きでした。私は医療画像解析で使用した直感を自然言語処理に単純に適用しただけでしたが、それがこれほど普及するとは思ってもいませんでした。

そこで私は2020年に卒業した後、2年以上Googleで働き、大規模言語モデルの研究を行っていました。 Google は研究を行うのに最適な場所であり、多くの有名な研究者が Google で働くことで名声を築いてきました。この AI プログラムは、優れた業績を上げた研究者には Google で働き続ける機会が与えられ、そのほとんどが正社員になることを目指しているため、特に効果的です。

私の物語には少なくとも 2 つの教訓が含まれています。どちらも少し古いように聞こえるかもしれませんが、それでも共有したいと思います。

まず、当時は失敗だと思っていたことの多くが、実は私にとっては良いことだったのです。もし私が金融やソフトウェアエンジニアリングのインターンシップでもっと成功していたら、今楽しんでいる AI のキャリアを逃していたかもしれません。
第二に、運が大きな役割を果たしましたが、幸運を得る機会もたくさん作りました。たとえば、広く引用される自然言語処理の論文を書く上で、私には絶対的な利点はありませんでしたが、その論文についてブログを書き、わかりやすい言語を使用し、コードをオンラインで利用できるようにすることで、その論文が人気を得るチャンスを得ることができました。

Q: どの研究分野を選択すればよいでしょうか?

A: 当然ですが、この質問に対する正しい答えは一つではありません。

個人的には、長期的にはより良い成果が得られるので、自分が楽しめる研究分野を選択することが重要だと考えています。どのような研究をしたいのかわからない場合は、数週間かけて幅広く読書をしたり、他の人に興味のある分野を聞いて、1つを選んで研究を始めましょう。

場合によっては、追求したい研究の方向性を他の要素と比較検討する必要があるかもしれません。たとえば、優秀な教授と一緒に研究する機会があっても、研究の方向性が第一希望のテーマではない場合があります。そこから多くのことを学べたり、目標を達成するのに役立つのであれば、そうすることは許容されると思います。しかし、なぜそうするのかということを忘れず、自分の意図を明確にしておくことが重要です。

私が常に人々に検討することをお勧めする研究の方向性が 1 つあります。それは、整合です。いくつかの理由から、整合は良い方向であると私は考えています。

インテリジェントな AI を人間の価値観と一致させることは、明らかに非常に重要です。
アライメントは比較的新しい分野なので、アライメント研究に早くから取り組む人は、より大きな影響を与えるチャンスがあるでしょう。
整合は複数の分野にまたがり、倫理などの他の分野に関係する可能性があり、一部の人にとっては魅力的かもしれません。
アライメント研究者の供給は需要より少ないので、仕事を見つけるのは簡単かもしれません。

アライメント研究は従来の研究方向ではなく、適切なベンチマークがなく、始めるのが容易ではないという理由で、アライメント研究に取り組まない人もいます。さらに、調整の目標は全員の一致した同意を得るものではありません。しかし、私はこれらの理由が障害になるとは思いません。アライメントに取り組む人々は、アライメントに関心のある人々と喜んで話をすると思います。

Q: 効果的な研究を行うために必要な知識のほとんどはどこで学びましたか?興味深いアイデアがある場合、それを学ぶためにもっと時間を費やすべきでしょうか、それともただ研究を始めるだけでしょうか?

A: 研究には、学習の源が 3 つあります。

読み物: 他の研究論文、ブログ投稿、ツイートなど。
他の人はこう言います: 指導教員がフィードバックを与え、査読者が論文をレビューします。
何かを試してみます。実験を実行します。うまくいくかもしれませんし、うまくいかないかもしれません。その理由を見つけるためにさらに深く掘り下げます。

第二レベル、第三レベルの学習には（他の人の時間や実験するための自分の時間という点で）より高いコストがかかるため、最初は読書が有益です。ただし、2 番目と 3 番目のタイプの学習をできるだけ早く開始したいと思うようになります。その理由は、学習は自分の能力の限界に達したときに最も速く行われるためであり、（2）と（3）はあなたに合わせてカスタマイズされるため、学習プロセスがさらに加速されるからです。

Q: 研究を行う上で最も重要な資質は何だと思いますか?

A: 他のほとんどのスキルと同様に、研究も実践を通じて習得できると思います (参照: https://www.jasonwei.net/blog/practicing-ai-research)。テレンス・タオのような才能のレベルに到達できる人はほとんどいません。しかし、ほとんどの人は高度な研究者になる能力を持っていると私は信じています。したがって、この質問に対する私の短い答えはおそらく「忍耐力」でしょう。なぜなら、忍耐力があれば練習が容易になるからです。

研究において最も過小評価されているスキルの 1 つは、フィードバックから学ぶことです。フィードバックをどれだけ無視するかに驚かれるでしょう。私にアドバイスを求める人のほとんどが、耳を傾けないことに気づきました。私は他の人からのフィードバックを、特にその分野で最高の人からのフィードバックであれば、非常に真剣に受け止めるようにしています。フィードバックは、より優れた研究者になるためにどの方向に進むべきかを教えてくれる勾配のようなものです。メンターがいたときは、毎週何を改善できるかを尋ねて、それに取り組みました。研究においては、迅速なフィードバックループの文化があるのは幸運ですが、これはすべての分野に当てはまるわけではありません。

フィードバックを無視するタイミングも知っておく必要があることに注意することが重要です。あなたのメンターや上司は、フィードバックを提供するときに必ずしも適切な精神状態にあるとは限らず、あなたの問題についてあなたほど深く考えていないかもしれません。しかし、彼らの言うことは慎重に考慮する必要があります。

もう一つの過小評価されているスキルは、特にデータを調べるなど、基礎的な作業を行う意欲です。 2019 年に、私は肺がんの分類のためにニューラルネットワークをトレーニングしました。ほとんどのデータの初期注釈付けを行い、その後、病理学者に分類をレビューしてもらいました。これには40時間以上かかりましたが、最終的には臨床病理学者のように特定の種類の肺がんを分類できるようになりました。かなり時間がかかりましたが、データ注釈付けから得た直感は、それ以降 3 つの論文で活用されているので、価値はありました。

この調査で最後に過小評価されているスキルは、優れたコミュニケーション能力を持つことです。良好なコミュニケーションにより、あなたはより信頼され、一緒に働く価値のある人になります。たとえば、私には他の人も抱いているかもしれない 3 つの嫌いなことがあります。

多くの人は「明日にはこれを終わらせる」と言いたがりますが、実際には完了するまでに何週間もかかります。本当に重要なことであり、明日までに実際に終わらせることができる場合（ただ始めるのではなく）を除いて、このようなことを言うのは避けるようにしています。重要なタスクを完了する必要があるときに、他の人に私のコミットメントを信頼してもらいたいです。
プロジェクトの最初の会議では、人々は参加することに大きな関心を示すことが多いのですが、後になって、示した関心に比例した時間を費やすことを嫌がるようになります。同様に、私の興味が他の人へのヒントになることを望んでいるので、「このプロジェクトに取り組むことを約束することはできませんが、<X> のアイデアは私にとって非常に興味深いです」のようなことを言うようにしています。
十分な詳細を提供せずに「<X> は機能しません」と言う人がよくいます。私は、この文を「式 F、モデル M、およびデータセット D を使用した場合、<X> は機能しませんでした」と変更しようとしました。これにより、相手が私が言っていることを正確に推測するための精神的な労力が軽減されます。

Q: 効果的なアイデアは (少なくともあなたの分野では) 数学的に深いものになる傾向がありますか、それともより幅広い創造性がある傾向がありますか?数学の深さが重要である場合、このレベルの理解を学部レベルでどのように達成できるのでしょうか?優れた数学的直感を養うことがより重要なのでしょうか、それとも時間をかけてこれらの数学のテーマを深く研究する価値はあるのでしょうか?

A: 数学をさらに学ぶことが悪いことだとは言い難いですが、私の個人的な意見はこうです。ディープラーニングの歴史において、時の試練に耐え、ほぼ常に機能してきた 2 つの単純な要素があります。それは、より大きなモデルとより多くのデータです。どちらも深い数学的基礎を伴うものではなく、特に創造的なものでもありません。

したがって、いくつかの理由から、数学を深く掘り下げることはお勧めしません。

現在、この分野には多くの機会と未活用のアイデアが存在し、時間の機会費用が高いことを意味します。したがって、数学に時間を投資することの相対的な価値は低くなります。
長期的なスキル開発にもっと時間をかけたいとしても、数学が得意であることよりも有利な能力もあると思います。以下にいくつかの提案を示します。

今日の AI 分野では、主にエンジニアリングを習得し、優れたソフトウェアエンジニアリングスキルを開発することが重視されています。
現在のボトルネックの 1 つは GPU であり、ハードウェアを理解してそれを効率的に使用する方法を理解することは、数学を学ぶよりも価値があるかもしれません。
優れたコミュニケーション能力を身につける努力をすると、他の人と協力しやすくなるほか、より明確に考え、より組織的に行動できるようになります。

ほとんどのアイデアは数学的な動機に基づいていないことを考えると（一部は数学的な動機に基づいている）、数学の知識に過度に依存すると、エンジニアリングソリューションを探すときに間違ったバイアスが生じる可能性があります（言語学に精通していても大規模な言語モデルの構築に役立たないのと同じです）。

現在、この Q&A 投稿はまだ更新中であり、Jason Wei も回答を寄せています。選択的に参照することも、独自の新しい質問を投稿することもできます。

完全なドキュメントについては、次のリンクを参照してください: https://docs.google.com/document/d/1QREmdzLwJ0CR3kdFeenJbBowT1IFFREd46y10tW6pog/edit

<<: C#とTypeScriptの作者がオープンソースAIプロジェクトTypeChatを発表

>>:

大学卒業後、彼はGoogleに入社し、先駆的な作品「Thinking Chain」を執筆した。このOpenAIの新人は、学部生の質問に答えている。

ドラッグアンドドロップ機械学習の愛と憎しみ

自動応答は人工知能ではなく、自律応答は

通信業界は最大のAI市場となり、2021年に重要な転換点を迎える

人工知能がまだできない5つのこと

製薬業界を覆すAIは「仕掛け」か「希望」か？

イノベーションに関する対話 - 51CTO 初の開発者コンテストが始まりました!

DeepMindの創設者はチューリングテストを覆したい！外国人男性がAIを使って90日間で3万ドルを稼いだ

推薦する

「5つの一般的なアルゴリズム」分岐アルゴリズムとアイデアを図解で紹介

NYU の具現化知能における新たな進歩: 視覚的なフィードバックで缶を開ける方法を学習し、タスクの成功率が 135% 向上、LeCun 氏はそれを好意的に評価

北京初のT5レベル閉鎖型自動運転試験場が正式に運用開始

ニューラルネットワークの過剰適合を避ける 5 つのテクニック

面接に合格してNLPの扉を開くのに役立つNLPの簡単なガイド

機械学習とデータサイエンスに関する必読の無料オンライン電子書籍 10 冊

MIT教授が交通渋滞を解決するアルゴリズムを開発

Python+OpenCVを使用して顔追跡を実装するための50行のコード

韓国初のAI女性キャスターが誕生。本物と間違えられ議論を巻き起こす。AIサベイニングはすでに存在していた