「思考の連鎖(CoT)」の概念を注意深く研究したことがあるなら、おそらく Jason Wei という名前を聞いたことがあるでしょう。 写真 彼は、思考連鎖の概念に関する先駆的な研究である「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」の第一著者であり、大学卒業後に Google に入社しました。そこで彼は、思考連鎖ヒントの概念を普及させ、命令チューニングに関する初期の研究を共同で主導し、Yi Tay、Jeff Dean らとともに大規模モデルの出現力に関する論文を共同執筆しました。 写真 Jason Wei などの著者は、思考の連鎖を一連の中間推論ステップとして定義し、大規模な言語モデルが複雑な推論を実行する能力を向上させることを目指しています (より複雑な推論問題をステップに分解し、最終的な答えをステップごとに得ることによって)。 Jason Wei らによる論文は、連鎖思考を促すと相転移現象が発生することを初めて発見したものであり、大規模モデルが小規模モデルを大幅に上回る性能を示しており、さらに新たな能力の発見につながりました (「複雑な推論: 大規模言語モデルの北極星能力」で引用)。現在、思考連鎖プロンプトは大規模モデルの分野で広く使用されています。 2023 年の初めに、彼は OpenAI に入社し、他の技術者とともに ChatGPT を構築することを選択しました。 こうした熱心な学術的業績のおかげで、ジェイソン・ウェイの引用数は 8,000 件近くに達しました。 写真 若き学術界の新星として、ジェイソン・ウェイは最近多くの質問を受けています。これらの質問のほとんどは学部生から寄せられたもので、彼らが学業の初期段階で抱えている混乱の一部を表しています。 Google ドキュメントで、Jason Wei がこれらの質問のいくつかに答えています。この記事では、同じような疑問を抱いている学生たちの役に立つことを願って、こうした質問のいくつかを抜粋します。 写真 Q: AI への取り組みはどのように始まったのですか? A: 皆さんは2022年の私の仕事を通じて私をご存知だと思いますが、私は2017年からAIの分野で働いています。 ダートマス大学の学部生だった頃、私は当初ウォール街の銀行家になりたいと思っていました。それは私の両親の世代のアメリカンドリームであり、私の故郷のほとんどの友人の選択でもありました。しかし、大学1年生(2017年)のときに金融のインターンシップを見つけるのは難しく、結局、母の友人を通じて知り合ったAIスタートアップ企業で働くことになりました。 その夏、私はマイケル・ニールソン著『ニューラルネットワークとディープラーニング』を読んで初めて AI に出会いました。私はバックプロパゲーションアルゴリズムについて学び、あらゆる種類の入力データと出力データから任意のマッピングを学習するというアイデアに魅力を感じました。この分野に対する私の情熱は、学校で学んだ他のどの科目よりも桁違いに大きかったことを今でも覚えています。 2010年代後半は論文を出版することが流行っていたので、大学時代にそれをやろうとしました。私はいつものやり方で機械学習のコースを受講し、そのコースを担当した教授に研究の指導を依頼しました。私は2年間、医療画像解析のためのディープラーニングの分野で働いてきました。私の研究結果は良好ですが、驚くほどではありません。ダートマスには活気のある AI 環境が存在せず、志を同じくするコミュニティを見つけるのは困難です。ですから、私は実際に AI に興味を持っている少数の人々に本当に感謝していますし、サム・グレイダナスは私が尊敬する人物です。 卒業が近づくにつれ、私は博士号とソフトウェアエンジニアリングの両方の職に応募しました。私は優れた論文を主要な学術会議に受理してもらい、すべての博士課程に受け入れられるだろうと思っていました。その結果、私は南カリフォルニア大学(USC)を除くほぼすべての学校から不合格になりました。大学3年生の夏休みに、BlendとDoorDashでインターンをしましたが、私は優秀なソフトウェアエンジニアではなかったし、ソフトウェアに対してそれほど情熱を持っていませんでした。 私は博士号を取得するために南カリフォルニア大学に行くところだったのですが、Google AI Residency プログラムに招待されたため考えを変えました。これは、AI の博士号を持っていない人に Google で研究を行う機会を提供する 18 か月間のプログラムです。この AI プロジェクトは、おそらくこれまでの私のキャリアの中で最大の跳躍台となったでしょう。おそらく、自然言語処理におけるデータ拡張について書いた比較的人気のある論文に基づいて入学できたのでしょう。その論文の影響は私にとって驚きでした。私は医療画像解析で使用した直感を自然言語処理に単純に適用しただけでしたが、それがこれほど普及するとは思ってもいませんでした。 そこで私は2020年に卒業した後、2年以上Googleで働き、大規模言語モデルの研究を行っていました。 Google は研究を行うのに最適な場所であり、多くの有名な研究者が Google で働くことで名声を築いてきました。この AI プログラムは、優れた業績を上げた研究者には Google で働き続ける機会が与えられ、そのほとんどが正社員になることを目指しているため、特に効果的です。 私の物語には少なくとも 2 つの教訓が含まれています。どちらも少し古いように聞こえるかもしれませんが、それでも共有したいと思います。
Q: どの研究分野を選択すればよいでしょうか? A: 当然ですが、この質問に対する正しい答えは一つではありません。 個人的には、長期的にはより良い成果が得られるので、自分が楽しめる研究分野を選択することが重要だと考えています。どのような研究をしたいのかわからない場合は、数週間かけて幅広く読書をしたり、他の人に興味のある分野を聞いて、1つを選んで研究を始めましょう。 場合によっては、追求したい研究の方向性を他の要素と比較検討する必要があるかもしれません。たとえば、優秀な教授と一緒に研究する機会があっても、研究の方向性が第一希望のテーマではない場合があります。そこから多くのことを学べたり、目標を達成するのに役立つのであれば、そうすることは許容されると思います。しかし、なぜそうするのかということを忘れず、自分の意図を明確にしておくことが重要です。 私が常に人々に検討することをお勧めする研究の方向性が 1 つあります。それは、整合です。いくつかの理由から、整合は良い方向であると私は考えています。
アライメント研究は従来の研究方向ではなく、適切なベンチマークがなく、始めるのが容易ではないという理由で、アライメント研究に取り組まない人もいます。さらに、調整の目標は全員の一致した同意を得るものではありません。しかし、私はこれらの理由が障害になるとは思いません。アライメントに取り組む人々は、アライメントに関心のある人々と喜んで話をすると思います。 Q: 効果的な研究を行うために必要な知識のほとんどはどこで学びましたか?興味深いアイデアがある場合、それを学ぶためにもっと時間を費やすべきでしょうか、それともただ研究を始めるだけでしょうか? A: 研究には、学習の源が 3 つあります。
第二レベル、第三レベルの学習には(他の人の時間や実験するための自分の時間という点で)より高いコストがかかるため、最初は読書が有益です。ただし、2 番目と 3 番目のタイプの学習をできるだけ早く開始したいと思うようになります。その理由は、学習は自分の能力の限界に達したときに最も速く行われるためであり、(2)と(3)はあなたに合わせてカスタマイズされるため、学習プロセスがさらに加速されるからです。 Q: 研究を行う上で最も重要な資質は何だと思いますか? A: 他のほとんどのスキルと同様に、研究も実践を通じて習得できると思います (参照: https://www.jasonwei.net/blog/practicing-ai-research)。テレンス・タオのような才能のレベルに到達できる人はほとんどいません。しかし、ほとんどの人は高度な研究者になる能力を持っていると私は信じています。したがって、この質問に対する私の短い答えはおそらく「忍耐力」でしょう。なぜなら、忍耐力があれば練習が容易になるからです。 研究において最も過小評価されているスキルの 1 つは、フィードバックから学ぶことです。フィードバックをどれだけ無視するかに驚かれるでしょう。私にアドバイスを求める人のほとんどが、耳を傾けないことに気づきました。私は他の人からのフィードバックを、特にその分野で最高の人からのフィードバックであれば、非常に真剣に受け止めるようにしています。フィードバックは、より優れた研究者になるためにどの方向に進むべきかを教えてくれる勾配のようなものです。メンターがいたときは、毎週何を改善できるかを尋ねて、それに取り組みました。研究においては、迅速なフィードバック ループの文化があるのは幸運ですが、これはすべての分野に当てはまるわけではありません。 フィードバックを無視するタイミングも知っておく必要があることに注意することが重要です。あなたのメンターや上司は、フィードバックを提供するときに必ずしも適切な精神状態にあるとは限らず、あなたの問題についてあなたほど深く考えていないかもしれません。しかし、彼らの言うことは慎重に考慮する必要があります。 もう一つの過小評価されているスキルは、特にデータを調べるなど、基礎的な作業を行う意欲です。 2019 年に、私は肺がんの分類のためにニューラル ネットワークをトレーニングしました。ほとんどのデータの初期注釈付けを行い、その後、病理学者に分類をレビューしてもらいました。これには40時間以上かかりましたが、最終的には臨床病理学者のように特定の種類の肺がんを分類できるようになりました。かなり時間がかかりましたが、データ注釈付けから得た直感は、それ以降 3 つの論文で活用されているので、価値はありました。 この調査で最後に過小評価されているスキルは、優れたコミュニケーション能力を持つことです。良好なコミュニケーションにより、あなたはより信頼され、一緒に働く価値のある人になります。たとえば、私には他の人も抱いているかもしれない 3 つの嫌いなことがあります。
Q: 効果的なアイデアは (少なくともあなたの分野では) 数学的に深いものになる傾向がありますか、それともより幅広い創造性がある傾向がありますか?数学の深さが重要である場合、このレベルの理解を学部レベルでどのように達成できるのでしょうか?優れた数学的直感を養うことがより重要なのでしょうか、それとも時間をかけてこれらの数学のテーマを深く研究する価値はあるのでしょうか? A: 数学をさらに学ぶことが悪いことだとは言い難いですが、私の個人的な意見はこうです。ディープラーニングの歴史において、時の試練に耐え、ほぼ常に機能してきた 2 つの単純な要素があります。それは、より大きなモデルとより多くのデータです。どちらも深い数学的基礎を伴うものではなく、特に創造的なものでもありません。 したがって、いくつかの理由から、数学を深く掘り下げることはお勧めしません。
ほとんどのアイデアは数学的な動機に基づいていないことを考えると(一部は数学的な動機に基づいている)、数学の知識に過度に依存すると、エンジニアリング ソリューションを探すときに間違ったバイアスが生じる可能性があります(言語学に精通していても大規模な言語モデルの構築に役立たないのと同じです)。 現在、この Q&A 投稿はまだ更新中であり、Jason Wei も回答を寄せています。選択的に参照することも、独自の新しい質問を投稿することもできます。 完全なドキュメントについては、次のリンクを参照してください: https://docs.google.com/document/d/1QREmdzLwJ0CR3kdFeenJbBowT1IFFREd46y10tW6pog/edit |
<<: C#とTypeScriptの作者がオープンソースAIプロジェクトTypeChatを発表
[[267801]] AI システムがどのように意思決定を行うかを人々が理解できるようにする説明可能...
最近では、「顔スキャン」、つまり顔認識技術を使うことで、解決できることが増えています。買い物の際の「...
[[348783]] Canvaからの画像テクノロジーは生活の中でどのような役割を果たしているのでし...
現在、ロボットはさまざまな業界で広く使用され、さまざまな作業に従事しています。これは、ロボットの開発...
[[286212]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
アーキテクチャの革新を待つことができず、Nvidia は生成 AI 専用のチップを「先行して」リリー...
制作:51CTO テクノロジースタック(WeChat ID:blog) 「今年中にChatGPTのレ...
1. 通信ネットワーク運用シナリオまず、通信ネットワーク運用の背景についてご紹介します。通信ネットワ...
知乎のホットな投稿によると、中国のトップAI研究者でUCLA教授の朱松春氏が清華大学オートメーション...
新興テクノロジーが世界を席巻し、前例のない革新、機会、脅威をもたらしています。これらの分野における専...
[[212222]]音声認識にディープラーニングが導入されて以来、単語の誤り率は急速に低下しました。...