GPT-4を使用すると、成績の悪い生徒は成績の良い生徒よりも有利になる

GPT-4を使用すると、成績の悪い生徒は成績の良い生徒よりも有利になる

学生が AI を使用して「不正行為」を行うことが許可された場合、成績分布はどのように変化するでしょうか?

この問題に対して、実際に数人の大学教授が真剣な研究を行い、62ページにわたる研究論文を書きました。

結果は、GPT-4の使用後、生徒の「能力曲線が圧縮され」、成績の悪い生徒と優秀な生徒の間の格差が狭まったことを示しました。

ウォートン校の教授がこの研究を共有した後、多くのネットユーザーの間で議論が巻き起こった。ネットユーザーもこの結果に驚いた。

これは私の予想とは全く違いました。みんなの点数が上がると思っていました。

一部のネットユーザーはこれを「真のゲームチェンジャー」と呼んだ。

AI は教育環境を変え、格差を縮小しながら基準を向上させています。

しかし、ネットユーザーの中には異なる見解を持つ人もいる。

AI の使用が得意な人は成績が非常に良い可能性があり、差が縮まっているように見えるのは、GPA の上限が 4.0 であることだけによるのかもしれません。

AIは「イコライザー」となるのか?

上記に加えて、私たちは論文を調べたところ、研究者らが次のような結論に達したことも分かりました。

  • GPT-4 の使用は、参加者の全体的なタスク完了の質に小さく不安定な影響を及ぼしました。
  • GPT-4 を使用すると、参加者がタスクを完了するのにかかる時間が大幅に短縮されました。
  • スキル レベルの低い参加者は、GPT-4 を使用した後にタスク完了品質が最も大幅に向上しましたが、すでに独立して高品質でタスクを完了できた参加者は、品質の向上が小さかったです。
  • GPT-4 は、生徒が最初にタスクをどれだけ速く完了したかに関係なく、すべての生徒に同様の時間の節約をもたらします。
  • 参加者は、各タスクにおける自分の具体的なパフォーマンスを理解していなくても、GPT-4 が最も効果的なアプリケーション シナリオを明確に指摘できます。

実験の詳細を以下で見てみましょう。

具体的には、南カリフォルニア大学グールド法科大学院とミネソタ大学法科大学院の数名の教授が、AI 支援による法的分析の影響を例として取り上げました。

実験に参加したミネソタ大学ロースクールの学生60名には、若手弁護士によくある4つの課題、すなわち、訴状の起草、契約書の起草、従業員ハンドブックの起草(EEハンドブック) 、顧客メモの起草(クライアントメモ)が与えられた。

違いは、参加者がランダムに 2 つのグループ(グループ A とグループ B)に分けられ、各グループに 30 人ずつ含まれていたことです。グループ A の参加者は、苦情書と契約書の起草のタスクを完了するために GPT-4 を使用する必要があり、グループ B は、従業員ハンドブックと顧客覚書の起草のタスクを完了するために GPT-4 を使用しました。

実験の前に、すべての学生は、法的分析に GPT-4 を効果的に使用する方法を学ぶために約 2 時間のトレーニングを受けました。タスク中、参加者はタスクを完了するのにかかった時間を記録する必要がありました。

その後、研究者らは参加者の身元やその他の情報を知らされずに、匿名ですべての作品の採点を行った。

具体的な実験結果は以下のとおりです。

4.0 GPA メカニズムでは、GPT-4 支援を使用した後、4 つのタスクにおける学生の平均スコアは +0.17、+0.24、+0.07、-0.07 で変動しました。

視覚的なチャートはより直感的です:

全体的に、契約書作成タスクのみが 95% の信頼度レベルで統計的に有意な改善を示しました。

GPT-4 を使用した参加者と使用しなかった参加者がタスクを完了するのにかかる平均時間を見てみましょう。

参加者がタスクを完了するのにかかる時間が大幅に短縮されたことが直感的にわかります。

さらなるデータと分析については、興味のある方は論文をご覧ください。

論文の最後には、数人の教授が弁護士、法律関係の顧客、裁判官、ロースクール、ロースクールの学生に向けてさまざまな提案をした12ページにわたる啓示を書いたことも特筆に値します。

報告書は、法科大学院は、将来の実務のニーズによりよく適応するために、学生がいつ、どのようにAIを使用するか、またどのような状況下でAIの適用を制限すべきかを再考する必要があると指摘している。

さらに、さまざまな集団を対象とした同様の研究も数多くあります。

AIは職場の「バランサー」となるでしょうか?

ハーバード・ビジネス・スクール、ウォートン・スクール、MITスローン経営大学院などの研究者らがボストン・コンサルティング・グループと共同で調査を実施した。

彼らはボストン コンサルティング グループから高学歴の従業員を何人か選び、分析、創造的発想、説得力などのスキルを含む 18 のタスク テストを完了するために AI を使用するよう依頼しました。

結果によると、もともとチームの下位半分に属していたコンサルタントは AI の助けにより成果が 43% 向上したのに対し、通常は上位半分に属していたコンサルタントは成果が 17% しか向上しなかったことがわかりました。

GPT-4 を使用する前は、トップ パフォーマーとその他のパフォーマーの間の平均ギャップは 22% でしたが、使用後はこのギャップが 4% に大幅に減少しました

MITの調査でも、ChatGPTを使用した後、高レベルライターと低レベルライターのパフォーマンスの差が半分に減少したことが示されました。

同様の現象は、創作の分野でも見られています。ロンドン大学ユニバーシティ・カレッジとエクセター大学の研究者による実験では、創作作家間のスキル格差が縮まり、GPT-4 が提供する 5 つの創作インスピレーションが「さまざまなレベルの創作作家の創造性スコアを効果的に均衡させた」ことが示されました。

しかし、AIの使用によって人々のスキル格差を縮小できることを示した研究が複数あるにもかかわらず、論文の著者であるウォートン校のイーサン・モリック教授は次のように述べている。

AI がキングメーカーエスカレーターレベラーのいずれの役割を果たすかは必ずしも明確ではありません。

AIはあなたの周りでどのような役割を果たしていると思いますか?

<<:  ポストSORA時代において、CV実践者はどのようにモデルを選択するのでしょうか?畳み込みまたはViT、教師あり学習またはCLIPパラダイム

>>:  効果は爆発的! OpenAIが初のビデオ生成モデルをリリース、1分間のスムーズなHDビデオ、ネットユーザー:業界全体が安らかに眠る

ブログ    

推薦する

AI セキュリティの大手企業は 2020 年にどのような行動を取るのでしょうか?

7月9日から7月11日まで、2020年世界人工知能会議クラウドサミットが上海で閉幕しました。「イン...

5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

2019年、「5G」は大いに期待されるテクノロジーの流行語となり、その人気は間違いなく人工知能に劣り...

仕事を完了するにはまだ人間が必要か?ポストパンデミック時代に急成長する自動化の長所と短所

[[422568]]イーストロサンゼルスのアービーズ・ドライブスルーでローストビーフサンドイッチを注...

自動運転車の4つの重要な要素:2040年までに市場価値500億ドル

自動運転車は自動車業界にとって非常に破壊的な技術です。現在、多くのメーカーが物流、自動運転タクシー、...

...

バーチャル彼女に触れることもできます!ネイチャーに新たな研究が掲載、トッププレイヤーのシナリオが実現

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ビル・ゲイツ:AIが最大の影響を与えるには何十年もかかる

[[271684]]ビル・ゲイツは、世界を変えるトレンドを予見し、それを活用することで、史上最も成功...

物流ロボットが急増中!今後の市場の成長は2つのエンジンによって支えられる

最近、イスラエルを拠点とするスマート物流ロボットのスタートアップであるCAJA Roboticsは、...

期待する! 2020年までに中国の人工知能は世界の先進レベルに達するだろう

最近、北京は「科学技術革新の加速と人工知能産業の育成に関する指導意見」を発表し、北京の人工知能発展ス...

DAMOアカデミーのAI研究により、初めて大規模な膵臓がんの早期スクリーニングが可能に

私たちの日常生活では、携帯電話のロック解除から検索エンジンを使った地図ナビゲーションまで、人工知能と...

テレンス・タオ:2026 年には、GPT が数学論文の共著者となる予定です。 GPT-4の「フルバージョン」を事前に試してみたら衝撃を受けた

3か月前、OpenAIのGPT-4がデビューし、注目を集めました。そのマルチモーダル機能は人類に衝撃...

新しい形の人工知能が登場: AIaaSについてお話しましょう

「サービスとしての」配信モデルの誕生以来、SaaS と PaaS は日常的な技術用語の一部となり、企...

マスク氏の年収:0!米国のCEO給与ランキングが発表:黄氏はスーザン・カルキン氏より600万ドル近く低い

すべてはウォール・ストリート・ジャーナルが最近発表した米国上場企業のCEOの給与ランキングから始まっ...

2月10日に職場復帰ラッシュが到来し、北京は「急速AI温度検出器」の配備を開始した。

新型コロナウイルスによる肺炎の流行は依然として続いており、中国のさまざまな省や市では2月10日に大規...