この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 ちょうど今、OpenAIは新たなレベルに到達しました。
重要なポイント:いいえ!使用!あなた!編集!手順! ぜひこの感触を味わってみてください。 最初のステップは、「小さな男」を中に入れて、矢印キーに従って左右に動かすための文章を入力することです。
ニーズを理解した後、AI がデバイスを自動的にプログラムし、小さな男が実際に左右に動くことができるようになります。 2 番目のステップは、「石」に文章を入れて「空から落ちてくる」ようにすることです。
3 番目のステップは、自然言語を使用していくつかの簡単なルールを策定することです。小人が石に当たると、ゲームは終了します。
最後に、励ましの言葉を含む終了プロンプトを AI に生成させます。 AIが選んだのは「もう一度試してください!」でした。 もちろん、より複雑なルール(スコアリング機能の追加など)を持つミニゲームもあり、これも同じ方法を使用して数分で生成できます。 これは魔法だ!小規模ゲームの開発は今や「タイピング」に頼っているのでしょうか? ! ライブ放送を見ていた視聴者も同じ感情を表した。画面を埋め尽くすコメントの連続を見てみよう。 一部のネットユーザーは次のようにも言っています。
これは OpenAI の新しい大ヒット製品、自己プログラミング可能な AI「 Codex」です。 AI プログラミングは新しいものではありません。少し前に GitHub で話題になったCopilotもその 1 つです。 しかし、その背後にあるテクノロジーは実際には OpenAI から来ています。 しかし今回、OpenAI は機能をアップグレードし、新しいバージョンを開発しました。 それだけでなく、小さなゲームを作ることは Codex の機能のほんの一部にすぎません。 ぜひ一緒にその素晴らしいパフォーマンスを体験してみましょう。 入力する必要はありません。話しかけるだけです。AIに「要件を上げる」と入力するのはまだ少し面倒です。 ただ話して命令するだけでいいですか? これは本当に可能です! 今回、OpenAIはMicrosoftと協力し、この音声制御機能を備えたWordプラグインを開発しました。 AI に「各行の先頭のスペースを削除する」というコマンドを直接与えると、AI は Microsoft が提供するインターフェースを通じてコマンドを正常に実行します。 突然、テキスト全体が左揃えになります。 さらに、AIはコマンドの意味も正確に理解し、段落間の空白行も変更されませんでした。 もう少し複雑にしてみましょう。 AI に「5 行ごとに太字にする」というコマンドを与えると、簡単に処理できます。 誰かにタスクを割り当てると、「誰か」が代わりにそれを完了させてくれるように感じます。まるで、古い従業員がインターン生を指導しているような気分になりませんか? つまり、数年前に Luo Yonghao がリリースした TNT システムの音声オフィスよりもはるかに優れています。 公式デモンストレーションに加えて、内部テストユーザーのaniakubow は、152 語の説明を通じて AI に Web ページを生成するデモンストレーションも実行させました。 ここで Codex は、Javascript を使用して Document オブジェクトを操作し、Web ページを生成していることがわかります。これは、トレーニング セットに直接的な HTML コードが含まれていないためであると考えられます。 最後に、ライブデモに加えて、OpenAI は Codex 論文のプレプリントを Arxiv にリリースしました。 この論文では、Codex はIOI や ACM の競争問題も含む課題に取り組まなければなりません。 Codex は、各質問に対して 1,000 の回答を生成するブルート フォース方式を使用し、テスト セット内の 600 を超えるコンテストの質問の 3.23% に回答し、すべてのテスト ケースに合格することができました。 このプログラミング問題テストセットは、カリフォルニア大学バークレー校の研究者によって 5 月に完成したばかりです。 当時テストされたGPT-2、GPT-3、オープンソースのGPT-Neoは、競争の難易度の点で完全に敗北し、成果を上げることができませんでした。 予想外にも、コード専用に作成された Codex は、わずか 2 か月余りで、先行者の恥辱を払拭しました。 Codex の「魔法」はどのように機能するのでしょうか?こんなにすごい能力、GPT-3のようにデータを積み重ねて頑張れば実現できるのでしょうか? 完全にそうではありません。今回の Codex の最大バージョンには120 億のパラメーターがあり、これは GPT-3 の 1750 億よりもはるかに小さいです。 具体的な状況を理解するには、まずその発展の歴史から始める必要があります。 当初、OpenAIの研究者はGPT-3を使ってさまざまな実験を行い、GPT-3がPythonのコメントからいくつかの簡単なコードを生成できることを発見しました。 GPT-3 はこれまでコードでトレーニングされたことがなく、ブログや投稿の断片的なコードでのみトレーニングされていたため、彼らは非常に満足しました。 GPT-3 の自然言語における優れたパフォーマンスを考慮すると、GPT-3 のコード バージョンが特別にトレーニングされれば、間違いなく業界に再び衝撃を与えることになるでしょう。 そこで彼らは、最も多くのオープンソースコードを持つ「小さなパートナー」であるGitHub を見つけて協力することにしました。 最初は 179G の Python コードを取得しましたが、一部は長すぎ、一部は明らかに自動生成されたものでした。 これらの「標準以下の」コードを削除した後、最終的に残るコード サイズは159Gになります。 次のステップは、もちろん事前トレーニングを行い、これらすべてのコードを AI (Codex) に入力することです。 しかし、問題があります: GitHub のオープンソース コードには必ずバグがあります。AI が問題のあるコードを大量に学習した場合、どうすればよいでしょうか? 実は、これは言うのは簡単です。事前トレーニングの後、さらに微調整を行う必要があります。 微調整するときは、プログラミング コンテストの正解と PyPI の信頼できるオープン ソース コードを使用します。 最後に、Codex の 120 億パラメータ バージョンは、質問の 28.81% に正しい回答を提供できます。 この精度は、以前のオープンソース コード事前トレーニング モデル GPT-Neo および GPT-J、および GPT-2 ベースのコード補完ツール TabNine の精度を上回ります。 この結果は良いのですが、実用化にはまだ少し遠いです。 しかし、OpenAI の研究チームにとってはこれは問題ではありません。 彼らはすぐに画期的な解決策を思いつきました。
次に、AI に人間と同じように繰り返し修正させて 100 個のバージョンを作成し、その中から常に正しいバージョンをいくつか選び出すようにします。 この「量」を積み重ねる方法を使用すると、Codex の最終結果は次のようになります。
強いが、完全に強いわけではないCodex の驚くべきパフォーマンスはかつてネットユーザーを驚かせた。 失業しちゃうよ!… 誰かがパブリックスクリーンに直接「さようなら、コンピューターサイエンスの学生の皆さん」と入力しました。 しかし、実際にデモンストレーション中に車が横転したので、それほど心配する必要はありません。 「共感をもって Hello World と言う」と入力した後も、Codex によって返される結果は「共感をもって Hello World と言う」のままです。 これは、Codex がまだ完璧ではないことを間接的に示しています。 OpenAIは次のように述べた。
Codex は数億行のコードを学習していますが、これらのコードの大部分は「記憶」されており、プログラミング言語を真に理解しているわけではありません。 また、Codex では長い文字列を理解するのが困難です。 また、文字数が増えると、Codex のパフォーマンスは大幅に低下します。 私たちのパートナーである Microsoft Azure Cloud が十分な炭素排出枠を購入していなかったら、Codex は私たちに会うことができなかったかもしれません (犬の頭)。 さらに、Codex は、多くの変数と演算を含むコメントを理解する際にも間違いを犯します。 この例では、Codex の 120 億パラメータ バージョンは変数 w を減算するのを忘れており、すべての数値の積を返しません。 これらは、まだプログラミングを学習している初心者プログラマーにとっては非常に使いにくいものです。 さらに、生成されたコードの正確性や正しさは保証できないため、セキュリティ上の問題に関して一定のリスクが存在します。 それだけでなく、OpenAIはCodexが人種差別的なコンテンツを生成するとも述べています。 社会的レベルでは、OpenAI は Codex の出現がプログラマーの雇用に影響を及ぼす可能性もあると示唆しており、悪用された場合はサイバー犯罪のリスクもある。 最後のポイントは環境問題です。 結局のところ、大規模なモデルであるため、そのパラメータの規模を過小評価することはできません。 私たちのパートナーである Microsoft Azure Cloud が十分な炭素排出枠を購入していなかったら、Codex は私たちに会うことができなかったかもしれません (犬の頭)。 試してみたいという方は、OpenAI が Python プログラミング コンテストも用意しており、Codex がパートナーとなって一緒に問題を解決します。 試合は8月13日北京時間午前1時に開始される予定で、中国にとってはあまり好ましい状況ではない。 |
<<: 生成的ビデオ圧縮を有効にする: Google は GAN を使用して HEVC に匹敵するパフォーマンスを実現
>>: ハイパーオートメーションの旅を始めましょう: 仕事のやり方を変え、運用プロセスを簡素化しましょう
最近開催された第43回国際情報検索会議(ACM SIGIR2020)で、Geoffrey Hinto...
最近、オーストラレーシア工科大学、マッセー大学、ロイヤルメルボルン工科大学などの研究機関の研究者が、...
大切な人が亡くなったら、その人の記憶をAIに引き渡しますか?「The Debaters」のこの討論テ...
Wired 誌は、大型ハドロン衝突型加速器の物理学者たちが、ヒッグス粒子の特性を明らかにするプログラ...
調査によると、世界のANPRシステム市場は2021年から2023年の間に年間9.6%成長すると予想さ...
1956年、人工知能元年。その夏、米国ニューハンプシャー州ハノーバーの小さな町にある美しいアイビーリ...
[[264958]]将来、道を歩いていて急にお腹が空いたとき、今のように検索エンジンを使って検索する...
[[282007]] ▲写真:スタンフォード大学のアイリーン・ドナホー氏(左)が、米国政府の最高技術...
[[206292]]人工知能は非常に人気があり、それに対して楽観的な人もいれば、悲観的な人もいます。...
実際、ディープラーニングは多くの厄介な最適化問題を解決しています。ニューラル ネットワークは、問題に...
製造業からの温室効果ガス排出を削減する方法は複数あります。 製造業におけるデジタルデータの使用による...
2013年のノーベル化学賞受賞者であるアリエ・ワーシェル氏は、COVID-19パンデミックと製薬業...