著者 |ブライト・リャオ 私はもともとAI技術に興味があったソフトウェア開発エンジニアで、ディープラーニングが流行し始めた2015年、2016年頃から関連技術を学び始めました。当時、私たちは研究に興味を持っていた社内の学生たちも組織して共同研究を行いました。最終結果は、いくつかのコミュニティ共有といくつかの学習記事にまとめられました(こちらをご覧ください:https://brightliao.com/tags/ai/)。 OpenAIが昨年ChatGPTをリリースして以来、AIの能力は再び世界を驚かせています。このような時点で、関連する技術を再学習する必要があります。 ChatGPTとはChatGPT とは何かを紹介するコンテンツはすでにインターネット上にたくさんあります。まとめると、ChatGPT についてはいくつかの理解があります。
では、開発者にとって ChatGPT のさまざまな機能は何でしょうか?私たちが慣れ親しんでいるものと比較して、どのように理解すればよいのでしょうか?以下では主にこの観点から私の意見を述べたいと思います。 決定論と非決定論一般的な開発者の観点から、ChatGPT は通常のプログラムとどう違うのでしょうか?最大の違いは決定論と不確実性だと思います。 私たちが作業用に作成するソフトウェア プログラムのほとんどは、決定論的な方法で動作します。例えば、この記事はMarkdown形式で書かれていますが、Markdown形式を特定の方法で解析し、特定の方法で表示できるプログラムがあります。 ChatGPT モデルは非常に異なり、より確率的かつ非決定論的な方法で動作します。自然言語自体が不確実性に満ちていることは誰もが知っています。たとえば、「みんな彼を軽蔑している」という同じ文は、「彼」が非常に好き嫌いが激しく、他人を見下しているという意味になる場合もあれば、「彼」は能力が乏しく、みんなから見下されているという意味になる場合もあります。それはどういう意味ですか?これはさまざまな文脈や状況によって異なります。 ChatGPT モデルは自然言語の意味をより正確に理解できるため、入力されたテキストを包括的に分析し、最も確率の高いものを選択できます。 同時に、ChatGPT モデルはさまざまな応答を生成することができ、これも確率によって制御されます。 ChatGPT モデルは、指定されたテキストに基づいて次の単語を生成することによって機能します。次の単語をどうやって選ぶのでしょうか?プログラムは設定に基づいて、確率の高い単語をランダムに選択します。このランダム性により、AI の応答の多様性が生成されます。次の単語を生成するときに常に最も確率の高い単語を選択すると、ChatGPT モデルは決定論的なプログラムになります。 自動最適化によって得られる複雑な関数開発者の観点から見ると、ChatGPT は実際には入力テキストに基づいて他のテキストを出力する通常の関数として見ることができます。この関数が実現できる機能はより強力であり、確率に基づいています。 この機能の実装は、主に開発者がコードを記述して実装する他の方法とも異なります。 ChatGPT モデルは、他の AI モデルと同様に、トレーニングを通じて実現されます。 簡単に言えば、その実装プロセスは次のとおりです。この機能を実装するために、一連のパラメータをランダムに初期化し、この機能に必要なと思われる多数の入力と出力のペア(つまり、トレーニング データ セット)を準備し、これらのデータを使用してトレーニングを行いました。トレーニング プロセスは、実際には、以前にランダムに初期化したパラメーターを調整するプロセスです。これらのパラメータを長期間にわたって広範囲に調整した結果、この関数は、指定した入力に対して期待どおりの出力を返す可能性が高いことがわかりました。この時点で、関数は実際には確率的な方法で実装されます。 パラメータを調整するプロセスは、高校数学の連立方程式を解くプロセスに例えることもできます。たとえば、2 つの未知数を持つ方程式 ax + by = c が与えられた場合、2 つのセットの abc の値がわかっていれば、x と y を解くことができます。ここでのトレーニングは、このような abc 値のペアを多数見つけ、それらの値を使用して x と y を解くことと同じです。ただし、ここでのソリューションでは、実際にはベクトル計算ベースのテクニックがいくつか使用されています。 理解不能なブラックボックスこれまでの理解があれば、ChatGPT が神秘的なテクノロジーだとは思わないと思います。これは、通常の関数実装メカニズムとは少し異なります。 おそらく、このパラメータ最適化方法を使用して複雑な機能を実装すると、興味深く、刺激的なものになるでしょう。しかし、実際には、この実装方法にも問題があります。 おそらく最大の問題は、この機能がなぜ機能するのか理解するのが難しいことです。 これは、関数に多数のパラメータ、特に ChatGPT などの大規模なモデルが含まれていることが一因です。たとえば、ChatGPT3.5 バージョンには 1,750 億個のパラメータが含まれています。これほど多くのパラメータがある場合、各パラメータの役割を手動で分析することは明らかに不可能です。 一方、これらのパラメータがどのように計算されるかはわかりません。パラメータ調整プロセスにも非常に長い時間がかかり、入力と出力のペアが非常に大きくなるためです。これらのパラメータが最終的に最適値に近い点に収束できることは、数学的な観点からのみ説明できます。しかし、それぞれの最適化の具体的な影響を分析することはできません。 このような AI モデル、つまりインテリジェント機能は、それ自体が理解不能なブラックボックスであると言えます。 理解するのが難しいため、常に良好なパフォーマンスを発揮する一方で、特定のシナリオでは予想外に悪い結果になる可能性があるため、使用時には注意が必要です。これは、現在の人工知能技術が非常に優れているように見えるが、実際に実用化すると、常に何らかの問題が発生する重要な理由でもあります。 実際、ChatGPT に、ChatGPT モデルの適用においてどのような課題に直面するかを尋ねると、次のように返答されます。 ChatGPT には大きな可能性がありますが、いくつかの課題と制限も抱えています。たとえば、不正確または意図しない応答が生成されたり、偏見やデリケートなトピックの取り扱いに関する問題が発生する可能性があります。 要約する上記のことを理解した上で、ChatGPT をもう一度見てみると、不思議に思わなくなると思います。 ChatGPT のリリース以来、多くの人がこれは人類にとって汎用人工知能に向けた画期的な進歩であると信じていますが、一方で、実際には本質的な改善はないと考える人もいます。多くの人が自分のキャリア開発に深い不安を抱いており、多くの人がSFの世界の未来に触れたと感じており、多くの人がこれはまた一攫千金のチャンスだと考えています。 おそらく、機械学習技術の原理を理解して、それを合理的に理解できるようにすることが、すべての人に必要なのでしょう。 |
<<: クラウドベースの生成 AI システムを実行するためのベスト プラクティス
>>: 写真をビデオに変換するには、指 1 本だけが必要です。 Gen-2スポーツブラシが無料で利用可能になりました。ネットユーザー:史上最高のアップデート
SAP は、AI 時代において顧客がデータの潜在能力を最大限に活用し、より深い洞察、より速い成長、よ...
インテリジェンスは急速に増加しており、今日では、新しい生成型人工知能 (gen-AI) と機械学習 ...
最近、SNS上で「ZAO」と呼ばれるAI顔変換ソフトが話題になっている。人気が出る一方で、多くの疑問...
画像解析アプリケーションでは、大量の画像サンプルを効果的かつ自動的にフィルタリングすることが重要な基...
近年、機械学習は学術研究や実用化の分野でますます注目を集めています。しかし、機械学習モデルの構築は簡...
インテリジェントシステムは独自の初期目標を決定することはできませんが、経験に基づいて独自の派生目標を...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
フランスのリヨンに住む麻痺した男性、ティボーさんは、頭部に埋め込まれた2つのセンサーを頼りに、歩行を...
人工知能技術は急速に発展し、人々の生活に微妙な影響を与えています。掃除ロボット、調理ロボット、配達ロ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
大規模言語モデル (LLM) アプリケーションは世界中で急速に普及していますが、企業は依然として大規...
11月10日の早朝、OpenAIはGPTをリリースしました。ChatGPT Plusのすべての加入...
データは人工知能システムを構築するために必要な重要なインフラストラクチャです。データは、AI システ...
[[399636]] 【51CTO.com クイック翻訳】自然言語処理 (NLP) の定義自然言語...