生成型人工知能に関する簡単な議論

生成型人工知能に関する簡単な議論

生成AIには長い歴史があります。いくつかの情報源によれば、1950 年代にはすでに登場していたようです。他の情報源によると、最初の初歩的なチャットボットは 1960 年代に登場したそうです。本当の起源が何であれ、過去 1 年間に登場した膨大な数の研究論文、アプリケーション、ニュース レポート、ブログ投稿、会話、特にコンピューター ビジョン モデル (Stable Diffusion、Midjourney、DALL-E などの画像とビデオのディープラーニング) や大規模言語モデル (GPT-3、GPT-4、およびこの記事のタイトルで言及した優れた例を含むテキストと言語のディープラーニング) における生成 AI の出現と比較すると、これらは歴史のタイムライン上の単なる小石に過ぎないと考えます。

生成 AI は、特定の種類のコンテンツの過去のトレーニング例から新しいテキスト、画像、音楽、ビデオを作成するなど、新しい独自のコンテンツを生成できるシステムのトレーニングと展開に重点を置いた人工知能 (AI) の分野です。これは構造化データ(データ テーブル、時系列、データベースなど)に適用できますが、非構造化データ(画像やテキスト)に適用すると、さらに画期的かつ世界的に注目されるものになります。事前に定義されたルールやパターンに依存する従来の AI モデルとは異なり、生成 AI モデルは大量の過去のデータから学習することで新しい出力を生成できます。生成 AI の中核となるのは、機械学習 (ML) と統計の概念です。 (もちろん、統計学習と機械学習はすでに密接に関連しています。)

生成 AI に現れる ML の特定の側面に関して言えば、ML のサブセットは教師なし学習と呼ばれ、特定のデータセット内の繰り返しパターンと構造を学習するために使用されます。これらのパターンは「統計的な超能力を備えた構成要素」(誇張表現はご容赦ください)となり、論理的に意味があり、統計的に実行可能なグループに組み合わせて、トレーニング データ(テキストまたは画像)に非常に類似した新しいコンテンツ(多くの場合、非常に新しいコンテンツ)を生成することができます。このプロセスは教師なし学習です。その目的は、既知のパターンを分類、ラベル付け、または複製すること (教師あり学習) ではなく、非構造化データ内の複雑なパターンを発見すること (独立成分分析 ICA の一般的な形式に似ていますが、主成分分析 PCA に似ていますが同じではありません) であるためです。 ICA は、ブラインド ソース分離や「カクテル パーティー問題」などの信号処理で使用され、複雑な信号を識別して独立した加法サブコンポーネントのセットに分離する計算手法です。

生成 AI における統計の出現に関しては、マルコフ モデルとベイズ学習の基礎となる重要な統計概念の多くに遭遇します (したがって、生成 AI の起源は 1950 年代にあります)。これらの方法の基礎となる条件付き確率の歴史は、はるか昔、最も有名なのはトーマス・ベイズ牧師まで遡ります (ベイズの定理は 1763 年に発表されました)。生成 AI は条件付き確率を使用して、非常に複雑で大規模な多変量データを処理し、ユーザーのクエリ (つまり、ユーザープロンプト) に応じてこれらの構成要素 (教師なし ML によって学習されたパターンと構造) の最も可能性の高い組み合わせを計算します。

したがって、生成 AI が新しい出力を構築できるようにする「秘密のソース」は、次の 3 つの基本構造で構成されます。(1) すべての可能な材料のリポジトリ (つまり、トレーニング データ内の ML 学習パターンと構造)、(2) ユーザーの意図 (つまり、ユーザーのクエリで提供される多数のパーソナライズされたリクエストのオプション メニュー。これは、ユーザーのニーズを示すプロンプトのカテゴリです)、(3) レシピ (つまり、統計的にユーザーのクエリを満たす可能性が最も高い出力を生成する材料の組み合わせと順序を計算する統計モデル)。

ここで少し補足すると、クエリの「コンテキスト」も基本的に重要ですが、生成 AI の「パーソナライゼーション」の部分が、ユーザーの意図を示すプロンプトにすでに反映されていることを期待しています。最善の(最も有益で、満足度が高く、パーソナライズされた)応答を得るには、適切なコンテキストを適切なプロンプト エンジニアリングで提供することが大きく関係します。これは、「仕事の未来」における新しい職務スキルになりつつあります。

この投稿を書いているときに、ChatGPT を使用して食べ物の比喩をインスタンス化することにしました。そこで、私は ChatGPT に質問しました。「ハワイの地元フルーツとスパイスを使ったパイのレシピを教えてください。」返信は次のとおりです。「Kirk Borne が ChatGPT にハワイアン パイのレシピを尋ねました」(この記事では具体的なレシピは省略されています)。このブログを終わらせて、パイを作りに行きます。

これらはすべて魅力的で、刺激的で、爽快で、爆発的な変革をもたらすものですが、私たちも教育を受ける必要があります。もっと正確に言えば、経営幹部やその他のリーダーが FOMO に陥り、競合他社や他の市場に遅れをとることを恐れて「今すぐ生成 AI をください」と言う前に、企業内でそのような展開が成功し、生産的になるための基盤を築く必要があります。配合されている主な成分は何ですか?ここに3つあります:

  • データ リテラシー: 人々は、データとそれがビジネス上の洞察と価値をどのように提供するかを理解する必要があります。企業にはどのような種類のデータが存在するか、このデータはどこに保存されているか、誰がこのデータを使用しているか、データはどのようなビジネス目的に役立つか、このデータにアクセスして使用するための倫理的 (ガバナンスまたは法的) 要件は何か、そして最終的に、このデータは生成 AI (大規模言語またはビジョン モデル) のトレーニングに十分かどうかを理解する必要があります。
  • データの品質: これ以上言う必要はありますか?さて、ここに来ました: GIGO「ゴミを入れればゴミが出る!」ブラックボックス ML モデル、特に大量のデータを消費するモデル (ディープラーニング、人工知能、生成 AI など) では、ダーティ データはさらに有害です。データがクリーンでない場合、モデルの解釈可能性は無意味になり、モデルの信頼性が失われます。
  • データ/ML エンジニアリング インフラストラクチャ: データ サイエンティストのラップトップで実行される探索的 ML モデルと、企業が大きな賭けと信頼を寄せる、ビジネス全体で実行される展開、検証、管理された企業全体のモデルとの間には大きな違いがあります。ネットワーク、ストレージ、コンピューティング インフラストラクチャなど、インフラストラクチャは AI に対応している必要があります。この強靭な基盤がなければ、最悪のタイミングで現れる生成 AI の「デモ デーモン」よりも、会議室の CEO のラップトップで実行される ML モデルのほうが優れている可能性があります。

元のタイトル:この記事はChatGPTに関するものだと思っているでしょう

オリジナル記事:カーク・ボーン


<<:  スペイン・ラ・リーガ:AIと機械学習でファン体験の変革に取り組む

>>: 

ブログ    
ブログ    

推薦する

人工知能は学習を通じて人類を自然災害から救うことができます。

通常、人間が機械を作るのは、達成するのが難しいタスクを人間が完了するのを助けるためだけです。自然災害...

ニューラルネットワークが大きいほど良いのはなぜですか? NeurIPSの論文が証明:堅牢性は一般化の基礎である

ニューラルネットワークの研究方向が徐々に超大規模な事前トレーニング済みモデルへと移行するにつれて、研...

人工知能の未来を説明する15の統計

[[206292]]人工知能は非常に人気があり、それに対して楽観的な人もいれば、悲観的な人もいます。...

ガートナー:持続可能性とデジタル主権がパブリッククラウドベースのAIサービスを選択する際の最重要基準となる

ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...

マイクロソフト:新しいアルゴリズムにより Windows 11 の累積アップデートのサイズが 40% 削減

本日、Windows 11 システムは Patch Tuesday でリリースされた最初の累積的な更...

機械学習の神話を暴く - 機械学習に関する一般的な神話はどこから来たのか?

機械学習について多くの誤解を持っていると、その人のキャリアや評判に悪影響を与える可能性があります。 ...

絶対に対立なんかじゃない!短期的にはAIが人間に取って代わることができない5つの分野

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

規制がなければ、AIは金融危機を引き起こす可能性がある

人工知能の影響はビジネス界のほぼすべての側面に広がっており、金融業界も例外ではありません。金融業界の...

今年、データ サイエンティストはどのようなアルゴリズムを使用しましたか?

「データが王様」と言われる今日の世界では、データサイエンスに興味を持つ人が増えています。データ サ...

Kevin P. Murphy の「確率的機械学習: 上級」が PDF でダウンロードできるようになりました。

本日、Google の研究科学者 Kevin P. Murphy 氏は、「確率的機械学習: 上級」の...

GPT-4.5 と同等のコードインタープリター! GPT-5をトレーニングせずに、OpenAIは依然としてAGIに向けて競争している

先週、シリコンバレーのスタートアップオタクや研究者が更新するポッドキャスト「Latent Space...

...

人工知能は爆発的に発展しないので、バブルには注意が必要

2016年頃から、中国では人工知能への注目が高まり続けた。インターネット大手のテンセントは同年にAI...

人工知能が人間の労働力に完全に取って代わった後、労働者は何をすべきでしょうか?彼らは職を失うのでしょうか?

友人の輪の中で小さなボスがチキンスープを作っているのをよく見かけます。「すべての労働者の皆さん、仕事...