写真 トークン、ベクトル、埋め込み、アテンション、これらの AI モデル用語は、いつも馴染みがありそうでもあり、馴染みがないと感じますか? 答えが「はい」の場合、本日のポピュラー サイエンスの記事は見逃せません。多数の例と視覚的なグラフィックを組み合わせて、最も単純なものから最も複雑なものまで、AI ビッグモデルの中核となる概念を説明します。 導入テクノロジー企業の継続的な進歩と国際競争により、AIビッグモデルは私たちの生活にますます統合されるようになりました。一般の人にとっては、高度な AI アルゴリズムを勉強する必要はないかもしれませんが、この AI の波に取り残されないようにするには、LLM の原則について基本的な理解が必要です。 LLM (大規模言語モデル) がどのようにテキストを生成するかを理解することは、これらのモデルがなぜこれほど多用途な認知エンジンであるのか、そして他に何を作成するのに役立つのかを理解することです。 トークンとベクトル化まず、トークン化とベクトル化から始めましょう。この部分では、AIビッグモデルの最初のレイヤー、つまりAIビッグモデルが人間の言語をどのように理解するかを明らかにします。この部分の説明は、AI ビッグモデルの基本的な数学的観点を構築するのにも役立ちます。
写真
写真
写真
写真
写真
写真
写真
写真
写真 トランス大規模モデルが人間の言語をどのように理解するかを理解した後、それは特別なことではなく、LLM によって実証された強力な機能と一致していないと感じるかもしれません。そうです、トークン化とベクトル化だけでは、LLM をそれほどスマートにすることはできません。次に、AI モデルの核心である Transformer に進みましょう。LLM が現在のようにスムーズに解析および書き込みできるのは、Transformer のおかげです。Transformer は、コンピューターが言語を理解する方法を根本的に高速化し、強化します。 トランスフォーマー モデルに関する研究は、2017 年 6 月に Google の 8 人の AI 研究者によって初めて発表されました。AI の新時代を開いたのは、よく知られている「Attention is All You Need」でした。Attention は、私が以下で焦点を当てる中核概念でもあります。上記の数学モデルに基づいて、LLM の基本的な概念的抽象化を構築できるように導きます。
写真
写真
写真
写真
写真
写真
写真 これらの文を組み合わせると、モデルは付随するテキストに注意を払うことで、各単語の正しい意味を識別することができます。
写真
写真
写真
写真
写真
写真
写真
写真 法学修士LLM の基本的な数学原理とモデル概念の抽象化を理解した後、ワクワクしてきましたか? 最後に、世界で最も先進的な大規模予測モデルが、このような多彩な AI アプリケーションの世界を構築するために何をしたかを見てみましょう。 ビッグモデルがビッグと呼ばれる理由は、そのトレーニングがインターネット全体の基本コーパスによってサポートされているからです。この巨大なコーパスから、モデルはパターンを認識し、最終的に次善の選択肢を予測することを学習します。次に、大きなモデルに向き合って、LLM がどのように知性を備えて出現し、最も人間に近い人工知能になるのかを明らかにします。
写真
写真
写真
写真
写真
写真
写真
写真 要約するトランスフォーマーは、さまざまな最先端の AI アプリケーションの作成につながりました。 Bard や ChatGPT などのチャットボットの駆動に加え、モバイル キーボードのオートコンプリート機能やスマート スピーカーの音声認識も駆動します。 しかし、その本当の力は言語を超えたところにあります。発明者は、トランスフォーマー モデルが繰り返し現れるテーマやパターンを認識し、予測できることを発見しました。 Dall-E、Midjourney、Stable Diffusion などのツールを使用した画像内のピクセルから、 GitHub Copilot などのジェネレーターを使用したコンピューター コードまで。音楽の音符やタンパク質の DNA を予測して、薬物分子の設計に役立てることもできます。 何十年もの間、研究者たちは要約、翻訳、検索、取得を行うための専門モデルを構築してきました。トランスフォーマーはこれらのアクションを単一の構造に統合し、多種多様なタスクを実行できるようにします。 統一された言語モデルを通じて、画像、音楽、ビデオからのマルチモーダルアプリケーションが実現され、これはこれまでのすべての AI アプリケーションよりも強力です。これがこのストーリーの魔法の部分です。 参考リンク: [1] https://ig.ft.com/generative-ai/ |
<<: 自動テストの落とし穴は何ですか?どうすれば解決できるでしょうか?
>>: AI規制に関するマスク氏の見解:規制は面倒だが、審判がいるのは良いことだ
現在のディープラーニング フレームワークに関しては、TensorFlow と PyTorch を避け...
CoRL は 2017 年に初めて開催されて以来、ロボット工学と機械学習の交差点における世界トップ...
[[409661]]画像はBaotu.comより顔認識は、多くのソフトウェアの ID セキュリティ...
[51CTO.com クイック翻訳]近年、人工知能技術の発展と進歩に伴い、コンピュータービジョンとデ...
純資産が1,050 億ドルあるにもかかわらず、彼は今でも毎日自分でコードを書いています。 ?彼の名前...
PCMag が調査を実施したところ、ユーザーの 68% が、さまざまなスマートホーム製品が知らないう...
[[322342]]現在、人工知能はさまざまな分野でその力を発揮しています。特に、電子商取引サービス...
[[348783]] Canvaからの画像テクノロジーは生活の中でどのような役割を果たしているのでし...
今日の人気のディープラーニング モデルはブラック ボックスであるとよく言われます。つまり、入力を与え...
[[181277]]オーストリアの記号計算研究所 (RISC) の Christoph Koutsc...
[51CTO.comからのオリジナル記事] Tmall Genie X1、Xiaomi AIスピーカ...
無人運転技術の研究に対する熱意は相変わらず高いが、現実は市場に冷水を浴びせかけている。今後15年間で...