近年、AIの波が全国を席巻し、さまざまな業界で人間の仕事がAIに置き換わっています。どんなに難しい問題でも、AIの力で解決できそうな気がします。では、AIとは一体何なのでしょうか?今日は、人類の長年の夢の技術であるAIについて、記事で簡単にご紹介したいと思います。 楽しい質問とゲーム AIはArtificial Intelligenceの略で、通常は人工知能または人工知能と翻訳されます。これは人類の長年の夢である技術です。1950年、天才科学者アラン・チューリングは論文「コンピュータと知能」の中で、「機械は考えることができるか?」という興味深い疑問を初めて提起しました。これにより、AIという新しい分野が開拓され、人々のAIに対する無限の想像力が刺激されました。 チューリングの考えによれば、機械が思考できるかどうかを判断するには、いわゆる模倣ゲームに合格する必要があります。このゲームはあまりにも古典的であるため、後にチューリング テストと呼ばれるようになりました。このテストでは、質問者 C が、異なる部屋にいる機械 A と人間 B に同時に質問を続けます。C がどちらがコンピューターでどちらが人間であるかを区別できない限り、部屋にある機械は思考する機械であると宣言できます。 網羅的から分類へ それ以来、人々は長い時間をかけて研究開発を行い、チューリングテストに合格できるマシンやアルゴリズムを作ろうとしてきました。1997年、当時最も先進的だったIBM Deep Blueコンピューターがチェスの世界チャンピオンに勝利しました。強力に見えましたが、それはコンピューターにあらゆる可能性を網羅的に列挙させ、最も有利な手順を選択させただけでした。率直に言えば、GPSナビゲーションシステムが既知のすべての地図経路から最適な経路を選択するのと何ら変わりありません。 しかし、無限の可能性を秘めた現実世界に直面して、このような力ずくの方法は、より複雑な現実世界のほとんどの状況には明らかに適用できません。日常生活にAIを適用するには、より効率的な方法を見つける必要があり、人間が知恵を蓄積する方法は良い参考方向です。 人間の知恵は経験から生まれます。つまり、継続的な学習と教訓の記憶、試行錯誤の繰り返しを通じて外界に対する自身の認識を調整することで、次に同様の状況に遭遇したときに、過去の経験を利用して未知の未来を簡単に判断し、対処することができます。同時に、記憶して処理する必要があるコンテンツを大幅に削減するために、人間は類似のものを分類してラベル付けし、大量の情報をいくつかのカテゴリにまとめることも得意です。同じ概念を応用すると、経験、つまり履歴データを機械に与えて学習させ、イベントの特性と結果の相関モデルを自動的に見つけて、将来の値を予測したり、自動的に分類して決定したりできるプログラムに変えることができるのではないでしょうか。 自動分類方法 値を予測することに関する非常に直感的なアイデアは、イベントの特徴と結果の間の数学的な線形関係を見つけることです。たとえば、ある地域で10平方メートルの家が10万元で販売され、別の20平方メートルの家が20万元で販売されたとします。この情報に基づいて、取引価格と平方フィートの関係は1平方メートルあたり約10万元であると合理的に推測できます。取引情報がますます増えると、勾配降下法などの手法を使用して、すべてのデータに最も適合する回帰線を見つけ、勾配降下数を使用して住宅価格を予測するモデルを取得することもできます。これがいわゆる線形回帰法です。 自動分類にはさまざまな方法があります。ここでは、その概要をご理解いただけるよう、いくつかの有名なアルゴリズムを紹介します。 バイナリ分類の問題に直面した場合、特徴と結果の関係を 0 と 1 のロジスティック曲線に投影することもできます。ここで、0 は 1 つのカテゴリを表し、1 は他のカテゴリを表します。このように、同様のアプローチを使用して、任意の数値を適切なカテゴリにマッピングするモデルを取得できます。これは、いわゆるロジスティック回帰法です。 決定木は、特徴と分類結果の関係を使用して、履歴データに基づいて「これならば、あれ」というステートメントが満載の決定木を構築し、さまざまな特徴を対応する適切な分類に分類できるモデルになります。 同じ問題に直面したとき、単一の特徴の重要性を過度に拡大することによる偏りを避けるために、いくつかの特徴をランダムに選択して複数の決定木を構築し、最終的に投票によって勝者を決定すると、単一の決定木よりも包括的で正しい答えが得られます。これがランダムフォレスト法です。 最近傍法(略して KNN)は、既存の履歴データに基づいて予測する新しいデータに最も近い特徴を持つ K 個の履歴データを直接比較して、どのカテゴリに属するかを確認し、投票によって新しいデータが属するカテゴリを決定します。 サポート ベクター マシン (SVM) は、分類の目的を達成するために、最も近いデータ ポイントからできるだけ離れた境界を作り、異なる分類グループ間の境界線を見つけようとします。 上記はすべて、履歴データに標準的な回答があり、特徴と結果の相関関係に適合するモデルを見つけようとしている状況です。これにより、新しいデータを同じモデルに適用して適切な予測結果を得ることができます。では、所有するデータが一度も分類されていない場合、それらを自動的にグループ化する方法はあるのでしょうか?いくつかの: K 平均法アルゴリズムは、まずすべてのデータから K 個の中心点をランダムに選択します。次に、個々のデータを最も近い中心点に従って K 個のグループに分割し、各グループの平均値を新しい K 個の中心点として使用して、再び K 個のグループに分割します。類推すると、データは最終的に互いに類似した K 個のグループに収束します。上記はすべて、履歴データがある場合にデータを使用してモデルを構築するアルゴリズムです。履歴データがない場合はどうなりますか? 強化学習 強化学習(略してRL)は、概念的には、履歴データなしでモデルを直接使用環境に投入し、一連のアクションを通じて環境の状態を観察し、環境から報酬またはペナルティのフィードバックを受け取ることでモデルを動的に調整します。このようにして、トレーニング後、モデルは最大の報酬を得られるアクションを自動的に実行できます。 機械学習アルゴリズムがこれほどたくさんある中で、まず直面する問題は、どのアルゴリズムを適用するかということです。アルゴリズムの選択に関しては、通常、学習に使用した履歴データに標準的な答えがあるかどうか、教師あり学習か教師なし学習かでアルゴリズムを2つのカテゴリに分け、さらに達成できる効果に応じて細分化します。履歴データを使用しない強化学習に関しては、この2つのカテゴリから独立しており、独自のスタイルです。 さらに、各アルゴリズムの特性と仮定も考慮する必要があります。さらに、データの量、モデルのパフォーマンスと精度のトレードオフなど、さまざまな要因があります。より良い方向性を持てるように、アルゴリズムの選択をSOPにする人もいます。それでも、さまざまな種類の問題に対応するこの方法は、これらの比較的単純なアプリケーションシナリオにのみ適用でき、より高レベルで複雑なアプリケーションに適用することは困難です。これが機械学習の唯一の方法なのでしょうか? 高度な AI - ディープラーニング 模倣が得意な人間は、機械学習の開発と同時に、自らの脳のニューロンを模倣することにも着目してきました。人間の脳は単純なニューロンのみで構成されていますが、数千億から数千億のニューロンの相互接続を通じて知能を生み出すことができます。では、同じ概念を使って、機械に、一撃で世界を征服するという普遍的なメカニズムをシミュレートさせ、知能を生み出させることはできるのでしょうか? このアイデアはニューラル ネットワークの分野を切り開き、後にディープラーニングへと発展しました。脳のニューロンには、他のニューロンから活動電位を受け取る樹状突起が多数あります。これらの外部活動電位は細胞内に統合されます。電位が閾値を超えている限り、連鎖反応が引き起こされ、このニューロンの活動電位情報が軸索を通じて次のニューロンに伝達されます。
同様に、脳ニューロンのメカニズムをデジタル ロジック方式でシミュレートできます。これをパーセプトロンと呼び、m 個の入力 * バイアスが含まれます。重み付け乗算と合計の後、活性化関数を使用して脳ニューロンの潜在的な閾値メカニズムをシミュレートします。最後に、このノードの活性化の度合いが出力され、次の層のパーセプトロンに渡されます。 現実に解決すべき問題のほとんどには単純な線形解がないため、通常は、0 から 1 の間のシグモイド関数、-1 から 1 の間の双曲正接関数、最も一般的に使用される線形整流関数やその他の変形などの非線形関数の活性化関数を選択します。 多数のパーセプトロンを層状に接続すると、ディープラーニング モデル アーキテクチャが形成されます。このモデルをトレーニングするには、まずデータを 1 つずつモデルに入力し、順方向伝播を実行します。出力結果と標準回答を損失関数に代入し、両者の差を計算します。次に、勾配降下法などの最適化関数を使用して逆方向伝播を実行します。各パーセプトロンの重みは、差を小さくすることを目的として調整されます。データの量が十分に大きい限り、データが 1 つずつモデルの自己修正に前後に流れるにつれて、モデル出力と標準回答の差は徐々に収束して減少します。モデルによって得られた回答と標準回答の差が許容できるレベルまで十分に小さくなると、モデルは十分にトレーニングされた使用可能なモデルであることを意味します。 この概念は単純に思えるかもしれませんが、それを実現するには大量のデータ、大量の計算能力、そしてシンプルで使いやすいソフトウェアが必要です。そのため、この3つの条件が満たされた2012年以降、ディープラーニングはついに開花し、爆発的に成長し始めました。 実用的な問題を解決する コンピュータービジョンの分野では、畳み込みニューラルネットワーク(CNN)を使用できます。まず、少数のフィルターを使用してエッジや形状などの画像の特徴を取得し、これらの意味のある特徴を前述のディープラーニングモデルに接続します。これにより、写真や画像内のオブジェクトを効果的に識別できます。このように、コンピューターは画像認識の精度で人間を上回り、改善を続けています。
生成的敵対的ネットワーク(GAN)は、画像や芸術的なスタイルを模倣するために使用できます。2つのディープラーニングモデルの競争を通じて、模倣の達人になることを目指す生成モデルは偽のデータを生成し、それを識別モデルに渡してデータが本物か偽物かを判断します。生成モデルによって生成された偽のデータによって、識別モデルが本物と偽物の区別を困難にすると、成功です。一部の顔を変えるアプリやAIによって生成された絵画はすべて、GANに関連するアプリケーションです。
音声やテキストなどの自然言語処理(NLP)の場合、この種のシーケンシャルデータは従来、再帰ニューラルネットワーク(RNN)を使用して処理され、各トレーニングのモデル状態を次のトレーニングに渡すことで、シーケンシャル短期記憶の効果を実現できます。長期短期記憶ニューラルネットワーク(LSTM)の高度なバージョンは、RNNの長期記憶減少効果を改善するために使用されます。同様の問題に対して、後に誰かがTransformerと呼ばれる別のより効率的なソリューションを提案しました。これは概念的にアテンションメカニズムを使用して、モデルが重要な部分を直接処理できるようにします。このメカニズムは自然言語処理に適しているだけでなく、コンピュータービジョンの分野でも良い結果をもたらします。
2020年には、1750億のモデルパラメータを持つ超大規模モデルGPT-3が、人間よりも優れた品質で記事やプログラムコードを自動的に生成したり、質問に答えたりできるようになりました。今後、モデルパラメータの数は指数関数的に増加し続けているため、このようなモデルの実用化結果はさらにエキサイティングです。前述のコンピュータービジョンと自然言語処理の2大分野に加えて、ディープラーニングはさまざまな分野でも驚くべき成果を上げています。 2017年、ディープラーニングと強化学習を組み合わせたAlphaGoは、力ずくで打ち負かすことができない囲碁の分野で、世界一の囲碁プレイヤーである柯潔を3対0で破り、世界に衝撃を与えました。これは、AIが急速な自己学習を通じて、特定の分野で人類が蓄積してきた数千年の知恵を超えることができると宣言したに等しいものでした。2020年、AlphaGoの研究開発チームDeepMindは、再びディープラーニングを使用して、生物学を50年間悩ませてきたタンパク質分子の折り畳み問題を解決しました。 これは、人類が病気のメカニズムを理解し、新薬の開発を促進し、農業生産を助け、そしてタンパク質を利用して地球の生態環境を改善するのに、より実用的に役立つでしょう。より生命に近い自動運転の開発は当然のことです。現在の自動運転技術は、累積走行距離が増加し続けるにつれて成熟しており、事故率は長い間人間よりもはるかに低くなっています。同時に、一部の医学分野におけるAIの診断精度は、人間よりも優れたレベルに達しています。無人店舗や中国のスカイネットについては、もはやそれほど目新しい話題ではありません。 結論 ここで、1950 年のチューリングの問い「機械は考えることができるか?」を振り返ってみましょう。まだ明確な答えは出せないかもしれませんが、現代人類は過去よりも多くの技術的成果を積み重ね、この夢に近づき、前進し続けています。現在のAI技術は、学習して成長している子供のようなものです。AIは、枠組みを超えて、人間の過去の認知能力を超えて、特定の問題に対して、見たり、聞いたり、話したり、正確な判断を下したりできます。しかし、複雑な哲学的、感情的、倫理的、道徳的な問題に遭遇すると、まだ有能には程遠いです。
一般的に言えば、人間と機械にはそれぞれ長所があります。人間は思考と革新が得意ですが、体力には限界があり、時々ミスを犯します。機械は記憶と計算が得意で、特定の問題に対して24時間365日、安定した高品質の回答を提供できます。したがって、このAIの波では、人間と機械が完全に協力し、お互いの長所を活用することが理想的な戦略であるはずです。人々は、比較的低レベルで反復的で些細で退屈な作業を徐々に機械にアウトソーシングできます。同時に、解放された人的資源は、より多くの探究、研究、創造性、より興味深い仕事に投資できるようになります。このようにして、人々は自分の夢を実現し、人生の意味について考えるための時間とエネルギーを増やすことができ、重要な問題の解決にさらに集中して、人類の全体的なレベルを向上させることができます。 |
半年以上にわたる大規模なモデル嵐の後、AIGC 市場には新たな変化が起こり始めました。クールな技術デ...
ベンチャーキャピタルの億万長者マーク・アンドリーセン氏は、世界は現在人工知能に関して「ヒステリー」状...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
Copilot のリリース 1 周年を記念して、一連のメジャー アップデートが予定されています。 ...
一方で感染症の予防と抑制、他方で春節の旅行ラッシュの帰省があり、今年の仕事再開への道のりは異例のもの...
[[402797]]この記事はWeChatのパブリックアカウント「Big Data DT」から転載し...
2回の会期は3月20日に終了した。今年の全国人民代表大会では、政府活動報告に「人工知能」が再び記載...
時間と空間を結びつけるのは速度であり、エネルギーと質量を結びつけるのも速度です。事実と価値を結びつけ...
昨年のNVIDIAのGTCで「Virtual Huang」はどのようにして作られたのでしょうか? ブ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能は、すべての人の生活に欠かせないものとなっています。 YouTube のおすすめなどの単純な...