AIに切り替えたい人向け:人工知能ガイドはこちら

AIに切り替えたい人向け:人工知能ガイドはこちら

人工知能とは何でしょうか? なぜ重要なのでしょうか? 人工知能を恐れるべきでしょうか? なぜ突然、みんなが人工知能について話しているのでしょうか?

AI が Amazon や Google のバーチャル アシスタントにどのような影響を与えているか、あるいは AI が徐々にすべての仕事を奪いつつある (物議を醸している) といった記事を読むことがあるかもしれませんが、こうした記事では AI とは何か (あるいはロボットが取って代わるかどうか) についてはほとんど説明されていません。この記事では人工知能について説明します。この簡潔なガイドは、この分野が発展し、重要な概念が出現するにつれて更新され、改善される予定です。

人工知能とは何ですか?

人工知能は、学習メカニズムを備えたソフトウェアまたはコンピュータ プログラムです。 AI は人間と同じように、この知識を使用して新しい状況で意思決定を行います。ソフトウェアを開発した研究者たちは、AI が何かを学習できるように、画像、テキスト、ビデオ、または音声を読み取ることができるコードを記述しようとしています。 機械が何かを学習したら、その知識を他の場所でも使用できるようになります。 アルゴリズムが誰かの顔を認識することを学習すれば、Facebook の写真からその人を見つけることができます。 現代の AI では、学習は「トレーニング」と呼ばれることがよくあります (これについては後で説明します)。

人間は複雑な概念を自然に学習します。リンゴのような物体を見て、後で別のリンゴだと認識することができます。 マシンは非常に文字通りです。コンピューターには「類似」という柔軟な概念がありません。人工知能の目標は、機械がテキストのみに基づいて形成する概念を削減できるようにすることです。 機械にとって、2 つのリンゴの画像や 2 つの文章がまったく同じかどうかを判断するのは簡単ですが、AI は、同じリンゴを異なる角度や異なる照明で撮影した写真を認識するように設計されており、視覚的な角度を捉えてリンゴを識別します。これは「一般化」と呼ばれ、AIが見た画像やテキストだけでなく、データの類似性に基づいてアイデアを形成することです。 より一般的な考え方は、AI がこれまで見たことのないものにも適用できます。

「人工知能の目標は、複雑な人間の行動を計算可能な形にまで簡略化することです」とカーネギーメロン大学のコンピューターサイエンス教授アレックス・ルドニッキー氏は言う。「これにより、人間にとって有用な複雑な活動を実行できるシステムを構築できるようになります。」 ”

私たちは現在、人工知能からどれくらい離れているのでしょうか?

AI 研究者たちは、この問題の基礎についてまだ研究を続けています。 コンピューターに、画像や動画で見たものを認識させるにはどうすればよいでしょうか。そして、認識から理解へと移行するにはどうすればよいでしょうか。つまり、「リンゴ」という単語を生成するだけでなく、リンゴがオレンジやナシと関連のある食べ物であること、人間がリンゴを食べ、リンゴを使って料理をし、リンゴを使ってアップルパイを作ることができること、ジョニー・アップルパイの物語に関連付けることなどを認識するのです。 言語を理解するという問題もあります。言葉は文脈に応じて複数の意味を持ち、定義は常に進化しており、人によって言い方が少しずつ異なります。 コンピューターはどのようにしてこの流動的で常に変化する言語構造を理解するのでしょうか?

メディアが異なれば、人工知能の進歩も異なります。今日、画像や動画を理解する能力は驚異的な成長を遂げており、業界ではこれをコンピューター ビジョンと呼んでいます。しかし、この進歩は、自然言語処理と呼ばれる分野における AI の理解の残りの部分にはあまり役立っていません。これらの分野では限られた知能が開発されており、AI は画像、音声、テキストの処理に強力ですが、3 つすべてから同じ方法で学習することはできません。学習の不可知論的形態の 1 つは、人間に見られる一般的な知能です。多くの研究者は、さまざまな分野の進歩によって、機械に学習させる方法についての共通の真実がさらに明らかになり、最終的には AI への統一されたアプローチに収束することを期待しています。

人工知能はなぜ重要なのでしょうか?

AI が画像からリンゴを識別したり、音声クリップからスピーチクリップを書き起こしたりする方法を学ぶと、他のソフトウェアで使用して、通常は人間が行う必要がある決定を下すことができます。これを使用すると、Facebook 上の友達の写真を識別してタグ付けできます。これは、本来は人間が手動で行うべき作業です。自動運転車内や自分の車のバックアップ画像内で他の車や道路標識を識別できます。農業生産から排除すべき品質の悪い農産物を見つけるために使用できます。これらのタスクは、画像認識のみに基づいており、通常はユーザーまたは企業からソフトウェアを提供された人々によって実行されます。

タスクがユーザーの時間を節約する場合、それは機能であり、それが会社で働く誰かの時間を節約したり、仕事を完全になくしたりすると、それは大きなコスト節約になります。売上分析のために数百万のデータポイントを数分で処理するなど、機械がなければ不可能なアプリケーションもあり、これはこれまで入手できなかった新しい情報が得られる可能性があることを意味します。これらの作業は、今ではいつでもどこでも機械によって迅速かつ安価に実行できます。これはかつて人間が行っていたタスクの複製であり、無限に拡張可能な低コストの労働力にとって否定できない経済的利益となります。

カーネギーメロン大学ヒューマン・コンピュータ・インタラクション研究所のジェイソン・ホーン教授は、AIは人間の仕事を再現できるが、新たなタイプの労働を開拓する力も持っていると語った。 「自動車は馬の直接的な代替品でしたが、中長期的には、大型輸送用の大型トラック、家具移動用トラック、ミニバン、オープントップの自動車など、他の多くの用途につながりました」とホン氏は述べた。「同様に、AIシステムは短期的には定型的な作業を直接的に置き換えますが、中長期的には自動車と同じように劇的な用途が見られるでしょう。」

ゴットリープ・ダイムラーやカール・ベンツが、自動車が都市の建設方法をどのように再定義するか、あるいは汚染や肥満の影響を考慮に入れなかったのと同じように、私たちはこの新しいタイプの労働力の長期的な影響をまだ見ていません。

AI が 30 年前 (または 60 年前) ではなく、今これほど人気が​​あるのはなぜでしょうか?

AI がどのように学習すべきかについての多くのアイデアは、実のところ 60 年以上も前のものです。 1950 年代に、フランク・ローゼンブラット、バーナード・ウィドロー、マーシアン・ホフなどの研究者が、生物学者が脳のニューロンの働きをどのように考えていたか、そして数学的に何を行っているかを初めて調査しました。 1 つのマスター方程式ではすべての問題を解決できないかもしれないが、人間の脳のように、連結された多くの方程式を使用したらどうなるか、というのがアイデアです。最初の例は単純で、デジタル電話回線から送られてくる 1 と 0 を分析し、次に何が起こるかを予測するというものでした。 (プリンストン大学のウィドローとホフが行ったこの研究は、電話接続時のエコーを減らすために今でも使用されています)。

[[209102]]

ダートマス会議から50年後の2006年、参加者はダートマスで再会しました。左から: ムーア、マッカーシー、ミンスキー、セルフリッジ、ソロモンオフ

数十年にわたり、コンピューターサイエンス界隈の多くの人々は、このアイデアでは複雑な問題を解決することはできないと信じていましたが、現在では、Google、Amazon、Facebook、Microsoftなど大手テクノロジー企業における人工知能の実装の基礎となっています。振り返ってみると、研究者たちは、コンピューターがまだ脳内の何十億ものニューロンをシミュレートできるほど洗練されておらず、私たちが理解しているようにこれらのニューラル ネットワークをトレーニングするには膨大な量のデータが必要だったことに気づいています。

これら 2 つの要素、つまりコンピューティング能力とデータは、過去 10 年間で初めて利用可能になりました。 2000年代半ば、グラフィックス プロセッサ ユニット (GPU) 企業の NVIDIA は、自社のチップがニューラル ネットワークの実行に適していることを実証し、自社のハードウェア上で AI をより簡単に実行できるようにし始めました。研究者たちは、より高速で複雑なニューラルネットワークを使用すれば精度が向上する可能性があることを発見した。

その後、2009 年に AI 研究者の Fei-Fei Li 氏が、整理されラベル付けされた 300 万枚以上の画像を含む ImageNet と呼ばれるデータベースをリリースしました。これらのアルゴリズムにパターン間の関係性を見つけるための例がもっとあれば、より複雑なアイデアを理解するのに役立つだろうと彼女は考えています。彼女は 2010 年に ImageNet コンテストを開始し、2012 年までに研究者の Geoff Hinton が数百万枚の画像を使用してニューラル ネットワークをトレーニングし、他のアプリケーションを 10% を超える大きな差で上回る精度を達成しました。 Li 氏が予測したように、データが鍵となります。ヒントン氏はニューラルネットワークを積み重ねて、あるニューラルネットワークが形状を見つける間に別のニューラルネットワークがテクスチャを調べるといったことも行いました。これらはディープ ニューラル ネットワーク、またはディープラーニングと呼ばれ、人工知能に関して今日ニュースでよく耳にするものです。テクノロジー業界がその結果を目にすると、AIブームが始まりました。数十年にわたってディープラーニングに取り組んできた研究者たちは、テクノロジー業界の新たなロックスターとなっている。 2015 年現在、Google には何らかの形の機械学習を使用する 1,000 を超えるプロジェクトがあります。

私たちは人工知能を恐れるべきでしょうか?

『ターミネーター』のような映画を見た後では、スカイネットのような全能の邪悪な AI を恐れるのは簡単です。人工知能研究の分野では、スカイネットは汎用超知能、あるいは人工汎用知能と呼ばれ、あらゆる面で人間の脳よりも強力なタイプのソフトウェアです。

[[209103]]

コンピューターは拡張可能なので、より強力で高速なコンピューターを構築し、それらを接続することができます。懸念されるのは、これらのロボットの脳の計算能力が計り知れないレベルにまで成長する可能性があり、それほど賢ければ制御不能となり、シャットダウンしようとする者を回避してしまうということだ。これは、イーロン・マスクやスティーブン・ホーキングのような非常に賢い人々が懸念しているような終末の日です。マスク氏が述べたように、確かにいくつかの分野では知能を備えているものの、主流のAI研究者のほとんどは悪魔を召喚するという考えに懐疑的です。研究者たちは学習の基本原理を分解してきたが、例えばパターンの背後にある意味を理解する方法を変え、その新しい理解を機能的な世界観にまとめてきたが、コンピューターが生き残るためのニーズや欲求、意志を持っているという証拠はまだないと、フェイスブックのAI研究センターを率いるヤン・ルカン氏は述べた。

「脅威を感じたとき、嫉妬したとき、資源にアクセスしたいとき、見知らぬ人よりも近親者を好むときなどに私たちがより暴力的になる行動は、生存のために進化によって私たちの中に組み込まれている。私たちがこれらの基本行動をインテリジェントマシンに明示的に組み込まない限り、それらは機械に備わらないだろう」と彼はQuoraに書いた。

コンピュータにとって人間を脅威とみなすという証拠はありません。なぜなら、コンピュータにとってそのような脅威が定義されていないからです。おそらく人間はそれを定義し、存在しない生きる意志のように機能するパラメータの範囲内で動作するように機械に指示できるだろう。

Google の創立メンバーであり、Baidu の元 AI 責任者である Andrew Ng 氏は、「AI が悪に変わることを心配していない理由は、火星の人口過剰を心配していない理由と同じだ」と述べた。しかし、AI を恐れる理由はある。それは人間だ。

AI は学習するデータから人間の偏見を拾い上げることに敏感であるという証拠があります。これらのバイアスは無害な場合もあります。たとえば、猫の写真の方が犬の写真よりも一般的であると認識するのは、猫の写真でトレーニングされたためです。しかし、医師を他の性別や人種よりも白人男性と関連付けるなど、固定観念を永続させる可能性もあります。このような偏見を持つ AI に医師の採用を任せた場合、白人男性ではない従業員に対して不当な差別を行う可能性があります。プロパブリカの調査により、有罪判決を受けた者への判決を下す際に使用されるアルゴリズムが人種的に偏っており、有色人種に対してより厳しい判決を下していたことが判明した。医療データには女性、特に妊婦が含まれないことが多く、こうした個人に対して医療上の推奨を行うシステムが不完全になっています。これらのメカニズムは以前は人間によって行われていましたが、現在ではより高速で強力なマシンが存在するため、これらの決定が倫理基準の範囲内で公平かつ一貫して行えるようにする必要があります。

ディープラーニングには何百万もの連結計算が必要であり、それらすべての小さな決定を検討し、それらがより大きな決定にどのように貢献するかを計算するのは非常に難しいため、アルゴリズムに偏りがあるかどうかを判断するのは簡単ではありません。そのため、AI が誤った判断を下したことがわかっていても、なぜ、どのようにそうしたのかはわからないため、実装前にバイアスを捕捉するメカニズムを構築するのは困難です。

自動運転車のような分野では、この問題は特に不安定です。自動運転車では、あらゆる決定が生死に関わる問題となる可能性があります。初期の研究では、私たちが作り出した機械の複雑さを逆転させることができるという希望があることが示されていますが、現時点では、Facebook、Google、Microsoft の AI がなぜ決定を下したのかを知ることはほぼ不可能です。

機能的AI用語集:

アルゴリズム:コンピュータが従うべき一連の命令。アルゴリズムは、単純な 1 ステップのプログラムでも複雑なニューラル ネットワークでもかまいませんが、通常はモデルを指すために使用されます。

人工知能:これは一般的な用語です。大まかに言えば、ソフトウェアは人間の知能の側面を模倣したり、置き換えたりすることを目的としています。 AI ソフトウェアは、画像やテキスト、経験、進化、研究者のその他の発明などのデータから学習できます。

コンピューター ビジョン:画像やビデオの認識と理解を探求する AI 研究の分野。この分野は、リンゴの外観の理解から、リンゴの機能的な用途やそれに関連する概念まで多岐にわたります。これは、自動運転車、Google の画像検索、Facebook の自動ラベル付けなどの主要技術として使用されています。

ディープラーニング:ニューラルネットワークを階層化して、データ内の複雑なパターンと関係を理解する分野。あるニューラル ネットワークの出力が別のニューラル ネットワークの入力になり、効果的に積み重ねられると、結果として得られるニューラル ネットワークは「ディープ」であると言われます。

汎用知能: 「強力な AI」と呼ばれることもある汎用知能は、さまざまなタスクにわたってさまざまなアイデアを学習し、適用できるようになります。

生成的敵対ネットワーク:これは、出力を生成するためのニューラル ネットワークと、その出力の品質をテストして、それが期待どおりのものかどうかを確認するためのニューラル ネットワークの 2 つで構成されるシステムです。たとえば、リンゴの画像を生成しようとすると、ジェネレーターは画像を生成しますが、もう 1 つの要素 (識別子と呼ばれる) は、画像内のリンゴを認識できなかった場合にジェネレーターに再試行させます。

機械学習:機械学習 (ML) は、多くの場合人工知能という用語と組み合わせて使用​​され、アルゴリズムを使用してデータから学習する手法です。

モデル:モデルとは、対象に対する独自の理解、または世界に対する独自のモデルを構築する機械学習アルゴリズムです。

自然言語処理:言語内のアイデアの意図と関係を理解するために使用されるソフトウェア。

ニューラル ネットワーク:脳が情報を処理する方法をシミュレートするために、数式のネットワークを接続することによって構築されるアルゴリズム。ニューラル ネットワークに入力されたデータは、ネットワークの複雑さに応じて、小さなチャンクに分割され、基礎となるパターンが何千回も分析されます。あるニューラル ネットワークの出力が別のニューラル ネットワークの入力に送られると、2 つのニューラル ネットワークが層状にリンクされ、ディープ ニューラル ネットワークになります。通常、ディープ ニューラル ネットワークのレイヤーは、抽象度を段階的に高めながらデータを分析します。つまり、最も単純かつ正確なデータの表現に到達するまで、不要なデータから有用なデータを抽出します。

畳み込みニューラル ネットワーク:数百万ピクセルの画像や数千のオーディオ ファイル サンプルなどの高密度データを処理できるため、主に画像、ビデオ、オーディオ データを認識および理解するために使用されるニューラル ネットワークです。

リカレント ニューラル ネットワーク:自然言語処理に使用されるニューラル ネットワークの一種で、データを周期的かつ継続的に分析します。つまり、単語や文などのデータを、文中の順序とコンテキストを維持しながら処理できます。

長短期記憶ネットワーク:データから構造化された情報を保持するように設計されたリカレント ニューラル ネットワークの変種。たとえば、RNN は文中の名詞と形容詞をすべて識別し、それらが正しく使用されているかどうかをチェックできますが、LSTM は本のあらすじを記憶できます。

強化学習:経験から学習できるディープラーニング アルゴリズムの一種。これらは、ビデオゲームのキャラクターのように環境のいくつかの側面を制御し、試行錯誤を通じて学習できるアルゴリズムです。強化学習は再現性が高く、3D 世界のモデルとして機能し、すでにコンピューターでプレイされているため、多くの強化学習のブレークスルーはビデオ ゲームをプレイするアルゴリズムから生まれています。 RL は、囲碁の世界チャンピオンであるイ・セドルを破った DeepMind の AlphaGo で使用されている主要な機械学習のタイプの 1 つです。これはサイバーセキュリティなどの現実世界で実証されており、ソフトウェアはウイルス対策ソフトウェアを騙して悪意のあるファイルが安全であると思わせる方法を学習しています。

超知能:人間の脳よりも強力な人工知能。人間の脳が何ができるかを客観的に測定することはまだできないため、それを定義するのは難しいです。

教師あり学習:トレーニング プロセス中に、機械学習に提供されるデータはすでに整理され、ラベル付けされています。猫を認識するための教師あり学習アルゴリズムを構築する場合、1,000 枚の猫の写真でアルゴリズムをトレーニングすることになります。

トレーニング:データを提供することでアルゴリズムを学習させるプロセス。

教師なし学習:データをどのように分類するかについての情報が与えられず、データ間の関係性を見つける必要がある機械学習アルゴリズムの一種。 Facebook の LeCun 氏のような AI 研究者は、教師なし学習が人間の自然な学習方法に非常に似ているため、これを AI 研究の究極の目標だと考えています。 「脳は、教師なし学習においては私たちのモデルよりもはるかに優れています」とルカン氏はIEEE Spectrumに語った。「つまり、私たちの人工学習システムには欠けている、生物学的学習の非常に基本的な原理がいくつかあるということです。」

<<:  オープンソースの人工知能ソフトウェア 15 種類、あなたのお気に入りはどれですか?

>>:  Googleなどのテクノロジー大手が新技術を発表:人工知能が自ら進化できるようにする

推薦する

2019 年に注目すべき 10 社のクールなロボット スタートアップ

[51CTO.com クイック翻訳] ロボットは登場しましたが、現在はほとんど世間の注目を浴びていま...

2030 年までに AI と私たちの世界はどうなるでしょうか?

2030年までに、私たちの世界は変わるでしょう。人工知能 (AI) は、スマート シティ、モノのイ...

AI と機械学習はデータセンター運用にどのような変化をもたらすのでしょうか?

今日のデータセンターは、ほぼ克服不可能と思われる課題に直面しています。データ センターの運用はかつて...

機械学習の次元削減手法で「次元の呪い」を打破する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

エントリーレベルのデータベースアルゴリズム [パート 2]

前回の記事「エントリーレベルのデータベースのアルゴリズム [I]」では、いくつかのデータ アルゴリズ...

...

AIを使って死後の意識を蘇らせることは信頼できるのか?デジタル不滅には経済計算が必要

十分なデータがあれば、愛する人が亡くなった後でも、その人の意識を生かし続けることができます。それは何...

...

...

Google Deepmind、楽器とボーカルで音楽を生成するLyria AIオーディオモデルを発表

11月21日、Deepmindは楽器とボーカルで音楽を生成できるLyriaというオーディオモデルをリ...

AIGCは単なるコード支援ではありません

生成型人工知能 (AIGC) は、ソフトウェア開発者の生産性を向上させる大きな可能性を秘めています。...

「トランスフォーマー」は5年でクレイジーなCNNに取って代わりました!トランスフォーマーは人工知能を支配するのでしょうか?

AI業界では今や誰もが知る名前となったTransformerが、これほど短期間でなぜこれほど人気を...