この記事では、人工知能の分野、特にコンピューター ビジョンの分野について簡単に紹介し、そこに含まれる課題、これらの課題に対する既存の最新ソリューション、そしてこれらのソリューションを多くの時間と労力をかけずに便利かつ簡単に適用する方法について説明します。 画像認識の発展 人工知能は数十年にわたって研究されてきた分野であり、科学者やエンジニアは、機械やコンピューターが適切に行動して人類に貢献できるように、世界をよりよく認識し理解するための謎を解明するために取り組んでいます。 この研究作業の最も重要な側面の 1 つは、コンピューターが私たちの周りで毎日生成される視覚情報 (画像やビデオ) を理解できるようにすることです。 コンピュータが視覚情報を認識して理解できるようにする分野は、コンピュータ ビジョンと呼ばれます。 1950 年代から 1980 年代にかけて人工知能研究が盛んになったころ、コンピューターには、画像や画像内の物体、注目すべき特徴を認識する方法が手動で指示されていました。このアプローチは、認識する必要があるオブジェクトの各固有シーンの特徴を人間が識別し、それらの特徴をコンピューターが理解できる数学モデルで表現する必要があるため、エキスパート システムと呼ばれる従来のアルゴリズムです。オブジェクトは何千もの異なる方法で表現でき、何千 (または何百万) もの異なるシーンやオブジェクトが存在するため、これには多くの面倒な作業が伴います。そのため、各オブジェクトやシーンの考えられるすべての特性などを表現する最適で正確な数学モデルを見つけるには、考えられるすべてのオブジェクトやシーンに対して永遠にかかることになります。 そして 1990 年代に機械学習の概念が導入され、画像やビデオ内のシーンやオブジェクトを識別する際にコンピューターに何を探すべきかを指示するのではなく、子供が探索を通じて周囲の環境について学習するのと同じように、コンピューターが画像内のシーンやオブジェクトを自ら識別する方法を学習できるアルゴリズムを設計できる時代が到来しました。機械学習により、コンピューターがほぼあらゆるシーンやオブジェクトを認識することを学習できる道が開かれました。 強力なコンピューター (GPU など) と、画像認識のための高度なディープラーニング アルゴリズム (Alex Krizhevsky らによる 2012 年の AlexNet、Kaeming He らによる 2015 年の ResNet、Forrest Landola らによる 2016 年の SqueezeNet、Gao Huang らによる 2016 年の DenseNet など) の登場により、多数の画像 (コンピューターの画像集のようなもの) をまとめて、画像自体のシーンやオブジェクトの特徴を学習する AI モデルを定義し、学習プロセスから得た知識を使用して、その後に遭遇するそのシーンやオブジェクト タイプの他のすべてのインスタンスを認識することが可能になりました。
写真の中に見たいものを認識できる AI モデルをトレーニングするには、従来、応用数学やディープラーニング ライブラリに関する多くの専門知識が必要であり、それには時間とストレスもかかります。アルゴリズム コードを記述し、そのコードを画像に合わせて調整します。ここで私たちはソリューションを提供します。 AI Commons のチームは、わずか 5 行の Python コードで、画像に認識させたいあらゆるオブジェクトを認識できる AI モデルをトレーニングできる Python ライブラリを開発しました。 Python ライブラリは ImageAI です。これは、あらゆるレベルの専門知識を持つ学生、開発者、研究者が、5 ~ 15 行のシンプルなコードを使用して、最先端のコンピューター ビジョン機能を備えたシステムとアプリケーションを構築できるように設計されたライブラリです。それでは、必要なものを何でも認識できる最初の AI モデルを作成する手順を説明します。 AI モデルをトレーニングするには、データセットと呼ばれる画像のコレクションが必要です。 データセットには、AI モデルに認識させたいオブジェクトのサンプル画像が数百または数千個含まれています。 でも心配しないでください! AI モデルをトレーニングするためだけに、今すぐに何千もの画像をダウンロードすべきだと言っているのではありません。 このチュートリアルでは、IdenProf というデータセットを提供します。 IdenProf (Identifiable Professionals) は、服装から人間が見て識別できる職業の 10 人の専門家の写真 11,000 枚を含むデータセットです。 このデータセットに画像が表示される専門家のカテゴリは次のとおりです。
データセットは、AI モデルをトレーニングするための 9,000 枚の画像 (各メジャーごとに 900 枚の画像) と、トレーニング中に AI モデルのパフォーマンスをテストするための 2,000 枚の画像 (各メジャーごとに 200 枚の画像) に分割されています。 IdenProf は適切に配置されており、服装から専門家を認識できるように AI モデルをトレーニングする準備ができています。 参考までに、独自の画像データセットを使用する場合は、AI モデルに認識させたいオブジェクトまたはシーンごとに少なくとも 500 枚の写真を収集する必要があります。 ImageAI を使用して収集された画像データセットをトレーニングするには、次の例に示すように、画像をフォルダーに配置する必要があります。
AI モデルをトレーニングするために独自の画像データセットを準備する方法がわかったので、次は ImageAI を使用して専門家を識別する AI モデルのトレーニングについて説明します。
https://github.com/OlafenwaMoses/IdenProf
1) Python言語の公式ウェブサイトからPython 3をダウンロードしてインストールします。 https://python.org 2) pip 経由で次の pip をインストールします。 i. テンソルフロー
ii. OpenCV
iii. ケラス
iv. イメージAI
次に、以下のコードを Python ファイル (例: FirstTraining.py) にコピーします。
これは、AI モデルをトレーニングするために必要なすべてのコードです。コードを実行してトレーニングを開始する前に、コードについて説明しましょう。 最初の行では、ImageAI からモデル トレーニング クラスをインポートします。 2 行目では、モデル トレーニング クラスのインスタンスを作成します。 3 行目では、モデル タイプを ResNet に設定します (使用可能なモデル タイプは、SqueezeNet、ResNet、InceptionV3、DenseNet の 4 つです)。 4 行目では、データ ディレクトリ (データセット ディレクトリ) をデータセットの zip ファイルを解凍したフォルダーに設定します。次に、5 行目で trainModel 関数を呼び出し、次の値を指定します。
これで、Python ファイルを実行してトレーニングを開始できます。トレーニングが開始されると、次の結果が表示されます。
上記の詳細について説明しましょう。 1. 「モデル クラスの JSON マッピングが C:\Users\User\PycharmProjects\FirstTraining\idenprof\json\model_class.json に保存されました」という記述は、モデル トレーナーが idenprof データセットの JSON ファイルを保存したことを意味します。このファイルを使用すると、カスタム画像予測クラスを使用して他の画像を認識できます (手順については、後ほど説明します)。 2. ライン1/200は、ネットワークが初めてターゲット200のトレーニングを行っていることを示している。 3. 行 1/280 [>…………………………..] -ETA: 52s -loss: 2.3026 -acc: 0.2500 は、この実験でトレーニングされたバッチの数を示します。 4. 「Epoch 00000: Saving model to C:\Users\User\PycharmProjects\FirstTraining\idenprof\models\model_ex-000_acc-0.100000.h5」という行は、現在のトレーニング後に保存されたモデルを指します。 ex_000 はこの段階での実験を表し、acc0.100000 と valacc:0.1000 はこの実験後のテスト画像上のモデルの精度を表します (精度の最大値は 1.0)。この結果は、カスタム画像予測に使用できる最もパフォーマンスの高いモデルを理解するのに役立ちます。 AIモデルをトレーニングした後は、「CustomImagePrediction」クラスを使用して、最も高い精度を達成したモデルの画像予測を行うことができます。
NVIDIA GPU にアクセスできないために AI モデルを独自にトレーニングできない場合のために、このチュートリアルでは、IdenProf データセットでトレーニングした AI モデルを提供します。このモデルを使用して、データセット内の 10 人の専門家のいずれかの新しい画像を予測できます。 61 回のトレーニング実験を経て、モデルは 79% を超える精度を達成しました。あるいは、自分でトレーニングしていない場合は、このリンクから idenprof モデルの JSON ファイルをダウンロードすることもできます。これで、トレーニング済みの AI モデルを使用して専門家の認識を開始する準備が整いました。以下の手順に従ってください。 次に、別の Python ファイルを作成し、FirstCustomImageRecognition.py などの名前を付けます。 上記でダウンロードしたAIモデル、または最も高い精度を達成したトレーニング済みモデルをコピーし、新しいpythonファイル(例:FirstCustomImageRecognition.py)のフォルダに貼り付けます。 また、ダウンロードした JSON ファイルまたはトレーニングによって生成された JSON ファイルをコピーし、新しい Python ファイルと同じフォルダーに貼り付けます。 IdenProf データセット内のカテゴリに属する専門家のサンプル画像を、新しい Python ファイルと同じフォルダーにコピーします。 次に、次のコードをコピーして新しい Python ファイルに挿入します。
以下のサンプル画像と結果をご覧ください。
簡単じゃないですか!ここで、この予測結果を生成する上記のコードについて説明しましょう。 上記のコードの 1 行目と 2 行目は、ImageAI の CustomImagePrediction クラスをインポートして、トレーニング済みモデルと Python OS クラスを使用して画像を予測および認識します。 3 行目のコードでは、Python ファイル (この例では FirstCustomImageRecognition.py) と、自分でダウンロードまたはトレーニングした ResNet モデル ファイルを含むパスへの参照を保持する変数を作成します。 上記のコードでは、4 行目で ImagePrediction() クラスのインスタンスを作成し、5 行目で .setModelTypeAsResNet() を呼び出して予測オブジェクトのモデル タイプを ResNet に設定し、6 行目で予測オブジェクトのモデル パスをプロジェクト フォルダー フォルダーにコピーした AI モデル ファイル (idenprof_061–0.7933.h5) のパスに設定しています。 7行目では、7行目のフォルダにコピーしたJSONファイルへのパスを設定し、80行目でモデルを読み込みます。最後に、フォルダーにコピーした画像に対して予測を行い、その結果をコマンド ライン インターフェイスに出力します。 これまで、ImageAI を使用して、画像内のあらゆる種類のオブジェクトまたはオブジェクトのセットを予測できる独自の人工知能モデルを簡単にトレーニングする方法を学びました。 もちろん、上記のチュートリアルに加えて、コンピューター ビジョンとインテリジェントな音声対話という 2 つのコア機能を統合したミニ人工知能ハードウェアである AIX についても触れておきたいと思います。 Titanium AIX は、Intel Movidius AI アクセラレーション チップの強力なコンピューティング サポートと組み込みの音声 SDK および API に基づいて、AI モデル リソース プラットフォームである Model Play と互換性があります。 Model Play は世界中の開発者を対象としており、多様な AI モデルを組み込んでおり、Google Edge TPU エッジ人工知能コンピューティング チップやその他の AI ハードウェアをサポートし、開発者がプロフェッショナル レベルの開発を加速できるように支援します。 さらに、Model Play は、完全で使いやすい転移学習モデル トレーニング ツールと豊富なモデル例を提供します。 Google のオープンソース ニューラル ネットワーク アーキテクチャとアルゴリズムに基づいて、自律的な転移学習機能を構築します。ユーザーはコードを書く必要はなく、画像の選択、モデルとカテゴリ名の定義だけで AI モデルのトレーニングを完了できるため、人工知能の学習と開発が容易になります。 |
<<: ディープフェイクを即座に排除しましょう!マイクロソフト北京大学、AIによる顔変更ツールと偽顔検出ツールを提案
【51CTO.comオリジナル記事】 COVID -19の流行がもたらした厳しい課題に直面して、科...
[51CTO.comよりオリジナル記事]秋から冬にかけての季節が近づき、インフルエンザやCOVID...
億万長者のイーロン・マスク氏は最近、一連のツイートで、ロボットが人間の仕事を奪うなら、政府による普遍...
人工知能 (AI) はモノのインターネット (IoT) の世界に革命をもたらし、IoT の人工知能 ...
[[317607]]人工知能(AI)とは、人間と同等かそれ以上の知覚、認知、行動などの知能を機械に...
[[216638]]韓国メディアは、中国の囲碁棋士である柯潔氏が2018年春にテンセントが開発した人...
今日、データの処理と保存に関する懸念が高まっています。生成されるデータの量、データが作成される場所、...
9月8日、英国の新聞「ガーディアン」は、熱心な読者でも記者でもなく、サンフランシスコの人工知能スタ...
編集者注: Amazon の Echo スマート スピーカーや自動運転車などのスクリーンレス ユーザ...
マスク氏はついに我慢できなくなり、X のデータを AI に入力し始めました。過去 2 日間で、X が...
人工知能は現代世界で最も注目され、最も議論されているトピックであり、20年後には人々の世界観を変える...
10月10日、海外メディアの報道によると、Google Cloudは最近、医療従事者がさまざまな種類...