コンピューター ビジョンは、写真やビデオなどのデジタル画像の側面に焦点を当てた人工知能のサブフィールドです。ディープラーニングは、困難なコンピューター ビジョンのタスクにおいて大きな進歩を遂げました。 コンピューター ビジョンにおけるディープラーニング テクノロジの応用について詳しく検討する前に、基本的な理論的知識、一般的なテクノロジ、API 標準、基本的なデータ処理など、コンピューター ビジョンに関する基本的な理解が必要です。 この記事では、コンピューター ビジョンに関する人気の教科書と、プログラマーに最適なコンピューター ビジョンの本をいくつか紹介します。 優れたコンピュータビジョンの教科書 教科書は専門家(通常は学者)によって書かれ、学生や実務家の参考資料として役立つことを目的としている本です。これらは、実用的な問題への関心や方法の応用 (コード) ではなく、主に一般的な方法と理論 (数学) に焦点を当てています。 トップ 5 の教科書は、トップ スクール (MIT など) の大学コースでの使用に基づいてリストされています。 1. コンピュータービジョン この本の PDF 版は公式ウェブサイトから無料で入手できます。 私はこの本がとても気に入っています。コンピューター ビジョン技術の初心者 (学部生) が、コンピューター ビジョンのさまざまな基本的な問題を解決する方法を学ぶのに役立ちます。この本は、ワシントン大学でこの科目を教えてきたリチャードの長年の経験に基づいて書かれています。 この本には、企業の研究室でコンピューター ビジョンの研究に携わった私の 20 年間の経験も反映されており、実際に機能する基本的な手法に重点が置かれ、実用性が低い難解な数学についてはあまり触れられていません。 ダウンロードアドレス: http://szeliski.org/Book/ 2. コンピュータビジョン: モデル、学習、推論 この本は今でも公式ウェブサイトから PDF 形式でダウンロードできます。 これは、コンピューター ビジョンの技術と問題を幅広くカバーした、学生向けの優れた入門書です。この本では、コンピューター ビジョンに多くのスペースが割かれており、確率モデルに関連する基本的なトピックにも多くのスペースが割かれています。 この本は、学習と推論の確率モデルに重点を置いています。トレーニング データを使用して、観測された画像データと 3D 構造やオブジェクト クラスなどの現実世界との関係を学習する方法を示します。この本は、確率理論とモデル フィッティングの基礎から始まり、読者が実際の例を実装および変更して、有用な視覚システムを構築できるようになるまでを説明しています。主に上級学部・大学院生を対象とし、 ダウンロードアドレス: http://www.computervisionmodels.com/ 3. コンピュータビジョン:現代的なアプローチ これはコンピューター ビジョンの入門書であり、おそらく他の多くの教科書よりも幅広いトピックをカバーしています。内容が充実しているにもかかわらず、主題に直接飛び込む物語的なアプローチがより難しいため、他の入門書ほど人気がないかもしれません。 この本の内容は、幾何学的なカメラモデル、照明と陰影、色、線形フィルタリング、局所的な画像の特徴、テクスチャ、ステレオ相対性、動きの構造、クラスタリングセグメンテーション、組み合わせとモデルフィッティング、追跡、登録、滑らかな表面とスケルトン、距離データ、画像分類、物体の検出と認識、画像ベースのモデリングとレンダリング、人物研究、画像の検索と取得、最適化技術などを網羅しています。 4. 3Dコンピュータビジョン入門テクニック これは、主にコンピューター ビジョンに焦点を当てた古い本ですが、3D ビジョンに関連するテクニックにも多少注目しています。現代のコンピューター ビジョンの問題と解決策を実践的に紹介する本です。これは良い出発点であり、大学院レベルの読者よりも学部レベルの読者に適しています。 5. コンピュータビジョンにおけるマルチビュージオメトリ この本のいくつかの章は、公式ウェブサイトから PDF 版でダウンロードできます。 この本はコンピューター ビジョンに関してかなり高度な内容で、大学院レベルの読み物として適しており、特に複数の画像から形状を推測する問題と方法が書かれています。 この本は 6 つのパートに分かれており、 7 つの短い付録が付いています。コンピューター ビジョンを学んだことがないのに、コンピューター ビジョンの分野で働いていると言うのは恥ずかしいと言う人もいます。 ダウンロードアドレス: http://www.robots.ox.ac.uk/~vgg/hzbook/ プログラマーのためのコンピュータビジョンの本 プログラマー向けの本は専門家 (通常は開発者やエンジニア) によって書かれており (O'Reilly の本など)、主にテクノロジーと実用的な問題解決に焦点を当てており、サンプル コードと標準ライブラリに重点を置いています。技術は関連する理論(数学)を使用して簡単に説明できますが、主な参考資料としては使用されません。 6. 「OpenCVを学ぶ(中国語版)」 この本の焦点は、おそらく最初のオープンソース コンピューター ビジョン ライブラリである OpenCV ライブラリの使用方法を説明することです。すべてのコード例は C++ で書かれており、さらに重要なことに、著者は OpenCV の理事および創設者です。 これは技術的な本ですが、よく書かれた API ドキュメントのように、C++ オープンソース コンピューター ビジョン ライブラリ OpenCV 3 の使用ガイドを提供します。また、読者が OpenCV をより効果的に使用できるように、コンピューター ビジョン分野の基本的な背景知識も提供します。 7. Python コンピュータビジョンプログラミング これは、主に PIL を使用して Python で基本的なコンピューター ビジョン タスクを実行する方法を教える実践的な本ですが、OpenCV の基本的な紹介も行います。 この本では、多数の例を使用して、オブジェクト認識、コンテンツベースの画像検索、光学文字認識、オプティカルフロー、追跡、3D 再構成、ステレオイメージング、拡張現実、姿勢推定、パノラマ作成、画像セグメンテーション、ノイズ除去、画像グループ化などのテクノロジーを慎重に分析しています。 ダウンロードアドレス: http://programmingcomputervision.com/ 8. SimpleCV による実践的なコンピュータビジョン この本では、Python の SimpleCV ライブラリを使用して基本的なコンピューター ビジョン操作を実行する方法を説明します。 SimpleCV は Python で書かれたオープンソース フレームワークであり、PIL (Pillow)/OpenCV の優れた代替手段です。 この本では、ストリーミング デジタル画像を収集、処理、分析するための基本的な CV テクニックを紹介しながら、実用的な例を通して SimpleCV を使用して独自のコンピューター ビジョン (CV) アプリケーションを迅速かつ簡単に構築する方法を説明します。 |
<<: 人工知能はデータの管理と処理を改善する素晴らしい方法です
>>: なぜモノのインターネット、ビッグデータ、人工知能は常にグループで表示されるのでしょうか?
[[436407]]私たちの世界は、テクノロジーの進歩により急速な変化を経験し続けています。 テクノ...
ミストラル・ミディアムが誤って漏洩した?以前は API 経由でのみ利用可能でしたが、そのパフォーマン...
自動駐車システム、モバイル決済、ソーシャル メディア フィード、あるいは私たちが毎日触れる無数のテク...
実装のアイデアと手順軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmo...
GAN の高解像度画像を生成する能力は、画像合成および処理の分野に革命をもたらしています。 201...
人工知能 (AI) は未来だと言う人もいれば、AI は SF だと言う人もいれば、AI は私たちの日...
写真しかない場合、どのようにして人物のリアルなデジタルアバターを作成するのでしょうか? 2020年の...
以下は、選考に参加した 18 個の候補アルゴリズムから選ばれた上位 10 個の古典的なアルゴリズムで...
AppleのiPhone 15の発表イベントでは、同社のカーボンニュートラル化に向けた取り組みに焦点...
[[376016]] △ 2019年9月4日、ノースウェスタン工科大学の学生が顔認識装置を通じて図...
【CNMOニュース】科技日報によると、「中国裁判所情報化発展報告第5号(2021年)」がこのほど正...