これらの 8 冊の本を読んでいないのに、コンピューター ビジョンの分野で働いていると言える勇気がありますか?

これらの 8 冊の本を読んでいないのに、コンピューター ビジョンの分野で働いていると言える勇気がありますか?

コンピューター ビジョンは、写真やビデオなどのデジタル画像の側面に焦点を当てた人工知能のサブフィールドです。ディープラーニングは、困難なコンピューター ビジョンのタスクにおいて大きな進歩を遂げました。

コンピューター ビジョンにおけるディープラーニング テクノロジの応用について詳しく検討する前に、基本的な理論的知識、一般的なテクノロジ、API 標準、基本的なデータ処理など、コンピューター ビジョンに関する基本的な理解が必要です。

この記事では、コンピューター ビジョンに関する人気の教科書と、プログラマーに最適なコンピューター ビジョンの本をいくつか紹介します。

優れたコンピュータビジョンの教科書

教科書は専門家(通常は学者)によって書かれ、学生や実務家の参考資料として役立つことを目的としている本です。これらは、実用的な問題への関心や方法の応用 (コード) ではなく、主に一般的な方法と理論 (数学) に焦点を当てています。

トップ 5 の教科書は、トップ スクール (MIT など) の大学コースでの使用に基づいてリストされています。

1. コンピュータービジョン

この本の PDF 版は公式ウェブサイトから無料で入手できます。

私はこの本がとても気に入っています。コンピューター ビジョン技術の初心者 (学部生) が、コンピューター ビジョンのさまざまな基本的な問題を解決する方法を学ぶのに役立ちます。この本は、ワシントン大学でこの科目を教えてきたリチャードの長年の経験に基づいて書かれています。

この本には、企業の研究室でコンピューター ビジョンの研究に携わった私の 20 年間の経験も反映されており、実際に機能する基本的な手法に重点が置かれ、実用性が低い難解な数学についてはあまり触れられていません。

ダウンロードアドレス: http://szeliski.org/Book/

2. コンピュータビジョン: モデル、学習、推論

この本は今でも公式ウェブサイトから PDF 形式でダウンロードできます。

これは、コンピューター ビジョンの技術と問題を幅広くカバーした、学生向けの優れた入門書です。この本では、コンピューター ビジョンに多くのスペースが割かれており、確率モデルに関連する基本的なトピックにも多くのスペースが割かれています。

この本は、学習と推論の確率モデルに重点を置いています。トレーニング データを使用して、観測された画像データと 3D 構造やオブジェクト クラスなどの現実世界との関係を学習する方法を示します。この本は、確率理論とモデル フィッティングの基礎から始まり、読者が実際の例を実装および変更して、有用な視覚システムを構築できるようになるまでを説明しています。主に上級学部・大学院生を対象とし、

ダウンロードアドレス: http://www.computervisionmodels.com/

3. コンピュータビジョン:現代的なアプローチ

これはコンピューター ビジョンの入門書であり、おそらく他の多くの教科書よりも幅広いトピックをカバーしています。内容が充実しているにもかかわらず、主題に直接飛び込む物語的なアプローチがより難しいため、他の入門書ほど人気が​​ないかもしれません。

この本の内容は、幾何学的なカメラモデル、照明と陰影、色、線形フィルタリング、局所的な画像の特徴、テクスチャ、ステレオ相対性、動きの構造、クラスタリングセグメンテーション、組み合わせとモデルフィッティング、追跡、登録、滑らかな表面とスケルトン、距離データ、画像分類、物体の検出と認識、画像ベースのモデリングとレンダリング、人物研究、画像の検索と取得、最適化技術などを網羅しています。

4. 3Dコンピュータビジョン入門テクニック

これは、主にコンピューター ビジョンに焦点を当てた古い本ですが、3D ビジョンに関連するテクニックにも多少注目しています。現代のコンピューター ビジョンの問題と解決策を実践的に紹介する本です。これは良い出発点であり、大学院レベルの読者よりも学部レベルの読者に適しています。

5. コンピュータビジョンにおけるマルチビュージオメトリ

この本のいくつかの章は、公式ウェブサイトから PDF 版でダウンロードできます。

この本はコンピューター ビジョンに関してかなり高度な内容で、大学院レベルの読み物として適しており、特に複数の画像から形状を推測する問題と方法が書かれています。

この本は 6 つのパートに分かれており、 7 つの短い付録が付いています。コンピューター ビジョンを学んだことがないのに、コンピューター ビジョンの分野で働いていると言うのは恥ずかしいと言う人もいます。

ダウンロードアドレス: http://www.robots.ox.ac.uk/~vgg/hzbook/

プログラマーのためのコンピュータビジョンの本

プログラマー向けの本は専門家 (通常は開発者やエンジニア) によって書かれており (O'Reilly の本など)、主にテクノロジーと実用的な問題解決に焦点を当てており、サンプル コードと標準ライブラリに重点を置いています。技術は関連する理論(数学)を使用して簡単に説明できますが、主な参考資料としては使用されません。

6. 「OpenCVを学ぶ(中国語版)」

この本の焦点は、おそらく最初のオープンソース コンピューター ビジョン ライブラリである OpenCV ライブラリの使用方法を説明することです。すべてのコード例は C++ で書かれており、さらに重要なことに、著者は OpenCV の理事および創設者です。

これは技術的な本ですが、よく書かれた API ドキュメントのように、C++ オープンソース コンピューター ビジョン ライブラリ OpenCV 3 の使用ガイドを提供します。また、読者が OpenCV をより効果的に使用できるように、コンピューター ビジョン分野の基本的な背景知識も提供します。

7. Python コンピュータビジョンプログラミング

これは、主に PIL を使用して Python で基本的なコンピューター ビジョン タスクを実行する方法を教える実践的な本ですが、OpenCV の基本的な紹介も行います。

この本では、多数の例を使用して、オブジェクト認識、コンテンツベースの画像検索、光学文字認識、オプティカルフロー、追跡、3D 再構成、ステレオイメージング、拡張現実、姿勢推定、パノラマ作成、画像セグメンテーション、ノイズ除去、画像グループ化などのテクノロジーを慎重に分析しています。

ダウンロードアドレス: http://programmingcomputervision.com/

8. SimpleCV による実践的なコンピュータビジョン

この本では、Python の SimpleCV ライブラリを使用して基本的なコンピューター ビジョン操作を実行する方法を説明します。 SimpleCV は Python で書かれたオープンソース フレームワークであり、PIL (Pillow)/OpenCV の優れた代替手段です。

この本では、ストリーミング デジタル画像を収集、処理、分析するための基本的な CV テクニックを紹介しながら、実用的な例を通して SimpleCV を使用して独自のコンピューター ビジョン (CV) アプリケーションを迅速かつ簡単に構築する方法を説明します。

<<:  人工知能はデータの管理と処理を改善する素晴らしい方法です

>>:  なぜモノのインターネット、ビッグデータ、人工知能は常にグループで表示されるのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

...

...

AIをうまく活用したいなら、この2つの問題を早急に解決しなければなりません!

[[441323]]早すぎるオールインデータ文化を一夜にして構築することはできないのと同様に、分析...

...

K2 K2、上海交通大学チームが70億パラメータの地球科学言語モデルを発表

地球科学は、岩石、鉱物、土地の特性を研究するだけでなく、地球の気候、海洋、大気、生態系などの現象と原...

2021年になっても、データにラベルを付ける方法がまだわかりませんか?なぜ人工知能にはデータ注釈が必要なのでしょうか?

「データを持っている者は人工知能を持っている。」現在、人工知能は私たちの生活の中で当たり前のものに...

将来、人工知能は人間の意識を発達させるでしょうか?

今日はそれについて話しましょう。あらゆるものには規則性がある。これを植物と生物学の2つの観点から議論...

2020 年の AI と分析の 5 つの災害

今日の新しいテクノロジーの進歩により、私たちは皆、データの重要性を認識しています。データは新たな石油...

AIとRPA:両者の連携方法と、ビジネスに両方が必要な理由

ゴールドマン・サックスのレポートによると、AI は世界の労働生産性を年間 1% 以上向上させ、202...

海外メディア:科学者らが深海を探索できる魚のようなソフトロボットを設計

3月4日のニュース、外国メディアの報道によると、ネイチャー誌に最近発表された研究によると、中国のエン...

公開鍵暗号を解読することは可能ですか?

Q: 正しくインストールされ、操作されていれば、公開鍵インフラストラクチャ (PKI) は破られな...

将来、人工知能によって一般の人々は職を失うことになるのでしょうか?マスク氏の答えを見てください。

[[437743]]あなたは人工知能の将来について楽観的でしょうか、それとも悲観的でしょうか?実際...

複数の LLM が連携して機能します。清華大学などがオープンソースのマルチエージェントフレームワークAgentVerseを開発:Minecraftのアイテムを共同で作成し、ポケモンを訓練

人類が地球上の食物連鎖の頂点に上り詰め、さらには宇宙の探査を続けられるようになったのは、個人の脳だけ...