ディープラーニングツール ディープラーニングの進歩は、ソフトウェア インフラストラクチャの進歩にも大きく依存しています。 Torch (2011)、Theano (2012)、DistBelief (2012)、PyLearn2 (2013)、Caffe (2013)、MXNet (2015)、TensorFlow (2015) などのソフトウェア ライブラリはすべて、重要な研究プロジェクトや商用製品をサポートできます。 ディープラーニングといえば、私が個人的に触れたのは2015年です。実はこの技術は長らく隠れていたのですが、2012年に爆発的に普及し、AI分野の主流となりました。今日は、最も実用的かつ最もよく遭遇する側面、つまりフレームワーク、つまりツールについてお話ししましょう。 あなたが知っているツールにはどのようなものがありますか? ? ? 今日は私が使用したツールを皆さんと共有したいと思います。お気に入りのツールを見つけて、それを使って「エリクサーを作る」ことができればと思います(意味がわからない場合は、Baiduで検索してください)笑!
大学院に入ってから、私が出会ったディープラーニングツールの数は片手で数えられるほどです。興味のある方は深く検索してみてください。インターネット上にはまだまださまざまな意見があります。次に、私自身の実践経験に基づいたディープラーニングツールについてお話します。マトラボ マトラボ 私がディープラーニングを学び始めたとき、最初に使用したツールはディープラーニング用の Matlab ツールボックスである DeepLearnToolbox でした。 ディープラーニングは機械学習の新しい分野です。ディープデータモデルの学習に重点を置いています。その主なインスピレーションは、人間の脳の表面にある深い階層構造にあります。ディープラーニング理論の優れた概要は、人工知能のディープアーキテクチャの学習です。このツールボックスは比較的シンプルです。当時は手書き数字と顔の分類(AR顔データベース)を作っていました。主に以下の内容が含まれます。 NN: フィードフォワード BP ニューラル ネットワークのライブラリ CNN: 畳み込みニューラルネットワークのライブラリ DBN: ディープビリーフネットワークのライブラリ SAE: スタック型オートエンコーダのライブラリ CAE: 畳み込みオートエンコーダのライブラリ Util : ライブラリで使用されるユーティリティ関数 データ:データ保存 テスト: ツールキットが動作していることを確認するためのテスト ケースは以下のとおりです
操作インターフェースは比較的シンプルです。 パイトーチ Pytorch ライブラリについては、実はあまり使っていません。気軽に試した程度です。個人的には触らないほうがいいと思います。面白くないですから。以下で簡単に触れるだけにします。 これは、2 種類のユーザーを対象とした Python ベースの科学計算パッケージです。 1 つは GPU を使用して numpy を置き換えることです。もう 1 つは、最大限の柔軟性と速度を提供するディープラーニング レスキュー プラットフォームです。 ディープラーニングの場合、torch.nn パッケージを使用してニューラル ネットワークを構築できます。 autograd パッケージはすでに知られています。nn パッケージは、モデルの定義と導関数の実行に autograd パッケージに依存しています。 nn.Module には、レイヤーと、出力を返す faward(input) メソッドが含まれています。 ケースは以下のとおりです
具体的な操作や詳しい手順については、興味のある方は実際に触ってみてください! カフェ Caffe の作者はカリフォルニア大学バークレー校の Yangqing Jia です。 Caffe は、コマンドライン、Python、Matlab インターフェースをサポートし、CPU/GPU 上で実行できる C++/CUDA フレームワークです。 ディープラーニングは絶えず発展しており、それに対応する実験ツールも注目を集めています。 Caffe は、人気のディープラーニング フレームワークの 1 つです。ツールにはテンプレートがあらかじめ用意されているため、ツールには既製のプログラミング フレームワークがあり、現在人気のグラフィックス コンピューティング GPU と組み合わせて使用することで、ネットワーク トレーニングを高速化できます。人気のニューラル ネットワーク フレームワーク アルゴリズムはすべて Caffe で実行でき、Caffe ではさまざまな構造があらかじめ定義されているため、独自のフレームワークをセットアップできます。研究者は、独自の設計要件に基づいて対応する追加を行い、必要なタスクを完了するための新しいディープラーニング フレームワークを設計することもできます。 Caffe フレームワークには、 Blobs 、 Layers 、 Netsという 3 つの主要な構造があります。これらは事前定義された構造であるため、フレームワークを使用するときに変更することはできません。 ブロブBlob は Caffe フレームワークの主要な構造です。これはラッパーです。Caffe フレームワークを使用する場合、データをフォーマットする必要があります。このようなデータ形式のみが Caffe フレームワークで実行および処理できます。さらに、Caffe の設計時には、多くの関数とクラスが事前に設計されており、実行中にその構造を変更することはできず、そうしないとその中の関数を呼び出すことができず、ネットワークのトレーニングが失敗します。 Blob のフォーマットは、主に数値、チャンネル、高さ、幅の 4 つの要素で構成されています。画像処理を行う場合、画像チャンネルを表します (一般的に、カラー画像は 3 チャンネル データであり、高さと幅は入力データのサイズを表します)。要素に関しては、主にトレーニング プロセスに反映されます。トレーニング中に、一度にどのくらいのデータを入力するか、つまり、一度に入力するデータの数 (通常はバッチと呼ばれます) を選択する必要があるためです。このトレーニング方法は、メモリ不足を大幅に緩和することもできます。 レイヤーレイヤーは、Caffe フレームワークのネットワークの重要な構造の 1 つです。ネットワークは、入力データと出力データを受け取り、最終的に内部計算によって出力するレイヤーの役割によって構成されます。 Caffe がネットワーク層を使用する場合、その定義は特に単純かつ明確であり、おおよそ次の 3 つの小さなステップに分かれています。 ネット先ほど紹介したレイヤーはネットのサブ要素です。ネット全体は複数のレイヤーを組み合わせて接続することで得られます。この構造では、ネットはネットワークのレイヤー、入力、出力を定義します。 たとえば、Caffe の最も基本的な隠し層ネットワークは次のように定義されます。
カフェのメリット
TF Google は 2011 年に人工ディープラーニング システムである DistBelief を立ち上げました。 DistBelief を使用すると、Google はデータセンター内の何千ものコアをスキャンし、より大規模なニューラル ネットワークを構築できます。このシステムにより、Google アプリの音声認識が 25% 向上し、Google フォトに画像検索機能が構築され、Google の画像キャプション マッチング実験が促進されます。 DistBelief にはまだ多くの欠点と制限があります。設定が難しく、Google の内部インフラストラクチャに密接に結び付けられていたため、研究コードの共有は不可能でした。 上記の問題に対応して、Google は 2015 年に Google Research Blog で新世代の人工知能学習システムである TensorFlow のリリースを発表しました。 TensorFlow は、異種分散システム向けの大規模機械学習フレームワークです。優れた移植性 (携帯電話のような小型のモバイル デバイスから大規模なクラスターまでサポート可能) を備え、さまざまなディープラーニング モデルをサポートしています。 Google によれば、TensorFlow は包括的、柔軟、移植性があり、使いやすく、さらに重要なことにオープンソースです。同時に、TensorFlow の速度は前世代の DistBelief と比べて大幅に向上しました。いくつかのベンチマークテストでは、TensorFlow のスコアは第 1 世代システムの 2 倍です。 それにもかかわらず、TensorFlow はまだ他のほとんどのオープンソース フレームワークほど効率的ではありません。しかし、TensorFlow のソースコードが徐々に公開されるにつれて、新しいハードウェア、新しいデバイス、cuDNN などの新しいアクセラレーションのサポートが増え続けており、現時点で最も有望なディープラーニング手法となっています。 ご興味があれば、PlayGround をお試しください。これは、教育目的でシンプルなニューラル ネットワークのオンライン デモンストレーションと実験を行うためのグラフィカル プラットフォームです。ニューラル ネットワークのトレーニング プロセスを非常に強力に視覚化します。ブラウザでニューラル ネットワークをトレーニングし、Tensorflow を知覚的に理解するために使用できます。 TFのデメリット
今日はここまでにしましょう。たくさん話しましたが、あまり深くは話せませんでした。機会があれば、ディープラーニングツールに関する特別なトピックを設けて、一緒に話しましょう! |
<<: 地下鉄も自動運転となり、国内最速の鉄道客車が北京で公開される。
>>: Google Brain の公開: アルゴリズムのエラー修正と AI バイアスの解決に重点を置く
[[204299]]先週、信用調査会社エキファックスは、同社のシステムに保存されていた1億4,300...
AI 支援による記事執筆は今やどこにでもあります。ChatGPT は多くの言語ベースの AI アプリ...
AIの波の中で、企業や国を問わず、コンピューティング能力に対する需要は日々高まっています。最近立ち上...
[[357895]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
GPT-4 は最近、視覚モダリティ (GPT-4V) を公開しました。 GPT-4V や Goog...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
研究者が最適な機械学習モデルを自動的かつ効率的に開発できるようにするために、Google は特定の分...
脳コンピューターインターフェースは、言語の読み取りに加えて、人間の脳内の画像をリアルタイムで読み取る...
COVID-19パンデミックは、パンデミック中でも企業や人々の生活が通常通り継続できるようにデジタル...
COVID-19の流行が続き、核酸検査が広範囲で徐々に常態化している中、複数の組織が核酸検査用ロボ...
ChatGPT、GPT-4などのリリースにより、大規模モデル(LLM)の魅力が明らかになった一方で、...
オープンソースのアルパカ モデル LLaMA コンテキストは、1 つの簡単な変更だけで GPT-4 ...