2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年は人工知能と機械学習にとって「収穫」の年でした。特にヘルスケア、金融、音声認識、拡張現実、より複雑な 3D ビデオアプリケーションなど、実生活のさまざまな分野に、ますます影響力のある機械学習アプリケーションが開発され、応用されてきました。

さらに、業界ではアプリケーション主導の研究がますます増えており、理論主導の研究を上回っていることもわかりました。この変化には欠点があることは否定できませんが、そのプラス面も見なければなりません。より多くの研究がすぐに商用製品に変換できるようになるため、業界全体に計り知れないプラスの影響があり、これはオープンソースの機械学習の分野で特に顕著です。

***、過去 1 年間で最も実用的な 6 つの機械学習プロジェクトを見てみましょう。これらのプロジェクトは、個人や小規模チームが学習して価値を創造できるようにするためのコードとデータセットを公開しています。これらのプロジェクトは理論的には画期的ではないかもしれませんが、非常に実用的です。

この記事はTowards Data ScienceのGeorge Seif氏によるもので、以下のように翻訳されています。

[[254861]]

1) ファスト.ai

オープンソースアドレス:

https://github.com/fastai/fastai

Fast.ai ライブラリを使用すると、*** ソリューションを通じてニューラルネットワークのトレーニングプロジェクトを簡素化できます。ディープニューラルネットワークの実際の構築の詳細をすべて抽象化します。設計では、プログラムを構築する実践者の思考モードが十分に考慮されているため、非常に使いやすいです。このライブラリはもともと Fast.ai コースの学生向けに作成されたもので、Pytorch ライブラリをベースに簡潔かつわかりやすい形で書かれています。さらに、ファイルライブラリの整理にも優れています。（ドキュメントライブラリアドレス：https://docs.fast.ai/）

2) ディテクトロン

オープンソースアドレス:

https://github.com/facebookresearch/Detectron

Detectron は、Facebook がオブジェクト検出とインスタンスのセグメンテーションのために開発した研究プラットフォームです。ディープラーニングフレームワーク Caffe2 で記述されており、次のようなさまざまなオブジェクト検出アルゴリズムの実装が含まれています。

Mask R-CNN: Faster R-CNN アーキテクチャによるオブジェクト検出とインスタンスのセグメンテーション。
(https://arxiv.org/abs/1703.06870)
RetinaNet:独自の焦点損失により困難なケースを処理するためのピラミッドネットワークを備えています。
(https://arxiv.org/abs/1708.02002)
より高速な R-CNN:オブジェクト検出ネットワークで最も一般的な構造。
(https://arxiv.org/abs/1506.01497)

すべてのネットワークは、次のいずれかの代替分類ネットワークを使用できます。

レスネクスト{50101152}
(https://arxiv.org/abs/1611.05431)
RESNET {50101152}
(https://arxiv.org/abs/1512.03385)
特徴ピラミッドネットワーク（ResNet/ResNeXt を使用）
(https://arxiv.org/abs/1612.03144)
VG16 ...
(https://arxiv.org/abs/1612.03144)

これらのプラットフォーム機能には、COCO データセットで事前トレーニングされたモデルが付属しており、ユーザーがすぐに使用できることも特筆に値します。同時に、これらの機能は、標準評価指標に厳密に従って、Detectron モデル動物園 (https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md) でテストされています。

3) ファストテキスト

オープンソースアドレス:

https://github.com/facebookresearch/fastText

Facebook の研究成果のもう 1 つの成果である fastText ライブラリは、テキスト表現とテキスト分類専用に作成されています。このライブラリには、150 を超える言語をカバーする事前トレーニング済みの単語ベクトルモデルが付属しており、テキストの分類、要約、翻訳などの複数のタスクを完了するために使用できます。

4) オートケラス

Auto-Keras は、テキサス A&M 大学の DATA Lab (http://faculty.cs.tamu.edu/xiahu/index.html) とコミュニティ貢献者によって開発された、自動機械学習 (AutoML) 用のオープンソースソフトウェアライブラリです。 AutoML の目標は、データサイエンスや機械学習のバックグラウンドを持たないドメインエキスパートがディープラーニングツールを使いやすくすることです。 Auto-Keras は、ディープラーニングモデルに最適なアーキテクチャとハイパーパラメータを自動的に一致させる機能を提供します。

5) ドーパミン

オープンソースアドレス:

https://github.com/google/dopamine

Dopamine は、強化学習アルゴリズムのプロトタイピングを加速するために Google が特別に作成した研究フレームワークです。RL アルゴリズム、指標、ベンチマークに厳密に準拠しながら、柔軟で使いやすいフレームワークです。

Dopamine が提供した文書によると、同社の製品設計原則には次のものが含まれます。

簡単に実行できる実験: 新規ユーザーがベンチマーク実験を実行できるように支援
柔軟な開発プロセス：より革新的なアイデアの誕生を促進
シンプルで信頼性が高い: 古いアルゴリズムや人気のアルゴリズムを実装できる
再現性: 結果が再現可能であることを保証する

6) ビッド2ビッド

オープンソースアドレス:

https://github.com/NVIDIA/vid2vid

vid2vid は、Nvidia の最も高度なビデオ間合成アルゴリズムに基づいた Pytorch 実装プロジェクトです。ビデオ間合成アルゴリズムの目的は、入力ソースビデオ (一連のセマンティックセグメンテーションマスクなど) から、ソースビデオの内容を正確に描写するリアルなレンダリングされた出力ビデオへのマッピング関数を学習することです。

このライブラリの優れた点は、選択肢の多様性です。自動運転/都市のシーン、顔、人間のポーズなど、さまざまな vid2vid アプリケーションを提供します。さらに、データセットの読み込み、タスク評価、ネットワークトレーニング、マルチGPUなど、豊富な命令と機能が搭載されています。

特別賞