2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年は人工知能と機械学習にとって「収穫」の年でした。特にヘルスケア、金融、音声認識、拡張現実、より複雑な 3D ビデオ アプリケーションなど、実生活のさまざまな分野に、ますます影響力のある機械学習アプリケーションが開発され、応用されてきました。

さらに、業界ではアプリケーション主導の研究がますます増えており、理論主導の研究を上回っていることもわかりました。この変化には欠点があることは否定できませんが、そのプラス面も見なければなりません。より多くの研究がすぐに商用製品に変換できるようになるため、業界全体に計り知れないプラスの影響があり、これはオープンソースの機械学習の分野で特に顕著です。

***、過去 1 年間で最も実用的な 6 つの機械学習プロジェクトを見てみましょう。これらのプロジェクトは、個人や小規模チームが学習して価値を創造できるようにするためのコードとデータセットを公開しています。これらのプロジェクトは理論的には画期的ではないかもしれませんが、非常に実用的です。

この記事はTowards Data ScienceのGeorge Seif氏によるもので、以下のように翻訳されています。

[[254861]]

1) ファスト.ai

オープンソースアドレス:

https://github.com/fastai/fastai

Fast.ai ライブラリを使用すると、*** ソリューションを通じてニューラル ネットワークのトレーニング プロジェクトを簡素化できます。ディープ ニューラル ネットワークの実際の構築の詳細をすべて抽象化します。設計では、プログラムを構築する実践者の思考モードが十分に考慮されているため、非常に使いやすいです。このライブラリはもともと Fast.ai コースの学生向けに作成されたもので、Pytorch ライブラリをベースに簡潔かつわかりやすい形で書かれています。さらに、ファイルライブラリの整理にも優れています。 (ドキュメントライブラリアドレス:https://docs.fast.ai/)

2) ディテクトロン

オープンソースアドレス:

https://github.com/facebookresearch/Detectron

Detectron は、Facebook がオブジェクト検出とインスタンスのセグメンテーションのために開発した研究プラットフォームです。ディープラーニング フレームワーク Caffe2 で記述されており、次のようなさまざまなオブジェクト検出アルゴリズムの実装が含まれています。

Mask R-CNN: Faster R-CNN アーキテクチャによるオブジェクト検出とインスタンスのセグメンテーション。

(https://arxiv.org/abs/1703.06870)

RetinaNet:独自の焦点損失により困難なケースを処理するためのピラミッド ネットワークを備えています。

(https://arxiv.org/abs/1708.02002)

より高速な R-CNN:オブジェクト検出ネットワークで最も一般的な構造。

(https://arxiv.org/abs/1506.01497)

すべてのネットワークは、次のいずれかの代替分類ネットワークを使用できます。

レスネクスト{50101152}

(https://arxiv.org/abs/1611.05431)

RESNET {50101152}

(https://arxiv.org/abs/1512.03385)

特徴ピラミッドネットワーク(ResNet/ResNeXt を使用)

(https://arxiv.org/abs/1612.03144)

VG16 ...

(https://arxiv.org/abs/1612.03144)

これらのプラットフォーム機能には、COCO データセットで事前トレーニングされたモデルが付属しており、ユーザーがすぐに使用できることも特筆に値します。同時に、これらの機能は、標準評価指標に厳密に従って、Detectron モデル動物園 (https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md) でテストされています。

3) ファストテキスト

オープンソースアドレス:

https://github.com/facebookresearch/fastText

Facebook の研究成果のもう 1 つの成果である fastText ライブラリは、テキスト表現とテキスト分類専用に作成されています。このライブラリには、150 を超える言語をカバーする事前トレーニング済みの単語ベクトル モデルが付属しており、テキストの分類、要約、翻訳などの複数のタスクを完了するために使用できます。

4) オートケラス

Auto-Keras は、テキサス A&M 大学の DATA Lab (http://faculty.cs.tamu.edu/xiahu/index.html) とコミュニティ貢献者によって開発された、自動機械学習 (AutoML) 用のオープンソース ソフトウェア ライブラリです。 AutoML の目標は、データ サイエンスや機械学習のバックグラウンドを持たないドメイン エキスパートがディープラーニング ツールを使いやすくすることです。 Auto-Keras は、ディープラーニング モデルに最適なアーキテクチャとハイパーパラメータを自動的に一致させる機能を提供します。

5) ドーパミン

オープンソースアドレス:

https://github.com/google/dopamine

Dopamine は、強化学習アルゴリズムのプロトタイピングを加速するために Google が特別に作成した研究フレームワークです。RL アルゴリズム、指標、ベンチマークに厳密に準拠しながら、柔軟で使いやすいフレームワークです。

Dopamine が提供した文書によると、同社の製品設計原則には次のものが含まれます。

  • 簡単に実行できる実験: 新規ユーザーがベンチマーク実験を実行できるように支援

  • 柔軟な開発プロセス:より革新的なアイデアの誕生を促進

  • シンプルで信頼性が高い: 古いアルゴリズムや人気のアルゴリズムを実装できる

  • 再現性: 結果が再現可能であることを保証する

6) ビッド2ビッド

オープンソースアドレス:

https://github.com/NVIDIA/vid2vid

vid2vid は、Nvidia の最も高度なビデオ間合成アルゴリズムに基づいた Pytorch 実装プロジェクトです。ビデオ間合成アルゴリズムの目的は、入力ソース ビデオ (一連のセマンティック セグメンテーション マスクなど) から、ソース ビデオの内容を正確に描写するリアルなレンダリングされた出力ビデオへのマッピング関数を学習することです。

このライブラリの優れた点は、選択肢の多様性です。自動運転/都市のシーン、顔、人間のポーズなど、さまざまな vid2vid アプリケーションを提供します。さらに、データセットの読み込み、タスク評価、ネットワークトレーニング、マルチGPUなど、豊富な命令と機能が搭載されています。

特別賞

  • ChatterBot:会話エンジンとチャットボットを作成するための機械学習プロジェクト

オープンソースアドレス:

https://github.com/gunthercox/チャッターボット

  • Kubeflow: Kubernetes 用の機械学習ツールキット

オープンソースアドレス:

出典: kubeflow

  • imgaug:画像強化のためのディープラーニングプロジェクト

オープンソースアドレス:

https://github.com/aleju/imgaug

  • imbalanced-learn:不均衡なデータセットを修復するための scikit ベースの Python フレームワーク

オープンソースアドレス:

https://github.com/scikit-learn-contrib/imbalanced-learn

  • mlflow:実験、再現、展開などのプロセスをカバーする、ML プロジェクトのライフサイクルを管理するためのオープンソース プラットフォーム。

オープンソースアドレス:

出典: github.com

  • AirSim: Microsoft が開発した、Unreal Engine/Unity ベースの自動運転車シミュレーター

オープンソースアドレス:

https://github.com/Microsoft/AirSim

<<:  2018 年の AI にとって重要なマイルストーンは何でしたか? 2019年に何が起こるでしょうか?

>>:  誰も教えてくれないAI大規模導入の効率的なプロセス!

ブログ    
ブログ    
ブログ    

推薦する

人工知能がヘルスケア業界にもたらす変化

AIヘルスケア企業のCEOが、医療におけるAIの応用、AIソリューションの購入方法、ヘルスケア分野に...

ABIリサーチ:ドローン市場は2030年までに920億ドル規模に

ABIリサーチは、ドローン市場は今後10年間で大きく成長し、2030年までに920億ドルの価値に達す...

...

2021 年に備えるべきビジネス インテリジェンスのトレンド トップ 10

2020 年には多くの業界セクターが根本的な変化を経験しましたが、ビジネス インテリジェンス業界も...

例 | CNN と Python を使用した肺炎検出

導入こんにちは!数時間前にディープラーニング プロジェクトを終えたので、その成果を共有したいと思いま...

AI導入の課題

人々は、データ、人、ビジネスなど、AI を導入する際の課題を理解する必要があります。 [[27672...

...

火星探査車「パーセベランス」の火星着陸における人工知能の応用

2月18日に火星への着陸に成功したNASAの火星探査車パーサヴィアランスは、火星での2年間の探査ミッ...

AIアルゴリズムエンジニアの涙の体験談

[[425033]]私たちはしばらくの間、展開モデルの最適化に取り組んできました。ここ数日でようやく...

ハードウェアとコードを分離し、APIを安定化したPyTorch Lightning 1.0.0が正式リリース

Keras と PyTorch はどちらも初心者にとても優しいディープラーニング フレームワークです...

GPTは「贅沢」すぎるが、代替案が多数用意されており、展開の問題を心配する必要はもうない

近年、生成的事前トレーニング済みモデル (GPT など) の台頭により、自然言語処理の分野に革命が起...

文脈学習 = 対照学習?人民大学が ICL 推論の背後にある暗黙の更新メカニズムを明らかに: 勾配は更新されるのか? 「さらに」

近年、Transformer に基づく大規模言語モデルは、驚くべきコンテキスト内学習 (ICL) 機...

機械学習における再現率、精度、正確さの指標は何ですか?

以前の記事では、Naive Bayes、KNN、KMeans、EM、線形回帰、ロジスティック回帰など...

...

2019年の中国人工知能産業の競争環境の分析

近年、人工知能の技術と応用は成熟を続けており、人工知能市場の規模は徐々に拡大しています。中国情報通信...