2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年に最も価値のあるオープンソース機械学習プロジェクト 6 つ

2018 年は人工知能と機械学習にとって「収穫」の年でした。特にヘルスケア、金融、音声認識、拡張現実、より複雑な 3D ビデオ アプリケーションなど、実生活のさまざまな分野に、ますます影響力のある機械学習アプリケーションが開発され、応用されてきました。

さらに、業界ではアプリケーション主導の研究がますます増えており、理論主導の研究を上回っていることもわかりました。この変化には欠点があることは否定できませんが、そのプラス面も見なければなりません。より多くの研究がすぐに商用製品に変換できるようになるため、業界全体に計り知れないプラスの影響があり、これはオープンソースの機械学習の分野で特に顕著です。

***、過去 1 年間で最も実用的な 6 つの機械学習プロジェクトを見てみましょう。これらのプロジェクトは、個人や小規模チームが学習して価値を創造できるようにするためのコードとデータセットを公開しています。これらのプロジェクトは理論的には画期的ではないかもしれませんが、非常に実用的です。

この記事はTowards Data ScienceのGeorge Seif氏によるもので、以下のように翻訳されています。

[[254861]]

1) ファスト.ai

オープンソースアドレス:

https://github.com/fastai/fastai

Fast.ai ライブラリを使用すると、*** ソリューションを通じてニューラル ネットワークのトレーニング プロジェクトを簡素化できます。ディープ ニューラル ネットワークの実際の構築の詳細をすべて抽象化します。設計では、プログラムを構築する実践者の思考モードが十分に考慮されているため、非常に使いやすいです。このライブラリはもともと Fast.ai コースの学生向けに作成されたもので、Pytorch ライブラリをベースに簡潔かつわかりやすい形で書かれています。さらに、ファイルライブラリの整理にも優れています。 (ドキュメントライブラリアドレス:https://docs.fast.ai/)

2) ディテクトロン

オープンソースアドレス:

https://github.com/facebookresearch/Detectron

Detectron は、Facebook がオブジェクト検出とインスタンスのセグメンテーションのために開発した研究プラットフォームです。ディープラーニング フレームワーク Caffe2 で記述されており、次のようなさまざまなオブジェクト検出アルゴリズムの実装が含まれています。

Mask R-CNN: Faster R-CNN アーキテクチャによるオブジェクト検出とインスタンスのセグメンテーション。

(https://arxiv.org/abs/1703.06870)

RetinaNet:独自の焦点損失により困難なケースを処理するためのピラミッド ネットワークを備えています。

(https://arxiv.org/abs/1708.02002)

より高速な R-CNN:オブジェクト検出ネットワークで最も一般的な構造。

(https://arxiv.org/abs/1506.01497)

すべてのネットワークは、次のいずれかの代替分類ネットワークを使用できます。

レスネクスト{50101152}

(https://arxiv.org/abs/1611.05431)

RESNET {50101152}

(https://arxiv.org/abs/1512.03385)

特徴ピラミッドネットワーク(ResNet/ResNeXt を使用)

(https://arxiv.org/abs/1612.03144)

VG16 ...

(https://arxiv.org/abs/1612.03144)

これらのプラットフォーム機能には、COCO データセットで事前トレーニングされたモデルが付属しており、ユーザーがすぐに使用できることも特筆に値します。同時に、これらの機能は、標準評価指標に厳密に従って、Detectron モデル動物園 (https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md) でテストされています。

3) ファストテキスト

オープンソースアドレス:

https://github.com/facebookresearch/fastText

Facebook の研究成果のもう 1 つの成果である fastText ライブラリは、テキスト表現とテキスト分類専用に作成されています。このライブラリには、150 を超える言語をカバーする事前トレーニング済みの単語ベクトル モデルが付属しており、テキストの分類、要約、翻訳などの複数のタスクを完了するために使用できます。

4) オートケラス

Auto-Keras は、テキサス A&M 大学の DATA Lab (http://faculty.cs.tamu.edu/xiahu/index.html) とコミュニティ貢献者によって開発された、自動機械学習 (AutoML) 用のオープンソース ソフトウェア ライブラリです。 AutoML の目標は、データ サイエンスや機械学習のバックグラウンドを持たないドメイン エキスパートがディープラーニング ツールを使いやすくすることです。 Auto-Keras は、ディープラーニング モデルに最適なアーキテクチャとハイパーパラメータを自動的に一致させる機能を提供します。

5) ドーパミン

オープンソースアドレス:

https://github.com/google/dopamine

Dopamine は、強化学習アルゴリズムのプロトタイピングを加速するために Google が特別に作成した研究フレームワークです。RL アルゴリズム、指標、ベンチマークに厳密に準拠しながら、柔軟で使いやすいフレームワークです。

Dopamine が提供した文書によると、同社の製品設計原則には次のものが含まれます。

  • 簡単に実行できる実験: 新規ユーザーがベンチマーク実験を実行できるように支援

  • 柔軟な開発プロセス:より革新的なアイデアの誕生を促進

  • シンプルで信頼性が高い: 古いアルゴリズムや人気のアルゴリズムを実装できる

  • 再現性: 結果が再現可能であることを保証する

6) ビッド2ビッド

オープンソースアドレス:

https://github.com/NVIDIA/vid2vid

vid2vid は、Nvidia の最も高度なビデオ間合成アルゴリズムに基づいた Pytorch 実装プロジェクトです。ビデオ間合成アルゴリズムの目的は、入力ソース ビデオ (一連のセマンティック セグメンテーション マスクなど) から、ソース ビデオの内容を正確に描写するリアルなレンダリングされた出力ビデオへのマッピング関数を学習することです。

このライブラリの優れた点は、選択肢の多様性です。自動運転/都市のシーン、顔、人間のポーズなど、さまざまな vid2vid アプリケーションを提供します。さらに、データセットの読み込み、タスク評価、ネットワークトレーニング、マルチGPUなど、豊富な命令と機能が搭載されています。

特別賞

  • ChatterBot:会話エンジンとチャットボットを作成するための機械学習プロジェクト

オープンソースアドレス:

https://github.com/gunthercox/チャッターボット

  • Kubeflow: Kubernetes 用の機械学習ツールキット

オープンソースアドレス:

出典: kubeflow

  • imgaug:画像強化のためのディープラーニングプロジェクト

オープンソースアドレス:

https://github.com/aleju/imgaug

  • imbalanced-learn:不均衡なデータセットを修復するための scikit ベースの Python フレームワーク

オープンソースアドレス:

https://github.com/scikit-learn-contrib/imbalanced-learn

  • mlflow:実験、再現、展開などのプロセスをカバーする、ML プロジェクトのライフサイクルを管理するためのオープンソース プラットフォーム。

オープンソースアドレス:

出典: github.com

  • AirSim: Microsoft が開発した、Unreal Engine/Unity ベースの自動運転車シミュレーター

オープンソースアドレス:

https://github.com/Microsoft/AirSim

<<:  2018 年の AI にとって重要なマイルストーンは何でしたか? 2019年に何が起こるでしょうか?

>>:  誰も教えてくれないAI大規模導入の効率的なプロセス!

ブログ    
ブログ    
ブログ    

推薦する

レノボAmu:シーンインテリジェンスの時代に新たな「三大デバイス」を再定義

3月19日、杭州でCSHIA 2019スマートホーム業界開幕式が開催されました。ブランドメーカー、イ...

警戒するのは困難:真剣な AI 研究がいかにしてコンピューター生成ポルノに変わったのか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

人工知能は鉄道の乗客の安全を守ることができるか?

高速鉄道網がますます充実するにつれ、列車は人々が長距離を移動する際に好まれる交通手段となってきました...

今年の主要リリース: 人工知能開発レポート 2020

過去10年間で、人工知能は研究室から工業生産へと移行し、従来の産業モデルを再構築し未来をリードする価...

...

人工知能がデジタル時代の教師の変革を促進

2021年人工知能と教育に関する国際会議では、人工知能と教育・指導の深い融合を推進し、人工知能を利用...

TextRankアルゴリズムを使用した自動テキスト要約

【51CTO.com クイック翻訳】1. はじめにテキスト要約は、自然言語処理 (NLP) の分野に...

企業環境でのAIテクノロジーの活用

企業の世界における人工知能の利点は何でしょうか?企業分野における AI の主な利点の 1 つは、プロ...

AIGCの6つの主なリスク

ChatGPTを運営するOpenAIのCEOサム・アルトマン氏は最近、議会公聴会で政府によるAIの規...

人工知能の現状と今後の動向

[[375724]]開発状況近年、デジタル経済の継続的な進歩を背景に、人工知能は急速に発展し、さまざ...

Facebookのスマートスピーカー「フィオナ」と「アロハ」が今月下旬に発売される

Facebookは、現在FionaとAlohaというコードネームがつけられている2つのスマートスピー...

機械学習の運用はサイバーセキュリティに革命をもたらす可能性がある

機械学習運用 (MLOps) とは、運用環境での機械学習モデルの展開、管理、監視を簡素化するために使...

Raspberry Pi の「リス対策アーティファクト」が Reddit で人気に。13 行のコードで AI があなたの代わりに食べ物を守れる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

A100よりもコストパフォーマンスに優れています! FlightLLM により、大規模モデル推論でパフォーマンスとコストを同時に心配する必要がなくなりました。

端末側での大規模言語モデルの適用により、コンピューティング性能とエネルギー効率の需要が「引き出され」...

...