GitHub の最も有名な 20 の Python 機械学習プロジェクトは収集する価値があります。

GitHub の最も有名な 20 の Python 機械学習プロジェクトは収集する価値があります。

オープンソースは技術革新と急速な発展の中核です。この投稿では、Python 機械学習のオープンソース プロジェクトと、分析中に見つかった非常に興味深い洞察と傾向を紹介します。

GitHub 上の上位 20 の Python 機械学習プロジェクトを分析したところ、scikit-Learn、PyLearn2、NuPic が最も積極的に貢献されているプロジェクトであることがわかりました。 Github で人気のプロジェクトを一緒に探索してみましょう。

1

Scikit-learn: Scikit-learn は、Scipy に基づいて機械学習用に構築された Python モジュールです。サポート ベクター マシン、ロジスティック回帰、ナイーブ ベイズ分類器、ランダム フォレスト、勾配ブースティング、クラスタリング アルゴリズム、DBSCAN など、さまざまな分類、回帰、クラスタリング アルゴリズムを備えています。また、Pythonの数値科学ライブラリNumpyとScipyも設計しました。

出典: scikit-learn

2

Pylearn2: Pylearn は、機械学習の研究を簡素化する Theano ベースのライブラリです。

https://github.com/lisa-lab/pylearn2

3

NuPIC: NuPIC は、HTM 学習アルゴリズムをツールとして使用する機械知能プラットフォームです。 HTM は皮質に対して計算的に正確な方法です。 HTM の中核は、時間ベースの継続的な学習アルゴリズムと、時空間パターンの保存と呼び出しです。 NuPIC は、さまざまな問題、特にストリーミング データ ソースの異常の検出と予測に適しています。

https://github.com/numenta/nupic

4

Nilearn: Nilearn は、神経画像データの高速統計学習を可能にする Python モジュールです。 Python の scikit-learn ツールボックスと、予測モデリング、分類、デコード、接続性分析のアプリケーションを使用して多変量統計を実行します。

https://github.com/nilearn/nilearn

5

PyBrain: Pybrain は、Python 言語の強化学習、人工知能、ニューラル ネットワーク ライブラリの略称です。 その目標は、柔軟で使いやすく、かつ強力な機械学習アルゴリズムを提供し、さまざまな定義済み環境でそれらをテストしてアルゴリズムを比較することです。

pybrain.com より

6

パターン: パターンは Python のネットワーク マイニング モジュールです。データマイニング、自然言語処理、ネットワーク分析、機械学習のためのツールを提供します。ベクトル空間モデル、クラスタリング、サポートベクターマシン、パーセプトロンをサポートし、分類には KNN 分類を使用します。

https://github.com/clips/pattern

7

Fuel: Fuel は機械学習モデル用のデータを提供します。 MNIST、CIFAR-10(画像データセット)、Google の One Billion Words(テキストデータセット)などのデータセットを共有するためのインターフェースを備えています。さまざまな方法で自分のデータを置き換えるために使用します。

http://www.github.com/mila-udem/fuel

8

Bob: Bob は無料の信号処理および機械学習ツールです。ツールボックスは Python と C++ で書かれており、効率を高めて開発時間を短縮するように設計されています。画像処理ツール、オーディオおよびビデオ処理、機械学習、パターン認識のための多数のパッケージで構成されています。

翻訳元:

9

Skdata: Skdata は、機械学習と統計のためのデータセットのライブラリ プログラムです。このモジュールは、おもちゃの問題、一般的なコンピューター ビジョン、自然言語データセットに対する標準の Python プログラミング言語サポートを提供します。

出典: jaberg

10

MILK: MILK は Python の機械学習ツールキットです。 SVM、K-NN、ランダムフォレスト、決定木など、利用可能な多くの分類方法の中から主に教師あり分類を使用します。 特徴選択も実行します。 これらの分類器はさまざまな方法で組み合わせることができ、教師なし学習、アフィニティ伝播、MILK を利用した K 平均法クラスタリングなど、さまざまな分類システムを形成できます。

ミルク

11

IEPY: IEPY は、関係抽出に重点を置いたオープンソースの情報抽出ツールです。これは主に、大規模なデータセットから情報を抽出する必要があるユーザーと、新しいアルゴリズムを試してみたい科学者を対象としています。

翻訳元:

12

Quepy: Quepy は、自然言語の質問をデータベース クエリ言語に変換してデータベースをクエリするための Python フレームワークです。これは、自然言語とデータベースクエリにおけるさまざまな種類の質問として簡単に定義できます。したがって、コーディングなしで自然言語を使用してデータベースに入力する独自のシステムを構築できます。 Quepy は現在、Sparql および MQL クエリ言語をサポートしています。また、他のデータベースクエリ言語にも拡張する計画があります。

翻訳元:

13

Hebel: Hebel は、Python でニューラル ネットワークのディープラーニングを行うためのライブラリ プログラムです。GPU および CUDA アクセラレーションには PyCUDA を使用します。これは、ニューラル ネットワーク モデルの最も重要なタイプ用のツールであり、モメンタム、ネステロフ モメンタム、ドロップアウト、停止方法などのさまざまな活性化関数を提供します。

ヘベル

14

mlxtend: 日常のデータ サイエンス タスクに役立つツールと拡張機能で構成されたライブラリです。

github.com/rasbt/mlxtend より

15

nolearn: このパッケージには、機械学習タスクに役立つユーティリティ モジュールが多数含まれています。これらのモジュールの多くは scikit-learn で動作しますが、他のモジュールはより一般的に役立ちます。

翻訳元:

16

Ramp: Ramp は、Python で記述された機械学習のプロトタイピング ソリューションを高速化するためのライブラリです。これは、パンダベースの機械学習用の軽量でプラグ可能なフレームワークです。Python の既存の機械学習および統計ツール (scikit-learn、rpy2 など) にシンプルな宣言型構文探索機能を提供し、アルゴリズムと変換を迅速かつ効率的に実装します。

詳しくはこちら

17

Feature Forge: このツール セットを使用すると、scikit-learn 互換 API を通じて機械学習関数を作成およびテストできます。このライブラリは、多くの機械学習アプリケーションで役立つツールセットを提供します。 scikit-learn を使用すると、大きな助けになっていると感じるでしょう。 (ただし、これは別のアルゴリズムを使用する場合にのみ機能します。)

翻訳元:

18

REP: REP は、調和のとれた再現可能な方法でデータの移動を誘導するための原動力を提供する環境です。 TMVA、Sklearn、XGBoost、uBoost などのさまざまな操作を提供するための統合分類器ラッパーを備えています。また、集団に対して並列的に分類器をトレーニングすることもできます。インタラクティブなプロットも提供します。

翻訳元:

19

Python 機械学習サンプル: Amazon の機械学習を使用して構築されたシンプルなソフトウェアのコレクション。

サンプル

20

Python-ELM: これは、Python の scikit-learn に基づく Extreme Learning Machines の実装です。

Python ELM は、Python の ELM ライブラリに含まれています。

<<:  2018年ニューリテール5大トレンド:無人小売が広がり続け、人工知能やIoTが新たな価値を創出

>>:  人工知能は衣料品工場の労働者に取って代わるでしょうか?

ブログ    

推薦する

現在のディープニューラルネットワークモデルの圧縮と加速方法の概要

[[208162]]大規模なニューラル ネットワークには多数のレイヤーとノードがあるため、特にオンラ...

...

...

ちょうど今、OpenAIはマスク氏を反論する記事を公式に発表し、過去8年間の電子メールのやり取りのスクリーンショットを公開した。

最も注目されているテクノロジー企業OpenAIと世界一の富豪マスク氏との壮大な戦いは新たなレベルに達...

GPT-4V オープンソース代替品!清華大学と浙江大学は、LLaVAやCogAgentなどのオープンソースの視覚モデルの爆発的な普及を先導した。

現在、GPT-4 Vision は言語理解と視覚処理において並外れた能力を発揮しています。ただし、パ...

マイクロソフトが積極的に顔認識データベースを削除した秘密は何でしょうか?

1. マイクロソフトはひそかに顔認識データベースを削除したマイクロソフトは、同社最大の公開顔認識デ...

Fooocus: シンプルで強力な安定した拡散 WebUI

Stable Diffusion は強力な画像生成 AI モデルですが、通常は多くのチューニングと...

金属の巨人からディープラーニングまで、人工知能の(ごく)短い歴史

[[202011]]クレタ島を海賊や侵略者から守るために、人々は巨大な青銅の戦士タロスを創造しました...

頻繁にミスを犯す自動運転車は「ドメイン適応」が欠如している可能性がある

6月に開催されるCVPR 2019は、マシンビジョン分野で最も重要な学術会議です。選考結果が発表され...

ChatGPTの背後にある技術的進化を分析する

1. 自然言語理解と言語モデル1.1 自然言語処理自然言語処理 (NLP) は人工知能 (AI) の...

今日の AI 開発者にとって必須のローコード ツール 22 選

翻訳者 |陳俊レビュー | Chonglou今日、人工知能ツール (AI) は非常に強力です。開発チ...

日本の首相、偽情報対策にAI生成ルールを発表へ

読売新聞によると、10月8日、岸田文雄首相は明日、京都で生成型AIの活用と規制ルールを発表する予定で...

WOT2018 孫林:連佳は人工知能技術の応用の原理と技術を探る

[51CTO.com からのオリジナル記事] 7 年間の努力と見事な変貌。 2012年以降、6年連続...

機械学習を学ぶ際に早い段階で知っておくべき3つのこと

私は長年、学界と産業界の両方で機械学習モデリングに取り組んできましたが、Scalable ML で「...

...