GitHub の最も有名な 20 の Python 機械学習プロジェクトは収集する価値があります。

GitHub の最も有名な 20 の Python 機械学習プロジェクトは収集する価値があります。

オープンソースは技術革新と急速な発展の中核です。この投稿では、Python 機械学習のオープンソース プロジェクトと、分析中に見つかった非常に興味深い洞察と傾向を紹介します。

GitHub 上の上位 20 の Python 機械学習プロジェクトを分析したところ、scikit-Learn、PyLearn2、NuPic が最も積極的に貢献されているプロジェクトであることがわかりました。 Github で人気のプロジェクトを一緒に探索してみましょう。

1

Scikit-learn: Scikit-learn は、Scipy に基づいて機械学習用に構築された Python モジュールです。サポート ベクター マシン、ロジスティック回帰、ナイーブ ベイズ分類器、ランダム フォレスト、勾配ブースティング、クラスタリング アルゴリズム、DBSCAN など、さまざまな分類、回帰、クラスタリング アルゴリズムを備えています。また、Pythonの数値科学ライブラリNumpyとScipyも設計しました。

出典: scikit-learn

2

Pylearn2: Pylearn は、機械学習の研究を簡素化する Theano ベースのライブラリです。

https://github.com/lisa-lab/pylearn2

3

NuPIC: NuPIC は、HTM 学習アルゴリズムをツールとして使用する機械知能プラットフォームです。 HTM は皮質に対して計算的に正確な方法です。 HTM の中核は、時間ベースの継続的な学習アルゴリズムと、時空間パターンの保存と呼び出しです。 NuPIC は、さまざまな問題、特にストリーミング データ ソースの異常の検出と予測に適しています。

https://github.com/numenta/nupic

4

Nilearn: Nilearn は、神経画像データの高速統計学習を可能にする Python モジュールです。 Python の scikit-learn ツールボックスと、予測モデリング、分類、デコード、接続性分析のアプリケーションを使用して多変量統計を実行します。

https://github.com/nilearn/nilearn

5

PyBrain: Pybrain は、Python 言語の強化学習、人工知能、ニューラル ネットワーク ライブラリの略称です。 その目標は、柔軟で使いやすく、かつ強力な機械学習アルゴリズムを提供し、さまざまな定義済み環境でそれらをテストしてアルゴリズムを比較することです。

pybrain.com より

6

パターン: パターンは Python のネットワーク マイニング モジュールです。データマイニング、自然言語処理、ネットワーク分析、機械学習のためのツールを提供します。ベクトル空間モデル、クラスタリング、サポートベクターマシン、パーセプトロンをサポートし、分類には KNN 分類を使用します。

https://github.com/clips/pattern

7

Fuel: Fuel は機械学習モデル用のデータを提供します。 MNIST、CIFAR-10(画像データセット)、Google の One Billion Words(テキストデータセット)などのデータセットを共有するためのインターフェースを備えています。さまざまな方法で自分のデータを置き換えるために使用します。

http://www.github.com/mila-udem/fuel

8

Bob: Bob は無料の信号処理および機械学習ツールです。ツールボックスは Python と C++ で書かれており、効率を高めて開発時間を短縮するように設計されています。画像処理ツール、オーディオおよびビデオ処理、機械学習、パターン認識のための多数のパッケージで構成されています。

翻訳元:

9

Skdata: Skdata は、機械学習と統計のためのデータセットのライブラリ プログラムです。このモジュールは、おもちゃの問題、一般的なコンピューター ビジョン、自然言語データセットに対する標準の Python プログラミング言語サポートを提供します。

出典: jaberg

10

MILK: MILK は Python の機械学習ツールキットです。 SVM、K-NN、ランダムフォレスト、決定木など、利用可能な多くの分類方法の中から主に教師あり分類を使用します。 特徴選択も実行します。 これらの分類器はさまざまな方法で組み合わせることができ、教師なし学習、アフィニティ伝播、MILK を利用した K 平均法クラスタリングなど、さまざまな分類システムを形成できます。

ミルク

11

IEPY: IEPY は、関係抽出に重点を置いたオープンソースの情報抽出ツールです。これは主に、大規模なデータセットから情報を抽出する必要があるユーザーと、新しいアルゴリズムを試してみたい科学者を対象としています。

翻訳元:

12

Quepy: Quepy は、自然言語の質問をデータベース クエリ言語に変換してデータベースをクエリするための Python フレームワークです。これは、自然言語とデータベースクエリにおけるさまざまな種類の質問として簡単に定義できます。したがって、コーディングなしで自然言語を使用してデータベースに入力する独自のシステムを構築できます。 Quepy は現在、Sparql および MQL クエリ言語をサポートしています。また、他のデータベースクエリ言語にも拡張する計画があります。

翻訳元:

13

Hebel: Hebel は、Python でニューラル ネットワークのディープラーニングを行うためのライブラリ プログラムです。GPU および CUDA アクセラレーションには PyCUDA を使用します。これは、ニューラル ネットワーク モデルの最も重要なタイプ用のツールであり、モメンタム、ネステロフ モメンタム、ドロップアウト、停止方法などのさまざまな活性化関数を提供します。

ヘベル

14

mlxtend: 日常のデータ サイエンス タスクに役立つツールと拡張機能で構成されたライブラリです。

github.com/rasbt/mlxtend より

15

nolearn: このパッケージには、機械学習タスクに役立つユーティリティ モジュールが多数含まれています。これらのモジュールの多くは scikit-learn で動作しますが、他のモジュールはより一般的に役立ちます。

翻訳元:

16

Ramp: Ramp は、Python で記述された機械学習のプロトタイピング ソリューションを高速化するためのライブラリです。これは、パンダベースの機械学習用の軽量でプラグ可能なフレームワークです。Python の既存の機械学習および統計ツール (scikit-learn、rpy2 など) にシンプルな宣言型構文探索機能を提供し、アルゴリズムと変換を迅速かつ効率的に実装します。

詳しくはこちら

17

Feature Forge: このツール セットを使用すると、scikit-learn 互換 API を通じて機械学習関数を作成およびテストできます。このライブラリは、多くの機械学習アプリケーションで役立つツールセットを提供します。 scikit-learn を使用すると、大きな助けになっていると感じるでしょう。 (ただし、これは別のアルゴリズムを使用する場合にのみ機能します。)

翻訳元:

18

REP: REP は、調和のとれた再現可能な方法でデータの移動を誘導するための原動力を提供する環境です。 TMVA、Sklearn、XGBoost、uBoost などのさまざまな操作を提供するための統合分類器ラッパーを備えています。また、集団に対して並列的に分類器をトレーニングすることもできます。インタラクティブなプロットも提供します。

翻訳元:

19

Python 機械学習サンプル: Amazon の機械学習を使用して構築されたシンプルなソフトウェアのコレクション。

サンプル

20

Python-ELM: これは、Python の scikit-learn に基づく Extreme Learning Machines の実装です。

Python ELM は、Python の ELM ライブラリに含まれています。

<<:  2018年ニューリテール5大トレンド:無人小売が広がり続け、人工知能やIoTが新たな価値を創出

>>:  人工知能は衣料品工場の労働者に取って代わるでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

ImageNet-1K 圧縮 20 倍、Top-1 精度が初めて 60% を超える: 大規模データセット蒸留の転換点

データの圧縮や蒸留というタスクは、ここ数年大きな注目を集めています。データ圧縮方法は、大規模なデータ...

2011 コンピュータソフトウェア試験プログラマー: アルゴリズム分析の基礎学習

コンピュータの問題解決のプロセスにおいて、データ構造とアルゴリズムはプログラムの 2 つの主要要素で...

高いリアリティ、全体的な一貫性、優れた外観を備えたぼやけたターゲット向けの NeRF ソリューションがリリースされました

[[402913]]オブジェクトの明るさが色やビューに大きく依存する多くの没入型 VR/AR アプリ...

フェイフェイ・リーのチームはディープラーニングの「遊び場」を作った。AIも独自に進化しており、考えてみると恐ろしいことだ。

[[427578]]動物の知能は、環境と相互作用するにつれて、その体の形に合わせて進化します。例え...

GPT-4 に追いつく!李開復のYi-34Bの新しい結果が発表されました:勝率94.08%はLLaMA2などの主流の大型モデルを超えています

GPT-4に次ぐ、李開復のYi-34B-Chatの最新成果が発表されました——アルパカ認定モデル部門...

ディープラーニングによるマラリア検出

​​ [[266327]]​​人工知能とオープンソースのハードウェアツールを組み合わせることで、深刻...

安全性は小さな問題ではありません。これがAI時代に彼らが選択することです

AI時代においては、セキュリティを早急に再定義する必要があります。人工知能やモノのインターネットなど...

百度は「ニューラル条件付きランダムフィールド」病理スライス分析アルゴリズムをオープンソース化、専門病理学者よりも高い精度を実現

最近、百度研究所は論文で「ニューラル条件付きランダムフィールド」病理スライス分析アルゴリズムを提案し...

機械学習のための数学をどのように学ぶのでしょうか?

機械学習では数学が非常に重要です。アルゴリズムにおけるモデルコードの理解と、エンジニアリングにおける...

6つの興味深い画像グレースケール変換アルゴリズム

[楊静卓のブログより引用]序文白黒写真の時代は過ぎ去りましたが、今、昔の写真を見ると、昔に戻ったよう...

クラウド コンピューティングにおいて人工知能はどのような役割を果たすのでしょうか?

今日のデジタル世界では、人工知能とクラウド コンピューティングが毎日多くの人々の仕事と生活に影響を与...

空中で疫病と戦うドローン

新型コロナウイルス肺炎の流行が始まって以来、多くのハイテク技術がこの疫病との戦いに後方支援を提供して...

バナナの皮をむくのに9つの手順が必要ですか?ロボットが果肉を傷つけないように、研究者たちは何百本ものバナナの皮をむくのに13時間を費やした。

ビッグデータダイジェスト制作著者: カレブボストン・ダイナミクスを例に挙げると、ロボットはますます多...

ZTouch創設チーム:私たちの価値観を守り、新世代のグローバル企業のデジタルインテリジェンスパートナーになる

今日のデジタル時代では、顧客獲得の方法はよりシンプルになりましたが、さまざまなプラットフォームでの煩...