今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理 Python ライブラリ spaCy でした。 SpaCy は、自然言語処理の研究に基づいて作成されたオープンソース プロジェクトであり、最終的には実際の製品やソリューションに使用することを目的としています。バージョン 2.0 では、新しいニューラル ネットワーク モデル、より多くの言語のサポート、ドキュメントの改善など、いくつかの新機能が追加されています。

SpaCy の作者である Matthew Honnibal 氏は、リリース ノートで、新しいバージョンでは最先端のディープラーニング技術を使用して spaCy が更新され、スケーラブルなクラウド コンピューティング ワークフローで spaCy を実行しやすくなると書いています。

新しいバージョンには、7 つ以上の言語に対応した 13 のニューラル ネットワーク モデルが含まれています。また、8 つの新しい言語 (英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語、多言語 NER) のアルファ トークン化サポートも追加されました。小さなテーブルで大きな語彙をサポートするために、ブルーム埋め込み戦略を使用します。コア ニューラル ネットワーク モデルには品詞タグ、依存タグ、名前付きエンティティが含まれ、小規模モデルにはコンテキスト固有のトークン ベクトルのみが含まれ、中規模モデルには単語ベクトルが含まれます。

このバージョンでは、使用ガイド、API ドキュメント、コード例のほとんどが書き直されました。ドキュメントには、カスタム処理パイプライン、視覚化ツール、トレーニング チュートリアル、単語ベクトル、ルールベースのマッチングに関する情報が含まれています。重要な概念の説明と図解、およびライブラリの機能の概要が記載された spaCy 101 ガイドができました。

1 週間前にバージョン 2.0 にアップデートして以来、いくつかのバグを修正し、ビデオの追加、トレーニングのヒントと提案のセクションの更新などによりドキュメントをさらに更新するバージョン 2.0.3 がリリースされました。

先週 Github で最も人気のある他の 5 つのプロジェクト (トレンドランキングに基づく。興味のある方は、Github でプロジェクト名を直接検索して詳細情報を確認できます)。

  • Git フライトルール: Git を使用するためのプログラマー向けガイド。何か問題が発生した場合、開発者はプロジェクトを調べて、何ができるかを確認できます。

  • 機械学習の問題に対する最先端の結果: 名前が示すように、SoTA はすべての機械学習の問題を解決できます。

  • Node のベスト プラクティス: Node.js のベスト プラクティスのリスト

  • JS コードから SVG フローチャート: JS コードを SVG フローチャートに変換するための視覚化ライブラリ。

  • Tensorflow: 機械学習用のオープンソース ソフトウェア ライブラリ。

<<:  深層強化学習入門: TensorFlow で初めてのゲーム AI を構築する

>>:  卒業後すぐに年収56万は貰えるんですか?右! Twitterの機械学習の専門家が書いた上級マニュアルをご覧ください

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

識別的か生成的か: どちらが視覚的理解の未来を表すのでしょうか?

これまで、視覚システムに関する基本的な研究の多くは、動物に画像を見せ、そのニューロンの反応を測定し、...

...

AIの使用後、機械は人間の皮膚に匹敵する触覚を持つ丨科学サブジャーナル

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ドローンの将来の用途

ドローンは、1960年代以降、政府と軍隊によるインテリジェントな戦闘装備の需要から生まれました。米軍...

人工知能の7つの主要技術、ついに誰かがわかりやすく説明してくれた

[[345456]]企業による AI の利用を複雑にする要因の 1 つは、このトピックに複数の異なる...

オントロジーから始める:オペレータ関係マップの構築と応用

[[258543]]人類学者ロビン・ダンバーは、人間が親密な人間関係を維持できる最大人数は 150 ...

AI STUDIO - AI機能を実現するためのハードルゼロ

AI技術の発展により、人類社会は熱い知能革命の真っ只中にあります。技術革命の波に素早く適応できる者が...

3つの主要なSQL ServerアルゴリズムのI/Oコストの簡単な分析

1. ネストループ結合アルゴリズム:考え方は非常に単純かつ直接的です。関係 R の各タプル r を、...

最も強力なオープンソースのマルチモーダル生成モデル MM-Interleaved: 最初の機能同期装置

AI がチャットできるだけでなく、「目」を持ち、絵を理解し、絵を描くことで自分自身を表現することさえ...

...

医療用人工知能の分野は新たな状況を迎え、テクノロジー大手は積極的に導入を進めている。

報告書によると、医療における人工知能の主な応用分野の一つである医療ロボットの市場規模は2019年に4...

あなたは人工知能/機械学習についてどれくらい知っていますか?

[[188835]]クイズ番組やマンマシン囲碁で人間に勝ったり、広告で人種差別的な偏見を示したとし...

米裁判所、人工知能コンピューターは発明を特許できないと判決

[[421713]]人工知能(AI)がその発明に対して特許を申請できるかどうかに関して、米国連邦政府...

2021 年に注目すべき 4 つの自動化問題

[[377158]]研究によれば、コロナウイルスのパンデミック中に組織が確立したビジネス規範は、パン...