1008 個の機械翻訳モデルが一挙にリリース、GitHub で最も人気のある NLP プロジェクトがアップデート: 140 の言語の組み合わせをカバー

1008 個の機械翻訳モデルが一挙にリリース、GitHub で最も人気のある NLP プロジェクトがアップデート: 140 の言語の組み合わせをカバー

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

GitHub で最も人気のある NLP プロジェクトを機械翻訳に使用できるようになりました。

はい、 26.9k 個の星が付いた Hugging Face Transformer プロジェクトです。最新のアップデートバージョンでは、Baobaolianは1008モデルをリリースし、正式に機械翻訳の分野に参入しました。

このモデルは、中国語から英語、英語からフランス語、フランス語からアラビア語など、140 種類の言語の組み合わせをカバーしており、1 対多の翻訳も可能です。

このような:

HugFaceの創設者クレメント・デラング氏はこう語った。

私たちのオープンソース プロジェクトを利用している人は世界中にたくさんおり、NLP コミュニティにはさまざまな言語を話す人々がますます集まっています。

これにより、モデル内で他の言語へのアクセスを提供するだけでなく、翻訳も提供する必要があることがわかりました。

1008 個の機械翻訳モデル

Baobaolian 氏によると、これらの 1,000 以上のモデルは、教師なし学習とOPUS データセットを使用して研究者によってトレーニングされたとのことです。

OPUS プロジェクトは、ヘルシンキ大学とその世界的なパートナーによって立ち上げられ、さまざまな言語データセット、特にリソースの少ない (少数言語) データセットを収集してオープンソース化することを目的としています。

部分モデル

さらに、HugFace は人気の Seq2Seq モデルを Transformer プロジェクトに追加しました。

たとえば、Google AI のT5や Facebook のBART などです

使い方は相変わらず簡単です。

たとえば、 opus-mt-en-ROMANCEモデルを使用すると、1 つの API で英語をフランス語に、英語をポルトガル語に、英語をスペイン語に同時に翻訳できます。

一部のネットユーザーは「時間を節約するのに最適なツールだ」とコメントした。

ハグフェイストランスフォーマーについて

HugFace の Transformer Python ライブラリには現在 500,000 を超える pip インストールがあり、SQuAD リーダーボード上のすべての最高の言語モデルが含まれています。

たとえば、Google AI の BERT、XLNet、Facebook AI の RoBERTa、OpenAI の GPT-2 などです。

使い方は簡単で、必要なインポートは 1 回だけです。

TensorFlow 2.0 と PyTorch 間の深い相互運用性をサポートします。

リアルタイムでプレイできるオンラインデモもあります。

この Wanxing プロジェクトを使用した NLP ユーザーは皆、これが良いと言っています。

今すぐ使いますか?

ポータル

GitHub プロジェクト: https://github.com/huggingface/transformers

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  ArcSoft Open Platformの新しいアルゴリズムは、顔認識セグメンテーションのシナリオの拡張に役立ちます

ブログ    
ブログ    

推薦する

GPT-4 は人間よりも資金調達を理解しています。 AIビジネスプランがベンチャーキャピタルを熱狂させる

AI が作成した資金調達計画が、実際に VC を熱狂的に追いつめたと信じられますか? GPT-4 に...

人工知能とモノのインターネットがスマートライフを推進

AI と IoT テクノロジーがスマート シティにどのような革命をもたらしているか。人工知能 (AI...

モバイルアプリケーションでディープラーニングを加速するにはどうすればよいでしょうか?この記事を読めば分かるだろう

現在、ディープラーニング技術を使用するモバイルアプリケーションは、通常、すべての DNN コンピュー...

分散型コンセンサスアルゴリズム: 想像以上に複雑

1. 分散システムの難しさ張大鵬は難しい問題に遭遇した。彼らの会社には貴重なデータを保存しているサー...

量子超越性のマイルストーン! Googleの量子コンピュータは47年分の計算を6秒で完了し、世界初のスーパーコンピュータを上回る

Googleは再び「量子超越性」を達成したのか?最近、Google は、同社の量子コンピュータが、世...

CVとNLPにおける対照学習の研究の進展

[[423166]]対照学習(CV)比較学習は何をするのでしょうか?教師ありトレーニングの典型的な問...

マイルストーンではありません! Facebookの100言語翻訳モデルは過大評価され、疑問視されている

[[347640]] Facebookはまた失敗したのか?フェイスブックは昨日、自社の機械翻訳が画期...

データ構造とアルゴリズム: 単調に増加する数値

[[439817]]単調に増加する数字LeetCode の問題へのリンク: https://leet...

ロボットの時代、トラクターの背後にある1兆ドル市場

自動化農業の需要を満たすには、栽培者は栽培シーズンを通して作物の成長と健康に関する正確な情報を入手し...

サービスロボットは大きな将来性があり、すぐに何千もの家庭に導入されるだろう

親が子どもの世話をしたり、子どもと遊んだり勉強したり、看護師や介護士の仕事を手伝ったりするロボットに...

2015年9月のプログラミング言語ランキング: 新しいインデックスアルゴリズムにより急上昇が解消

9月に、TIOBE Indexは改良されたアルゴリズムを使用してプログラミング言語の人気度を計算しま...

人工知能はソフトウェア開発のパラダイムを変えている

今日、多くのソフトウェア開発者は、コードの作成とレビュー、バグの検出、ソフトウェアのテスト、開発プロ...

AI基盤を強化し、業界の実践に注力する---WOTグローバル人工知能技術サミット機械学習実践フォーラムの記録

[51CTO.comよりオリジナル記事] 6月21日、51CTO主催のWOT2019グローバル人工知...