今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

今週の土曜日は上海へ行こう! Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

ERNIE は、Baidu のディープラーニング プラットフォーム PaddlePaddle 上に構築されたセマンティック理解テクノロジーおよびプラットフォームです。高度な事前トレーニング済みモデル、包括的な NLP アルゴリズム セット、エンドツーエンドの開発キット、プラットフォーム サービスを統合し、企業や開発者に NLP カスタマイズおよびアプリケーション機能の完全なセットを提供します。 2020年世界人工知能大会において、百度文鑫(ERNIE)が最高賞であるSAIL賞(スーパーAIリーダー)を受賞しました。

ERNIE は、ビッグデータの事前トレーニングと複数のソースからの豊富な知識の組み合わせを先駆的に開発し、大量のデータから継続的に知識を学習し、機械の意味理解のレベルを新たなレベルに引き上げました中国語モデルを例にとると、ERNIE は現在、1,500 万の百科事典コーパスと単語、エンティティ知識、700 万の人間の会話、3 億の記事の因果構造関係、10 億の検索クエリと結果の対応、2,000 万の言語論理関係知識を学習しています。このモデルは、新しい膨大なデータと知識を継続的にモデル化し、下流のアプリケーション効果を継続的に改善します。 ERNIE は、中国語と英語の 16 のタスクで業界最高のモデルを上回り、さまざまな NLP アプリケーション シナリオに完全に適用できます

現在、EasyDL には最先端の事前トレーニング済みモデル ERNIE2.0 がプリインストールされており、さまざまな古典的な NLP アルゴリズム ネットワークが搭載されており、テキスト分類、短いテキストのマッチング、シーケンスのラベル付けなどの一般的なテキスト処理タスクをサポートしています。

最近、ERNIEはカスタマイズされたマルチラベルテキスト分類、感情分析、テキストエンティティ抽出モデルなど、 3つの新機能を発表しました。同時にデータ管理機能もさらに強化され、NLP分野の開発者のニーズをよりよく満たしています。開発者はBaiduのAI開発プラットフォームEasyDLを通じてこれを利用できます。

EasyDLは、Baidu Brainがエンタープライズ開発者向けに立ち上げたゼロ閾値AI開発プラットフォームです。Baiduが自社開発したディープラーニングプラットフォームPaddlePaddleをベースに、業界の先進的なエンジニアリングサービス技術を組み合わせ、ビジョンと自然言語処理という2つの主要な技術方向をカバーし、ワンストップのインテリジェントラベリング、モデルトレーニング、サービス展開などの全プロセス機能をサポートします。現在、EasyDL は小売、インターネット、生産安全、工業品質検査、教育、医療、運輸など 20 を超える業界で広く使用されており、ユーザー数は 70 万人を超えています。

EasyDL を使用すると、優れたパフォーマンスで 3 つの簡単なステップで NLP タスクの構成とトレーニングを完了できます。

さて、ウェンシンはとても才能豊かなので、上級エンジニアと直接会って、技術原理と実用的なアプリケーションをすぐに習得する機会はありますか?

今週の土曜日、Baidu のシニア R&D エンジニアが上海に飛び、ERNIE テクノロジ分析から実践的な演習まで、企業向けに高精度の NLP モデルをカスタマイズする方法を午前中に説明しました。 (記事末尾のポスターにご登録ください)

まずは、ERNIE が最近リリースした多くの実用的な機能をプレビューして学ぶための技術的なヒントをいくつか見てみましょう。

カスタマイズされたマルチラベルテキスト分類機能を追加

「マルチラベルテキスト分類」とは、1 つのテキストに複数のラベルを同時に付けることです。たとえば、「学習と教育の未来は革命の真っ只中です。生徒は自宅で勉強し、ロボットが教壇に立つでしょう。」などです。対応するラベルは「教育」と「テクノロジー」です。この機能には、メディア シナリオでのニュース コンテンツの自動分類、コンテンツ推奨シナリオでのコンテンツ タグを使用したリコールの向上、自動ラベル付け機能によるナレッジ ドキュメントの多段階分類など、幅広い適用シナリオがあります。

現在、この機能は EasyDL プラットフォームのクラシック バージョンとプロフェッショナル バージョンの両方に追加されています。「プロフェッショナル エディション」のタスク構成プロセス中に、開発者は ERNIE Tiny、ERNIE Large、ERNIE Base という、それぞれに長所がある 3 つの事前トレーニング済みモデルから選択することもできます。

カスタマイズされた感情分析機能を追加

「感情傾向分析」とは、テキストの「肯定的な感情」または「否定的な感情」を判断することを指します。たとえば、「ホテルは素晴らしいロケーションにあり、サービスは思いやりがあり熱心で、次回も必ず来ます」などのユーザーレビューの場合、モデルを展開すると、「肯定的」ラベルと 99% の信頼度を直接取得できます。

この機能は、製品や店舗の口コミ分析、事実に基づくニュースイベントやインターネットトピックの世論分析など、ユーザーのコメント分析や世論分析で最もよく使用されます。自動車、ケータリング、ホテルなどの複数の垂直カテゴリでは、分析精度は 95% 以上に達する可能性があります。

現在、この機能は EasyDL クラシック バージョンでリリースされています。後続のプラットフォームでは、エンティティ レベルと文レベルに基づく感情分類を徐々に追加し、より多くのアプリケーション ニーズに対応できるように努めます。

 テキストデータ管理とデータ注釈機能の包括的なアップグレード

データ管理とデータラベル付けにおいて開発者が直面する問題点を解決するため、EasyDL はより柔軟なデータ形式をサポートし、現在は zip、Excel、TXT の 3 つのファイル形式でのアップロードをサポートしています。オンライン ラベリング機能の提供に加えて、インテリジェント ラベリング機能も提供し、開発者のラベリング コストを大幅に削減します。開発者は、ラベル付けされていないデータを直接アップロードして、この機能を体験できます。

図: インテリジェントテキスト注釈の概略図

10月24日、Baidu AI Fast Track [ PaddlePaddle Open Source Framework Advanced Camp ]オフラインコースが上海駅で「フラッシュ」され、「魔法都市プログラマー」と「上海プログラマー」を上海市徐匯区瑞平路230号Poly Time B1-09-LOFAS集会スペースに招待し、Baiduの上級エンジニアや業界の開発者と集まりました。上海ステーションのコンテンツは、絶対にあなたを空手にすることはありません。開発プロセス全体、展開ツール、高精度のターゲット検出、モデル最適化ソリューションが1つずつ紹介されています。また、「オールラウンド」OCRと金メダル推奨アルゴリズムもあります。一緒にハードコアパーティーをしましょう!

ERNIE の背後にある技術的原理を知りたいですか?

NLP モデル開発の方法とテクニックをさらに早く習得したいですか?

Baidu の上級 R&D スタッフやさまざまな業界の開発者とオフラインで深いコミュニケーションを取りたいですか?

今週の土曜日の午前中上海市徐匯区復興路1199号Aビル5階のBaidu AI Expressway [ EasyDLゼロ閾値モデルトレーニングキャンプ]で、上級R&DエンジニアがNLPの技術的機能を詳しく説明し、現場での実践的な操作と対面式の質疑応答を提供し、3時間でEasyDLのNLPモデル開発の秘密を習得できるようお手伝いします。

下のリンクをクリックして体験してください!

https://paddle.wjx.cn/m/93404058.aspx?udsid=798299

<<:  データセンターの物理的セキュリティに AI を活用する方法

>>:  技術革新により、AI人材が全国各地で活躍できるようになった

ブログ    

推薦する

AIに人間主義の精神を持ち込むことについて、フェイフェイ・リーとビル・ゲイツは今日スタンフォードで何について話したのでしょうか?

マイクロソフト創業者のビル・ゲイツ氏、グーグルの人工知能の第一人者ジェフ・ディーン氏、ディープマイン...

人工知能:現在も将来も有望

最近、2020年世界人工知能会議が中国上海で開催されました。各国の専門家らがオンラインで議論し、人工...

コードを自動生成できるAIベースの開発ツール5選

今日、機械学習の可能性に関心を持つプログラマーは、人工知能と AI ベースのソフトウェア開発ツールを...

人工知能とデータサイエンスに基づく実用的な分析システムの構築におけるシティバンクの実践経験

シティバンクは、人工知能とデータサイエンスに基づいた実用的な分析システムをどのように構築したのでしょ...

オープンソースの小規模モデルに基づく、GPT-4 を上回る 3 つのエージェント

本当の「三人の靴屋は一人の諸葛亮より優れている」 -オープンソースの小規模モデルに基づく 3 つのエ...

...

Go 言語アルゴリズムの美しさ - 基本的なソート

[[404642]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...

トピックモデルに適した定量評価指標を見つけるにはどうすればよいでしょうか?これは人気のある方法の要約です

LDA (潜在的ディリクレ分布) や Biterm などの統計トピック モデルを適用することで、大量...

今後 5 年以内にトラックは自動運転できるようになるでしょうか? 「人工知能の女王」はシノトラックでこの答えを出した

「人工知能の女王」ジャスティン・カッセル氏が済南の中国重汽で「人工知能と世界の未来経済」について講演...

...

Facebook の応用機械学習チームを訪問: 研究と応用の間に橋を架けるにはどうすればよいでしょうか?

Facebook では、応用機械学習チームがソーシャル ネットワークの視覚、会話、理解を支援してお...

AI スタートアップの品質を測定するにはどうすればよいでしょうか?

編集者注: Zetta Venture のパートナーである Ivy Nguyen 氏は最近、Tech...

...

...

機械学習モデルは株式市場を正確に予測できるのでしょうか?

[51CTO.com クイック翻訳] 人工知能は今や魔法の技術と見なされています。人類が直面してい...