この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。 テキスト注釈ツールとサービスは、検索エンジンや感情分析から仮想アシスタントやチャットボットまで、幅広いアプリケーションで使用されています。 人工知能の研究開発業界では、注釈付きデータは金のようなものであり、大量の高品質の注釈付きデータは金鉱のようなものです。このデータを検索または作成するのは、チームにとってコストがかかり、困難な作業です。幸いなことに、さまざまなテキスト注釈ツールやサービスによって、エンティティ抽出、品詞タグ付け、感情分析など、必要なデータが提供されます。 タグトグ ポーランドに拠点を置く Tagtog は、テキストに自動または手動で注釈を付けることができるテキスト注釈ツールです。 Tagtog は、ネイティブの PDF 注釈だけでなく、自動注釈用の事前トレーニング済みのテキスト NER モデルもサポートします。同社には、Tagtog ツールに加えて、専門的なテキストに注釈を付けることができるさまざまな分野の専門家のネットワークがあります。 ライオンブリッジAI Lionbridge は言語学を専門とし、300 以上の言語に精通した 100 万人の多言語注釈者コミュニティを擁しています。テキスト注釈サービスには、テキスト抽出、感情分類、エンティティ注釈、名前付きエンティティ認識、言語コンポーネント分析が含まれます。さらに、Lionbridge は、チームがライセンスを取得してさまざまなテキスト注釈プロジェクトに使用できるカスタム データ注釈ソフトウェアを提供しています。 規模 Scale は、コンピューター ビジョンと NLP データ注釈サービスを提供するサンフランシスコを拠点とする企業です。同社は、人的作業と Scale プラットフォームを組み合わせることで、OCR 転写、テキスト分類、比較などのテキスト注釈サービスを提供しています。 タンポポAPI Dandelion API はイタリアに拠点を置き、さまざまな自動テキスト注釈ツールを提供しています。同社はまだ設立されたばかりですが、同社のツールはエンティティ抽出、感情分析、テキストおよびコンテンツの分類に使用できます。 Kコネクト 多くの AI 開発者が直面している問題の 1 つは、高度に専門化された AI トレーニング データへのアクセスです。 KConnect チームは、注釈者が医療データを迅速かつ効率的に分類し、注釈を付けられるように支援することに専念しています。具体的には、KConnect は医療情報に対するセマンティック注釈、テキスト分析、セマンティック検索サービスを提供します。 クリックワーカー Clickworker は、米国とドイツに拠点を置くクラウドソーシング企業であり、さまざまなタスクを完了できる大規模な従業員基盤を擁しています。同社が提供するテキスト注釈サービスは、感情分析と分類です。 ライトタグ LightTag テキスト注釈ツールは、注釈者や企業が社内でテキスト データをタグ付けするためのプラットフォームです。初期パッケージは無料ですが、パッケージレベルが上がるごとにコストが上がり、月あたりの注釈の数には制限があり、1 か月あたり 1,000 個の注釈が無料で提供されます。 ParallelDots テキスト注釈 API ParallelDots は、多数のテキスト注釈ツールと API を提供する企業です。同社のソリューションには、感情分析、感情分析、キーワード抽出、固有表現認識などが含まれます。
画像出典: Google アペン Appen は、さまざまな国から多数のクラウドソーシング従業員を抱えており、さまざまな AI トレーニング データのサプライヤーです。たとえば、テキスト注釈サービスには、感情注釈、意図注釈、名前付きエンティティ注釈が含まれます。 Dataturks テキスト注釈ツール Dataturks は、データ注釈用の内部 API と数千のアウトソーシング パートナー企業を活用して、さまざまな画像注釈およびテキスト注釈ツールを提供しています。具体的には、テキスト タグ付け機能には、テキスト分類、固有表現認識、品詞タグ付けが含まれます。 あなたにぴったりのツールが見つかることを願っています。 |
<<: 2020年を振り返ると、我が国のドローンは4つの新たな変化を遂げた。
>>: 無料の Python 機械学習コース 8: 精度と再現率
現在、ディープラーニング テクノロジーを展開できる方法としては、デバイス上への直接展開、クラウド内へ...
この世で唯一負けない武術はスピードだ。ディープラーニング モデルをより速くトレーニングする方法は、常...
最近開催されたカオスコンピューティングカンファレンスで、ベルリン工科大学のサイバーセキュリティ研究者...
これはおそらく、世界的なCOVID-19パンデミックによるものか、あるいはコンピューティング能力の継...
ネットワーク セグメンテーションは、企業の攻撃対象領域を減らし、横方向の移動を防ぐ基本的な予防的セキ...
ロボットの学習方法を開発する際に、大規模で多様なデータセットを統合し、強力で表現力豊かなモデル (T...
1. リレーショナルデータはSQLから分離される最新のエッジ コンピューティング、IoT、GenAI...
[[273786]] [51CTO.com クイック翻訳] 1980年代のインターネットの出現から...
Jupyter Notebook は、開発やドキュメントの作成からコードの実行、結果の表示まで、コン...
ヘッドホンは必要なく、脳コンピューターインターフェースを通じて直接音楽を聴くことができ、体内のホルモ...
ボストンのロボット犬はしばらく前から販売されているが、価格は少々魅力的ではない。インターネット上には...