Amazon Transcribe について

Amazon Transcribe について

Amazon Transcribe は、開発者がアプリケーションに音声テキスト変換機能を簡単に追加できるようにする自動音声認識 (ASR) サービスです。 Amazon Transcribe API を使用すると、Amazon S3 に保存されている音声ファイルを分析し、サービスから文字起こしされた音声のテキストファイルを返すことができます。

[[241018]]

Amazon Transcribe は、カスタマー サービス コールの文字起こしや、オーディオおよびビデオ コンテンツの字幕生成など、多くの一般的なアプリケーションに使用できます。このサービスでは、WAV や MP3 などの一般的な形式で保存された音声ファイルを書き起こし、各単語にタイムスタンプを添付して、テキストを検索することで元のソース内の音声を簡単に見つけることができます。 Amazon Transcribe は、言語の進化に合わせて継続的に学習し、改善しています。

主な特徴

人間に優しい文字起こし

ほとんどの音声認識システムの出力は、句読点のないテキストのストリームです。 Amazon Transcribe はディープラーニングを使用して句読点や書式設定を自動的に追加し、出力をよりわかりやすくして、さらに編集することなくすぐに使用できるようにします。

カスタム語彙

Amazon Transcribe を使用すると、音声認識語彙を拡張およびカスタマイズできます。基本語彙に新しい単語を追加して、製品名、ドメイン固有の用語、個人名など、ユースケースに固有の非常に正確な文字起こしを生成できます。

タイムスタンプを生成する

Amazon Transcribe は各単語のタイムスタンプを返すため、テキストを検索することで元の録音内の音声を簡単に見つけることができます。

複数の話者を識別する

Amazon Transcribe は話者の抑揚を認識し、それに応じてトランスクリプトを作成します。これにより、電話、会議、テレビ番組など、複数の話者がいる音声を書き起こすために必要な労力を大幅に削減できます。

幅広いユースケースをサポート

Amazon Transcribe は、さまざまな品質のオーディオに対して正確な自動文字起こしを提供するように設計されています。あらゆるビデオ ファイルやオーディオ ファイルのキャプションを生成できるほか、カスタマー サービス通話などの低品質の電話録音を書き起こすこともできます。

チャンネル合成(近日公開予定)

Amazon Transcribe は、音声をより適切に処理するために、各話者の音声を個別のチャネルで録音します。コンタクトセンターは、Amazon Transcribe に単一のオーディオファイルを送信すると、2 つのチャネルを識別して分離し、各チャネルの音声を書き起こし、チャネルラベルを使用して調整された統合された書き起こしを作成するというメリットを得られます。

ユースケース

Amazon Transcribe は、カスタマーサービス、字幕作成、検索、コンプライアンスなど、幅広いユースケースに対応する文字起こしサービスを提供します。

顧客サービスの向上

Amazon Transcribe は、音声入力をテキストに変換することで、音声入力を検索および分析できるテキスト分析アプリケーションの構築に役立ちます。カスタマーコンタクトセンターは、Amazon Transcribe を使用して音声通話を書き起こし、Amazon Comprehend などの他の AWS 製品を使用してデータをマイニングし、会話から意味と意図を抽出することで洞察を得ることができます。

字幕ワークフロー

Amazon Transcribe は、ビデオコンテンツと一緒に表示されるタイムスタンプ付きの字幕を自動的に生成することで、コンテンツ作成者やメディア発行者がリーチとアクセスを拡大するのに役立ちます。

オーディオアーカイブカテゴリー

このサービスを使用すると、オーディオおよびビデオ資産を完全に検索可能なアーカイブに書き起こして、コンプライアンス監視とリスク管理に役立てることができます。お客様は、Amazon Transcribe を使用して音声をテキストに変換し、Amazon ElasticSearch Service を使用して音声/ビデオライブラリのインデックスを作成し、テキストベースの検索を実行できます。

<<:  Amazon Translateについて

>>:  Amazon SageMaker について

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

インダストリー4.0: AIを活用した障害検出

[[359728]] AI の向上とマシン ビジョン制御の向上を組み合わせることで、スマート製造業界...

TensorFlow2 を使用してアラビア語の手書き文字データセットを認識する方法を説明します

[[405478]]このチュートリアルでは、TensorFlow (Keras API) を使用して...

ローコードがAIの参入障壁を下げる

[[341638]] [51CTO.com クイック翻訳] 機械学習を迅速に実装したい組織は、新興の...

「乾物」テイクアウト注文に8大AI配送・配分内部機構搭載、元気いっぱい!

過去2年間、テイクアウトの市場規模は驚異的なペースで成長を続けています。美団の最近のフードデリバリー...

2019 年に人工知能アルゴリズムのポジションをめぐる競争がこれほど激しいのはなぜでしょうか?

AI関連の学位取得者は高給を得るのが難しいとメディアが以前報じていたのとは全く対照的に、多くの応募...

アルゴリズムの問​​題を解決するための Python 3 コード フレームワーク

序文現在インターンシップをしており、仕事量はそれほど多くないので、空き時間を利用してPATのウェブサ...

2020 年のディープラーニング フレームワークの簡単な比較

ご存知のとおり、機械学習フレームワークの分野では、PyTorch と TensorFlow がそれぞ...

スマート、インテリジェントなインタラクティブ推奨システムと販売前ショッピングガイドロボットをリリース

昨日、北京のマイクロソフトビルでSmarterが開催されました。カンファレンスのテーマは「インテリジ...

人工知能の分野に早く参入したいJavaプログラマーですか?準備はできたか?

導入今日は、Java プログラマーとして人工知能の分野に素早く参入する方法について説明します。現在、...

人工知能の時代に教育はどのように適応すべきでしょうか?

これからの学びは、従来の学校中心の島型ではなく、新しいタイプの島型になります。家庭、インターネット、...

AI モデルの 3 種類のバイアスとその修正方法

自動化された意思決定ツールは組織内でますます一般的になりつつあります。しかし、顔認識システムからオン...

インテリジェント運転の「人材不足」は大学の科目ゲームに閉じ込められている

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Antの信用リスク管理の実践

1. 信用リスク管理業務の背景と事例まず、当社の事業シナリオについて簡単にご紹介させていただきます。...

tf.keras と Eager Execution を使用して複雑な問題を解決する方法

生成モデルとシーケンス モデルは、常に私を魅了してきました。これらのモデルは、機械学習を初めて学ぶと...

Facebook は、自社の成功の要因となったアルゴリズムをどうやって修正できるのでしょうか?

[[428596]]専門家はCNNに対し、フェイスブックのアルゴリズムは改善できる可能性があると語...