AI インテリジェント音声認識アルゴリズムパート 2

[[397599]]

1. ニューラルネットワーク

現在一般的に使用されている音声認識フレームワークは以下のとおりです。

この背後にある論理は

特徴抽出に使用されるニューラルネットワークのDNN技術

DNN テクノロジーは、CNN モデルと RNN モデルの 2 種類に分けられます。

2. デコーダー

デコーダー情報は、音響モデル、辞書、言語モデルから取得されます。ブロック図は次のとおりです。

2.1 音響モデル

一般的に使用される音響モデルは、ガウスモデルと隠れマルコフモデルの混合モデルである GMM-HMM です。

HMM モデルは時系列情報をモデル化します。HMM の状態が与えられた後、GMM はその状態に属する音声特徴ベクトルの確率分布をモデル化します。

2.2 辞書

辞書：発音辞書です。中国語ではピンインと漢字の対応、英語では発音記号と単語の対応です。

使用：

音響モデルによって認識された音素に基づいて、辞書内で対応する漢字（単語）または単語が検索され、音響モデルと言語モデルの間に橋渡しが行われ、両者が接続されます。

たとえば、次の単語マッピングテーブル:

2.3 言語モデル

言語モデルは、特定の言語用に構築された確率モデルであり、文の確率を計算するために使用されます。

次の2つのタイプに分けます。

2.3.1 N-gram統計言語モデル: N-gramモデル、スムージング

2.3.2 ニューラルネットワーク言語モデル:

ニューラルネットワーク言語モデルは、統計言語モデルとは異なり、n 要素の条件付き確率をカウントによって推定するのではなく、ニューラルネットワークを通じて直接モデル化して解決します。

使用：

1. どちらの単語の並びがより可能性が高いかを判断する

2. いくつかの単語が与えられたら、次の単語を予測する

例：

1.私はパーティーに行きました。

目は2つのバーティーに行きました。

2. 今何をしていますか?

<<: 映画品質の CG レンダリングを作成しましょう!スタンフォード大学の研究者がニューラル光学レンダリングを提案

>>: AI インテリジェント音声認識アルゴリズムパート 1

人工知能はビッグデータの保存と管理の効率をどのように向上させるのでしょうか?

ブログ

C# のデータ構造とアルゴリズムにおけるツリーの役割を紹介します

ブログ

システムアーキテクト、アルゴリズムエンジニア、人工知能エンジニアはどの程度の数学を学ぶ必要がありますか?

ブログ

QTNet: 最新のタイミング融合ソリューション!ポイントクラウド、画像、マルチモーダル検出器はすべて適用可能 (NeurIPS 2023)

ブログ

速報です！画像AI企業「Huiyi Huiying」がハッキングされ、COVID-19研究成果が公開された

ブログ

音声認識システムが裁判にかけられる

ブログ

人工知能はあなたが思っているほど遠いものではないかもしれない

ブログ

PyTorch のデータセット Torchvision と Torchtext

ブログ

AI インテリジェント音声認識アルゴリズムパート 2

人工知能はビッグデータの保存と管理の効率をどのように向上させるのでしょうか?

C# のデータ構造とアルゴリズムにおけるツリーの役割を紹介します

システムアーキテクト、アルゴリズムエンジニア、人工知能エンジニアはどの程度の数学を学ぶ必要がありますか?

QTNet: 最新のタイミング融合ソリューション!ポイントクラウド、画像、マルチモーダル検出器はすべて適用可能 (NeurIPS 2023)

速報です！画像AI企業「Huiyi Huiying」がハッキングされ、COVID-19研究成果が公開された

音声認識システムが裁判にかけられる

人工知能はあなたが思っているほど遠いものではないかもしれない

PyTorch のデータセット Torchvision と Torchtext

推薦する

顔認識におけるコモンズの悲劇

Appleの10年にわたる自動車製造の夢は打ち砕かれた！ 2,000人が解雇またはAIに異動し、100億ドル近くが燃え尽き、マスク氏は大喜び

Google AIが新世代の「物体検出」システムをリリース

次世代のサイバー脅威はAIから生まれる

普遍近似定理を理解しなければ、ニューラルネットワークを理解することはできない

機械学習アルゴリズムに関する 16 のヒント

科学者らが病気の早期発見と治療のための埋め込み型人工知能システムを開発

ソートアルゴリズムを簡単に学ぶ: よく使われるソートアルゴリズムを視覚的に体験

OpenAIも996に取り組んでいますか？元従業員が告白：コード貢献度4位、6日間勤務することが多かった

人工知能が野生生物保護活動に貢献

ヘルスケアにおける機械学習の悪影響

睡眠研究はより優れた AI モデルの作成に役立ちますか?