MIT、失われた古代言語を解読するための新しい機械翻訳アルゴリズムを発表

MIT、失われた古代言語を解読するための新しい機械翻訳アルゴリズムを発表

MITのコンピュータ科学および人工知能研究所(CSAIL)の研究者らは、歴史から長い間失われていた古代言語を言語学者が自動的に解読するのに役立つ可能性のある新しいコンピュータアルゴリズムを開発した。

当局は、このシステムは、言語と他の言語との関係についての詳細な知識を必要とせずに、絶滅した言語を自動的に解読できると述べた。また、このシステム自体が言語間の関係を判断できることも示され、イベリア語が実際にはバスク語とは無関係であることを示した最近の学術研究を確認するのにも使用できることが示された。

[[348785]]

CSAILは、最近の調査で、これまで存在していた言語のほとんどがもはや使われていないことが示されていると述べた。これらの絶滅した言語のうち数十は、「未解読」言語とも考えられています。これは、一般の人々が、テキストの意味を理解するのに十分な文法、語彙、構文の知識を持っていないことを意味します。

これらの「解読されていない」言語の研究は、学術的な好奇心からだけではありません。また、言語を理解しなければ、その言語を話す人々に関する膨大な知識を逃してしまうことにもなります。残念ながら、絶滅した言語のほとんどは記録がほとんど残っていないため、科学者がGoogle翻訳などの機械翻訳ツールやAIアルゴリズムを使用して解読することは不可能です。

そのため、CSAILチームの新しいアルゴリズムの最終的な目標は、言語学者が数十年にわたって理解するのが困難だった失われた言語を、わずか数千語を使って解読することです。

MITのレジーナ・バルジレイ教授が率いるこの研究は、歴史言語学の洞察に基づくいくつかの原則に依存している。たとえば、言語は一般的に、特定の予測可能な方法でのみ進化します。具体的には、特定の言語では音節全体が追加または削除されることはほとんどありませんが、類似した発音の置換は発生する可能性があります。たとえば、母国語で「p」の音を持つ単語は、その派生語では「b」になる可能性がありますが、明らかな発音の違いにより「k」になる可能性は低くなります。

これらの原則とその他の言語的制約を取り入れることで、Barzilay 氏と MIT 博士課程の学生 Jiaming Luo 氏は、可能な変換の巨大な空間と入力内の誘導信号の不足を処理できる復号化アルゴリズムを開発しました。このアルゴリズムは、対応するベクトル間の距離が異なる発音の違いを反映する多次元空間に言語音を埋め込むことを学習します。この設計により、言語のバリエーションの関連パターンを捕捉し、それを計算上の制約として表現することが可能になります。結果として得られるモデルは、古代言語の単語を分割し、関連する言語の対応する単語にマッピングできます。

このプロジェクトは、バルジレイ氏とルオ氏が昨年執筆した、絶滅したウガリット語と線文字Bの解読に関する論文に基づいている。線文字Bの解読にはこれまで人類が数十年を要していた。しかし、2つのプロジェクトの重要な違いは、これらの言語がそれぞれヘブライ語とギリシャ語の初期の形態に関連していることをチームがすでに知っていたことです。

新しいアルゴリズムは、言語解読における最大の課題の 1 つである言語間の関係性を推測することができます。このアルゴリズムは 2 つの言語間の類似性を評価でき、既知の言語でテストすると、その言語がどの言語ファミリーに属するかを正確に識別することもできます。それだけでなく、アルゴリズムによって生成されたモデルは、古代言語の単語を細分化し、それらを「関連」言語の対応する単語に 1 つずつマッピングすることができます。

今後の研究で、研究チームは、テキストを既知の言語の関連語と関連付けるという「同族語ベースの解読」と呼ばれるアプローチを超えて、研究範囲を広げたいと考えている。 「例えば、テキストに記載されているすべての人物や場所に関する情報を特定し、既知の歴史的証拠に基づいてさらに調査することができます」と彼は語った。「これらのエンティティ認識方法は現在、さまざまなテキスト処理アプリケーションで高い精度で広く使用されています。しかし、重要な研究上の疑問は、このタスクが古代言語のトレーニングデータなしで実行可能かどうかということです。」

この記事はOSCHINAから転載したものです。

この記事のタイトル: MIT、失われた古代言語を解読するための新しい機械翻訳アルゴリズムを発表

記事URL: https://www.oschina.net/news/119481/mit-translating-lost-languages-machine-learning

<<:  スタンフォード大学の教授が、専門家以外の人向けにAIの核となる概念を1ページで定義

>>:  AIの次の目的地:洗練された生活シナリオのインテリジェント時代

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

大規模製造企業におけるインテリジェントな意思決定シナリオの分析

1. 製造業の発展の現状まず、製造業企業の発展状況について紹介します。 1. 企業経営は直線的な発展...

...

世界初、AIによる豚のクローン作成に成功!南開大学がやった

超AI制御により、機械が自動的に人間の胚のクローンを作成し、培養用の栄養プールに送り込み、人間のバッ...

サイバー犯罪者が機械学習を利用する 7 つの方法: 対抗策

[51CTO.com クイック翻訳] イスラエルのベングリオン国際空港は、世界で最も安全な空港の一つ...

2023年ゴードン・ベル賞発表:最先端のスーパーコンピューターによる「量子レベルの精度」の材料シミュレーションが受賞

ACM ゴードン・ベル賞は 1987 年に設立され、計算機協会によって授与されます。スーパーコンピュ...

あらゆる角度から監視されることへの不安:AI はプライバシー侵害にどう対抗できるか?

インテリジェント時代では、アルゴリズムと計算能力の継続的な進歩により、AI 技術が急速に発展しました...

シンプルでスマートなアプローチ: Python による顔認識

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

...

...

兵器化されたロボットはやってくるのか?米警察、ボストン・ダイナミクスのロボット犬をパトロールに活用

「ブラックミラー」シリーズのエピソード「メタルヘッド」を見て、ロボット犬が兵器としてもたらす危害を知...

顧客サービスの応答時間を短縮して潜在顧客の喪失を回避する方法

急速に変化する今日の世界では、誰も待たされることを好みません。私たちはリクエストに迅速に対応してもら...

人工知能を始めるときに尋ねるべき10の質問

人工知能 (AI) と機械学習 (ML) のテクノロジーは、世界中のほぼすべての業界に革命をもたらし...

機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

中国のAIチップ「覚醒」の5年

10 種類以上のチップが発売され、多くの合併や買収が行われています。これは、過去 500 日間の中国...