FenyintaのCTO、張明氏:観光産業を深く掘り下げ、AI技術を使って異言語コミュニケーションの問題を解決する

FenyintaのCTO、張明氏:観光産業を深く掘り下げ、AI技術を使って異言語コミュニケーションの問題を解決する

[51CTO.comからのオリジナル記事] 1930年代初頭、フランスの科学者GBアルチュニは翻訳に機械を使用するというアイデアを提案しました。現在までに、多くの画期的な出来事によって機械翻訳の実現可能性と実用性が確認されており、その幅広い将来性に疑いの余地はありません。機械翻訳をより有効に活用して言語間のコミュニケーション問題を解決するために、GoogleやBaiduなどの国内外の大手企業が相次いで関連チームを設立しました。もちろん、小規模で優れた新興企業もニッチな業界に進出し、サウンドタワーなどの特定のシナリオに焦点を当てています。

最近、Fenyinta CTO の Zhang Ming 氏が 51CTO との独占インタビューに応じました。彼は 1999 年にシンガポールイノベーションテクノロジーで働いていたときに機械翻訳に関わり始めたため、この分野に関して深く独自の洞察を多く持っています。

[[223344]]

サウンドタワーのCTO、張明氏

機械翻訳の3つの主要段階: ルール、統計アルゴリズム (SMT)、ディープラーニング (NMT)

張明氏は、機械翻訳の発展の道筋は他の多くの技術と似ており、技術的な観点からは、ルール、統計アルゴリズム、ディープラーニングという3つの主要な段階に分けられると述べた。

ルール

最初の段階はルールベースのアプローチです。ルールは、言語学者が知識と言語の理解を活用してカスタマイズし、その後、コンピューター分野の専門家によって実装されます。

このアプローチの欠点は明らかです。主な理由は、ルールが網羅的ではないため、ユーザーが入力したすべてのコンテンツがカバーされることを保証する方法がないことです。ユーザーが入力したコンテンツがルールに一致すると、翻訳効果は非常に高くなります。逆もまた同様です。

スマトラ

第 2 段階は統計アルゴリズムに基づいています。翻訳分野のデータが増えるにつれて、統計的手法を使用して大量のコーパス データをモデル化するようになり、言語規則への依存から徐々に離れつつあります。

統計アルゴリズムに基づくアプローチには、実際に言語原理が含まれています。人間の認知力は、翻訳プロセス全体がどのように達成されるかを理解し、解釈することができます。

ナノメートル

3 番目のステージはディープラーニングに基づいています。現在、ディープラーニングはブラックボックスアプリケーションです。異なるモデルに従って翻訳することで最終的な翻訳効果は大幅に向上しますが、実装プロセスを現在の人間の認知に基づいて解釈することはできません。

AIセグメンテーション技術を使用して、ユーザーの視点から製品を反復する

2016年にFenyintaを設立した理由を尋ねられた張明氏は、データとNMTモデルの発展により、2015年頃にNMTがSMTを上回り、全体的な翻訳効果が大幅に向上したと述べました。 2016年には、プログラミング言語NMTが基本的に世界を席巻し、SMTは廃止され、この時期にGoogle Neural Machine Translation(GNMT)も開始されました。機械翻訳の全体的な効果により、特定のシナリオにおけるユーザーの基本的な期待を満たすことができ、関連製品の実装が可能になります。

AI技術を活用して異言語コミュニケーションの問題を解決する

上記の機械翻訳は、テキストからテキスト、中国語から日本語、中国語から英語への純粋な翻訳設定です。しかし、FractionalTower が目指しているのは、AI テクノロジーを使用して言語間のコミュニケーションの問題を解決することであり、翻訳はコミュニケーション プロセスの一部にすぎません。

張明氏は、第1世代のJuner翻訳機の応用シナリオは、誰かの声を相手が理解できる声に翻訳することだと紹介した。この一見単純なロジックの背後には、音声認識、機械翻訳、音声合成などの AI サブテクノロジーがあり、それぞれのテクノロジーを処理するには、異なるシリーズの特定の技術ポイントが必要です。

これらのAIサブテクノロジーのどれに現在欠点があるのか​​と尋ねられた張明氏は、技術的な観点から見ても、ユーザーの市場需要から見ても、決して十分ではないだろうと述べた。現時点では、すべての分野をカバーできる汎用プラットフォームは存在しません。そのため、Fenyinta は観光産業にのみ焦点を当てています。これらの AI 細分化技術を観光業界の特定のシナリオに適用して最適化し、滑らかな音声認識や音の飲み込みなどの問題を解決することによってのみ、翻訳エラーの段階的な増幅や認識エラーによる情報損失を回避し、翻訳機の全体的な理解率を向上させることができます。

ユーザーの視点から製品を改良する

インタビューの中で、張明氏は、Fenyintaは純粋に技術系の会社ではなく、製品やサービスを作る会社であると強調した。ユーザーにいかにしてより良いサービスとより良い体験を提供するかが、同社の核心である。

Juner 翻訳機は、もともと小型で持ち運びしやすいように画面なしで設計されました。その後、コミュニケーション不足の問題を解決するために画面デザインが追加されましたが、表示面ではやや不十分でした。現在使用している世代はタッチスクリーン LED LCD 画面であり、通信プロセスにおいて優れた補助的な役割を果たします。これらの製品の反復はすべて、ユーザーからの実際のフィードバックに基づいています。

次に、Fenyinta はオフラインの側面でさらに調査を行う予定です。旅行のシナリオでは、将来的には Wi-Fi や 5G がカバーしていない場所が多数あるためです。

実際のニーズに応じてバックエンドサーバーを調整および最適化する

ユーザーにサービスを提供する過程でアーキテクチャが調整されたかどうかを尋ねられたとき、張明氏は、初期段階ではバックエンドサーバーの展開を慎重に検討していなかったことを認めました。

観光業界では、販売されているすべての翻訳機を同時に使用することはできないため、ユーザーによる翻訳機の使用には通常、高い同時実行性の問題は発生しません。そのため、バックエンドサーバーの設計時にはあまり考慮せず、当時の通常の機能要件を満たすだけでした。

しかし、実際には、高同時実行の問題は発生しませんが、翻訳機のユーザーがさまざまな国や地域に分散しているため、従来のブロードバンドでは多少の困難が生じます。さまざまな国のユーザーのアクセス速度に影響が及ばないようにするために、展開に適したノードを探すことしかできません。

ここで注目すべきは、実際の展開プロセスでは、主要顧客の分布、使用状況の分布、そして日本、タイ、東南アジアなど、中国人が最も多く出現する国を組み合わせる必要があるということです。

インタビューの最後に、張明氏は、汾銀塔は今後も観光産業に深く根ざし、その中心は依然として、飲食、宿泊、交通、旅行、娯楽、ショッピングの6つの側面を中心に展開していくと語った。 Fenyinta はスタートアップ企業です。大企業のような豊富なリソースやブランドの影響力はないかもしれませんが、より集中しています。すべてのチームは観光分野に集中しています。彼らは真にユーザーのニーズと市場の需要から出発し、より良い製品とサービスを提供することに尽力しています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  ロボットがすべての仕事を奪ったら、人間はどうなるでしょうか?

>>:  機械学習がサイバー脅威に対する最善の武器である理由

ブログ    
ブログ    
ブログ    

推薦する

インダストリー4.0における人工知能

人工知能は、強化された接続性とインテリジェントな自動化を通じて、インダストリー 4.0 に破壊的な変...

人工知能技術がホームセキュリティ市場の急速な発展を促進

[[240109]]ホームセキュリティ市場はAIを活用してどのように安全を確保しているのか家庭のセキ...

IDC: 生成型AIへの世界的な支出は2027年に1,430億ドルに達する

IDC は最近、世界中の企業による生成 AI サービス、ソフトウェア、インフラストラクチャへの支出が...

Pudu Technology、新製品「Hulu」をリリース、4月19日より先行販売開始

人工知能やマルチセンサー情報融合などの技術の進化により、サービスロボットは急速に発展し、さまざまな分...

iQIYI機械学習プラットフォーム構築実践

機械学習プラットフォームを構築する以前、iQiyi にはすでに比較的成熟したディープラーニング プラ...

チャットボット: ビジネスを成長させる 8 つの方法

[51CTO.com クイック翻訳] 顧客がビジネスの運命を決定する中心であることは間違いありません...

ジェネレーティブ AI と自動化: 未来のデータ センターを加速

自動化と生成型人工知能 (GenAI) の時代において、「データセンター」の本当の意味を再考する時が...

古典的な構造から改良された方法まで、ニューラルネットワーク言語モデルのレビュー

自然言語処理 (NLP) システムのコアコンポーネントとして、言語モデルは単語表現と単語シーケンスの...

仕事でアルゴリズムが使われることはほとんどないので、なぜアルゴリズムを学ぶ必要があるのでしょうか?

共通のデータ構造とアルゴリズム最も基本的なデータ構造とアルゴリズムは次のとおりです。ソートアルゴリズ...

AIは病気の診断や新薬の設計に大きな可能性を秘めている

ヘルスケア業界は常にイノベーションの先駆者であり続けています。しかし、病気やウイルスが変異し続ける中...

ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

GPT-4にMinecraftの遊び方を教えた後、人間はゴリラにもこのゲームの遊び方を教えました。写...

...

コンピュータビジョンにおける物体検出のためのデータ前処理

この記事では、コンピューター ビジョンにおけるオブジェクト検出問題を解決するときに画像データに対して...