WOT2018 アルゴリズム モデル フォーラム: データが氾濫する中、アルゴリズムを使用してボトルネックを打破する方法

WOT2018 アルゴリズム モデル フォーラム: データが氾濫する中、アルゴリズムを使用してボトルネックを打破する方法

[51CTO.comより引用] 2018年11月30日から12月1日まで、51CTO主催のWOT2018グローバル人工知能技術サミットが北京JWマリオットホテルで開催されました。このサミットは、AI技術が業界のアップグレードを促進するという観点から始まり、技術トレンドに遅れずについていき、現在のホットな話題に焦点を当てています。AIプラットフォームツール、アルゴリズムモデル、音声と視覚などの技術トピックをカバーし、AIの最先端理論と最先端技術の激しい衝突の知識の饗宴をもたらします。

ご存知のとおり、人工知能はコンピューティング、アルゴリズム、データという 3 つの主要要素から切り離すことはできません。データの爆発的な増加とアルゴリズムの飛躍的進歩により、人工知能は自然言語処理、画像認識、人間とコンピュータの相互作用などの分野で大きな進歩を遂げ、ほぼすべての機械支援機能を可能にしました。たとえば、スマートレコメンデーションやスマートウェアラブルなどのアプリケーションが成功裏に実装され、自動運転車や予防医療が現実のものになりつつあります。

では、企業は人工知能の応用を加速するために、どのように高度なアルゴリズムを使用すべきでしょうか。今回のWOTサミットの「アルゴリズムモデル」フォーラムでは、Triangle Technologyの副社長であるChen Huarong氏、Jietong HuashengのMTおよびNLPアルゴリズム責任者であるXing Qizhou氏、Weike Dataのアルゴリズム責任者であるLi Xiang氏が、意味理解に基づくインテリジェントなインタラクション、単なる翻訳以上のもの、新しい小売シナリオにおけるAIの実装という3つの異なるトピックについて検討し、聴衆にアルゴリズムモデルの饗宴をもたらしました。

トライアングル・ビースト・テクノロジー副社長 陳華栄氏:意味理解に基づくインテリジェントなインタラクション

トライアングルテクノロジー副社長の陳華栄氏は、主に自然言語処理(NLP)技術と意味理解に基づく対話システムおよびインテリジェントインタラクションシステムの開発を紹介し、意味理解の現場実装と実践経験に焦点を当てました。

知覚知能は、見ることと聞くことの問題を解決し、外界からの情報を受け取ることに重点を置きます。知覚知能はまだ、見たり聞いたりしたものを理解することができず、もちろん、決定を下すこともできません。陳華栄氏は、システムが理解し考えるためには、システムが言語を理解して習得し、習得した知識を使って推論できるように、認知知能を備えていなければならないと述べた。現時点では、認知知能はまだ比較的初期段階にあり、推論を行うことはできません。つまり、人工知能にはまだまだ長い道のりが残っているのです。

元の自然言語では、文の構造を分析して意味を理解する従来の NLP アルゴリズムが使用されていました。言語は常に変化し、非常に複雑な性質を持っているため、NLP アルゴリズムに基づいてより優れたランディング製品を構築することは不可能でした。ディープラーニングの登場以降、音声認識や画像認識への応用が成功し、徐々に自然言語処理にも応用されてきました。陳華容氏は、局所的および全体的な特徴を捉えるのが得意なCNNを例に挙げ、ディープラーニングの利点を詳しく紹介しました。現在、業界ではディープラーニングをベースにした感情認識、テキスト分類、機械翻訳、読解、テキスト要約などがホットな話題となっていると語った。

続く講演では、陳華栄氏がスマートフォン、スマートIoT、スマートカスタマーサービスという3つの異なるシナリオの応用から始め、Triangle Beastの技術から商業応用までのプロセスを詳細に紹介しました。 Triangleの商用化には、オープンドメインチャットエンジンや汎用対話エンジンなど、さまざまな対話エンジンをスマートテレビ、スマートスピーカー、携帯電話、子供用腕時計などの端末デバイスに適用するだけでなく、感情分析、意味エラー修正、顧客サービス品質検査、コンテンツフィルタリングなどの補助機能モジュールも提供し、ユーザーにコンテンツのあいまいな意味を理解するための強力なアルゴリズムを提供すると報告されています。

Jietong Huasheng の MT および NLP アルゴリズムの責任者、Xing Qizhou 氏: 翻訳以上のもの

Jietong Huasheng の MT および NLP アルゴリズムの責任者である Xing Qizhou 氏は、主にニューラル機械翻訳関連の技術とその応用について講演しました。機械翻訳、Lingyun 機械翻訳フレームワーク、Transformer モデル、翻訳用に設計されたその他のアルゴリズム、業界における翻訳製品の現状、機械翻訳の課題と将来の開発動向という 6 つの主要なトピックについて詳しく説明しました。

邢其洲氏は、人工知能、ディープラーニング、ニューラルネットワークの発展により、ニューラル機械翻訳は新たな時代に入り、特にグーグルが昨年「必要なのは注意だけ」という論文を発表して以来、機械翻訳の分野では大きな進歩が遂げられていると述べた。数年前に人気があった統計的機械翻訳 SMT から、ここ 2 年間で人気が高まっているニューラル機械翻訳 NMT まで、これらはすべて機械翻訳フレームワークです。現在、凌雲機械翻訳の枠組みは、テキストのクリーニング、大文字と小文字の変換、単語の分割などのテキスト前処理を通じて、さまざまな複雑な記号を含むノイズの多い不規則なテキストを機械処理に適した形式に変換することです。次に、固有表現認識を通じて、その文が翻訳モデルに入力され、最終的にターゲット言語の翻訳文が出力されます。 ***、再度固有表現認識を行い、テキスト後処理を経て逆復元を行い、*** ユーザーが実際に入力した形式を復元し、最後に翻訳結果を全員に提示します。

次に、邢其州氏は機械翻訳の各ステップの技術的な詳細、Jetcom Huasheng が使用した技術、遭遇した困難、経験の概要について詳しく説明しました。同氏は、機械翻訳が成熟した製品になるためには、翻訳能力そのものがどれだけ優れているかではなく、ASR技術、TTS音声合成技術、OCR技術など、さまざまな人工知能技術を組み合わせることが重要だと述べた。したがって、複数のテクノロジーの統合は、翻訳の将来の発展の傾向です。

邢其洲氏は、マルチモーダル翻訳と音声認識、多言語翻訳、マルチテキスト翻訳、段落レベル翻訳、オフライン翻訳、プライバシーに基づく翻訳はすべて翻訳の将来の発展方向であるが、いずれもコーパスの欠落という問題に直面していると強調した。現在、コーパスの強化は転移学習、教師なしまたは半教師ありの方法などを通じて行うことができますが、既存の方法ではまだ満足できるレベルに到達できません。これは将来突破する必要がある困難な問題です。

Weike Data Algorithm の責任者 Li Xiang: 新しい小売シナリオにおける AI 実装の探求

Weike Dataのアルゴリズム責任者であるLi Xiang氏は、新しい小売シナリオにおけるAI実装の探求に焦点を当てた講演を行いました。小売シナリオにはすでに多くの次元と数値がありますが、Weike Dataの最終的な目標は、眠っているデータを目覚めさせ、データを最大限に活用し、小売業者がデータを通じて顧客を管理できるようにすることだと彼は考えています。

新しい小売業についての認識について、李翔氏は、それは実は小売業をより良くするための新しい方法であると考えています。同氏は、ニューリテールをブラックボックスに例えると、その入力はデータ、出力はサービスであると述べた。その目的は、従来の小売業界が顧客に、より良い、より質の高いサービスを提供できるようにすることだ。この目標をさらに細分化すると、第一に小売業者が顧客をより深く理解できるようにすること、第二に顧客にパーソナライズされカスタマイズされた高品質のサービスを提供することです。

続く講演では、李翔氏がデータとサービスに焦点を当てて、Weike Dataの実践と経験を聴衆に詳しく紹介し、顔認識や物体認識などのデータモデルなど、その中核となるアルゴリズムの内容を共有しました。李翔氏は、新しい小売業界ではAIの応用シナリオは多岐にわたるが、まず解決すべきは「顧客は誰か」という問題だと述べた。顧客が誰であるかを知ることによってのみ、的を絞った解決策を作ることができる。

顧客が誰なのかを把握したら、次のステップはソリューションを選択することです。成熟したサードパーティ企業のソリューションを選択するか、独自のソリューションを設計するか。まず、コストを考慮し、次に、1 つのモデルだけを選択しないでください。 Weike Data は、ビデオ ストリームから顔を検出し、識別と分析のために顔を抽出する際に困難に遭遇したと報告されています。彼らは 3 つの解決策を試しました。1 つ目は通常のカメラ ソリューションで、その最大の利点は低コストでした。 2 つ目は、携帯電話のカメラ ソリューションを使用することですが、これはまだコストが非常に低いです。 3つ目は、プロ仕様のカメラソリューションを使用することです。コストは高くなりますが、得られる効果も優れています。そのため、Weike Data は最終的に 3 番目のオプションを選択しました。

Li Xiang氏は、カメラ側でビデオストリームを分析し、顔を検出し、顔をキャプチャし、その後MTCNNを介して顔のより深い抽出を実行することで、非常に低い計算コストで顔認識と詳細な分析を実現できると述べました。

上記の内容は、WOT2018グローバル人工知能技術サミットの「アルゴリズムモデル」サブフォーラムの講演内容に基づいて51CTO記者がまとめたものです。WOTに関するその他の内容については、.comに注目してください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  強力な暗号化アルゴリズムによる SQL インジェクション事例

>>:  AI開発は断片化に直面しており、ディープラーニングフレームワークの統一が必要

ブログ    

推薦する

...

スマートホームテクノロジーが不動産業界に及ぼす影響

最近では、最新のスマートホームテクノロジーがプリインストールされている住宅を目にすることがますます一...

人工知能の5大セキュリティ問題への対策

Google、スタンフォード大学、カリフォルニア大学バークレー校、OpenAI の研究者が論文「AI...

...

「緊急天使」がロボットを救出するために前進し、事態を収拾した

科学技術の進歩と社会の発展に伴い、ロボット産業は繁栄の時代を迎えています。ロボット工学は、コンピュー...

2020年のスマートセキュリティ技術の開発動向

インテリジェントセキュリティ技術とは、画像の取得、伝送、保存、ビデオ分析、ビッグデータ処理のほか、マ...

李偉博士がブロックチェーンについてわかりやすく語る:技術原理、実用的応用、AIとの統合

[51CTO.comからの原文] 人工知能、モノのインターネット、ブロックチェーンなどの最先端技術が...

機械学習の概要

概要:この記事を読むと、次のことができるようになります。さまざまな種類の機械学習の問題を識別します。...

中国ダイビングチームの勝利には人工知能が貢献した

ネットユーザーたちはこのオリンピックについて不満を述べている。たとえ境界線を越えたとしても、高得点を...

人工知能のトレンドが電子商取引業界のビジネスを変える

電子商取引企業は常に技術革新の最前線に立ってきました。彼らでさえ、ビッグデータの突然の驚くべき破壊力...

nn.Module クラスに基づく線形回帰モデルの実装

[[411355]]前回はシーケンシャルモデルを紹介しましたが、ほとんどの場合、ニューラルネットワー...

人工知能によりデータの痕跡を監視できるようになりました。このとき、ユーザーのプライバシーとセキュリティをどのように維持できるのでしょうか?

近年、ソーシャル ネットワーキング プラットフォームのユーザー数は飛躍的に増加しています。これらのプ...

スタンフォードのAIエージェント研究が熱い! 「好奇心リプレイ」アルゴリズムにより、AIは自分自身を振り返り、積極的に新しい世界を探索することができる。

一夜にして、AI エージェントが突然インターネット全体を支配しました。業界のリーダーたちは、その焦点...