2019年に主流となった10のAIテクノロジー

2019年に主流となった10のAIテクノロジー

1956年にコンピューターの専門家ジョン・マッカーシーが「人工知能」という言葉を作り出して以来、わずか数十年の間に驚くべき進歩が遂げられ、紙の設計図から応用段階へと急速に移行しました。 2019 年に人工知能を支配するテクノロジーはどれでしょうか?今日はそれを振り返ってみましょう。

自然言語処理

完全な自然言語処理システムは、音声認識、意味認識、音声合成の 3 つの部分で構成されます。過去 20 年間で、自然言語処理技術は大きな進歩を遂げ、研究室から市場へと移行し始めました。今後10年間で、音声認識、意味認識、音声合成技術が、産業、家電、通信、自動車エレクトロニクス、医療、ホームサービス、民生用電子機器などのさまざまな分野に導入されると予想されています。

私の国は音声認識技術において明らかな優位性を持っており、iFlytekやBaiduに代表される優れたAI企業を生み出してきました。過去2年間、iFLYTEKはTo Bトラックでの広範な展開に加えて、iFLYTEK翻訳機、iFLYTEKボイスレコーダー、iFLYTEKスマートオフィスブック、iFLYTEKスーパーブレイン学習機、iFLYTEKスマートマウス、Alphaシリーズスマートロボットなど、Cエンドをターゲットとした一連の人工知能製品も発売し、日常生活、オフィス、学習のあらゆる側面をカバーしています。

2019年の618とダブル11ショッピングフェスティバルでは、iFLYTEK Translatorは優れた性能、最大98%の音声認識精度、便利な操作性により、競合他社を上回り、それぞれTmallとJD.comでの累計売上高と売上高でトップの座を獲得しました。これは、同社が自然言語処理とアプリケーションにおいて良い着地点を見つけたことを意味します。

コンピュータビジョン

実際に解決すべき問題に応じて、コンピューター ビジョン テクノロジは、顔認識、画像検出、画像検索、ターゲット追跡、スタイル転送など、いくつかの主要なセクションに分けられます。中でも、顔認識や画像分類などのコンピュータービジョン技術は、すでに人間の視覚よりも正確で高速です。病院では、早期食道がんの検出率は一般的に10%未満です。テンセント・ミーイングは、上部消化管内視鏡画像をスキャンすることで食道がんを検査することができ、4秒未満で最大90%の検出率を実現します。 SenseTime は、同社のコンピューター ビジョン技術を使用することで、ビデオ コンテンツのレビューにかかる人手を 99% 削減できると主張しています。

コンピューター ビジョンは、認識、検出、クラスタリングなどの問題を解決する点ですでに人間を上回っていますが、その開発には依然として課題が残っています。

まず、人工知能モデルのトレーニングに利用できる大規模なデータセットが不足しています。第二に、技術から製品、大規模なアプリケーションに至るまでのエンジニアリング経験が不足しています。コンピューター ビジョン テクノロジの適用は、もはや単一のソフトウェア アプリケーションではありません。新しいインフラストラクチャ、新しいデータ分析プロセス、カメラなどのスマート ハードウェアのインストールが必要になります。各リンクは認識効果に影響を与える可能性があります。この技術を研究室から産業応用に拡大するプロセス自体が大きな課題です。

ナレッジグラフ

ナレッジグラフは、2012 年に Google によって最初に提案された新しい概念です。学術的な観点から、ナレッジ グラフを次のように定義できます。「ナレッジ グラフは、本質的にはセマンティック ネットワークの知識ベースです。」しかし、これは少し抽象的なので、別の観点から、実際の応用の観点から、ナレッジ グラフを単純にマルチリレーショナル グラフとして理解することができます。これまでのインテリジェント分析が各個人に焦点を当てていたのに対し、ナレッジ グラフはこれらの個人間の「関係」に焦点を当てています。ナレッジグラフは、「グラフ」という形式を使用して、エンティティ間の関係を最も効果的かつ直感的に表現します。これは、現実世界に最も近く、人間の思考パターンに適合したデータ編成構造です。

従来のインテリジェント分析と比較して、ナレッジグラフはグラフベースのデータ構造です。つまり、ナレッジグラフは大量の情報から多次元の特徴情報を抽出し、これらの特徴情報資料に基づいて、インテリジェントな推論を通じてデータから視覚イメージまでの深い処理を実現し、ユーザーに直感的かつ簡単に提示し、ユーザーと対話できるようにします。

現在、ナレッジグラフは主に検索、推奨、質疑応答などのインターネット指向のビジネスシナリオで使用されており、商用検索エンジン企業を筆頭とするインターネット企業が多額の投資を行っている人工知能技術の1つとなっています。同時に、金融、医療、電子商取引、公共安全の分野でも広く検討され始めています。

機械学習

[[313565]]

機械学習とは、明示的なプログラム指示に従わずにデータのみを通じてパフォーマンスを向上させるコンピュータシステムの能力を指します。機械学習の本質は、データ内のパターンを自動的に発見することであり、発見されたパターンを使用して予測を行うことができます。たとえば、機械学習システムに、取引時間、販売店、場所、価格、取引が正当かどうかなどのクレジットカード取引情報のデータベースを与えると、システムはクレジットカード詐欺を予測するために使用できるパターンを学習します。処理されるトランザクションデータが増えるほど、予測の精度が高まります。

機械学習の応用範囲は非常に広く、大量のデータを生成するほぼすべてのアクティビティのパフォーマンスを向上させる可能性があります。これらの活動には、不正行為の検出に加えて、売上予測、在庫管理、石油・ガス探査、公衆衛生などが含まれます。機械学習は、視覚モデルを継続的にトレーニングして改善することで、大量の画像内のオブジェクトを認識する能力を向上させることができるコンピューター ビジョンなどの他の認知技術でも重要な役割を果たします。

ロボット

[[313566]]

マシンビジョンや自動計画などの認知技術を、極めて小型ながら高性能なセンサー、アクチュエーター、巧みに設計されたハードウェアに統合することで、人間と一緒に作業し、さまざまな未知の環境でさまざまなタスクを柔軟に処理できる新世代のロボットが誕生しました。たとえば、工場の現場で人間と作業を分担できるドローンや「コボット」などです。

バーチャルアシスタント

[[313567]]

仮想アシスタントは、人間と対話できるコンピュータエージェントまたはプログラムです。Apple 製品の Siri、Microsoft Cortana、Google Assistant、Amazon Alexa などのチャットボットが最も有名です。仮想アシスタントは、顧客サービスやサポートによく使用され、スマートホームの管理者として機能することもできます。

2019年に、ある研究機関が上記の製品を一緒にテストしたところ、精度ではGoogleアシスタントが93%、Siriが83%、Alexaが80%で勝利しました。

Google アシスタントは、商業カテゴリのクエリに回答する際に最も優れたパフォーマンスを発揮し、製品やサービスの情報、特定のアイテムの購入場所に関する質問の 92% に正しく回答しました。これに対し、Siri は 68%、Alexa は 71% でした。

ディープラーニングプラットフォーム

[[313568]]

複数の抽象化レイヤーを備えた人工ニューラル ネットワークを使用する特殊なタイプの機械学習。現在、非常に大規模なデータ セットをサポートするパターン認識および分類アプリケーションで主に使用されています。代表的なメーカーとしては、Deep Instinct、Ersatz Labs、Fluid AI、MathWorks、Peltarion、Saffron Technology、Sentient Technologies などが挙げられます。百度、iFLYTEK、テンセントなどの国内企業も、独自の技術的特徴を備えたディープラーニング・プラットフォームを立ち上げている。

意思決定管理

[[313569]]

エンジンはルールとロジックを AI システムに埋め込み、初期セットアップ/トレーニングおよび継続的なメンテナンスとチューニングに使用されます。これは、自動化された意思決定を支援または実行するために、幅広いエンタープライズ アプリケーションで使用される成熟したテクノロジです。代表的なベンダーとしては、Advanced Systems Concepts、Informatica、Maana、Pegasystems、UiPat などがあります。

生体認証

画像やタッチの認識、音声、ボディランゲージなど、人間と機械のより自然なやり取りをサポートできます。現在は主に市場調査に使われています。代表的なメーカーとしては、3VR、Affectiva、Agnitio、FaceFirst、Sensory、Synqera、Tahzoo などがあります。

ロボティックプロセスオートメーション

スクリプトやその他の方法を使用して人間の操作を自動化し、効率的なビジネス プロセスをサポートします。現在、タスクまたはプロセスが人間にとって実行するにはコストがかかりすぎるか非効率的な場合に使用されます。代表的なベンダーには、Advanced Systems Concepts、Automation Anywhere、Blue Prism、UiPath、WorkFusion などがあります。

<<:  2020 年のソフトウェア開発における 6 つの画期的なトレンドは何ですか?

>>:  プライバシー保護を再構築するには、AIモデルに「あなたを忘れさせる」ことを早く行う必要がある

ブログ    
ブログ    
ブログ    

推薦する

人工知能を始めるときに尋ねるべき10の質問

人工知能 (AI) と機械学習 (ML) のテクノロジーは、世界中のほぼすべての業界に革命をもたらし...

拡散+超解像モデルの強力な組み合わせ、Googleの画像ジェネレーターImagenの背後にある技術

近年、マルチモーダル学習は、特にテキストと画像の合成や画像とテキストの対照学習の分野で大きな注目を集...

Llama-2+Mistral+MPT=? 複数の異種大規模モデルの融合が驚くべき結果を示す

LLaMA や Mistral などの大規模言語モデルの成功により、大手企業やスタートアップ企業は独...

...

5月にGitHubで最も人気のある機械学習プロジェクトはこちら

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

TENSORFLOW を使用してリカレント ニューラル ネットワーク言語モデルをトレーニングする

[[201448]]私は、TensorFlow リカレント ニューラル ネットワークのチュートリアル...

ChatGPTが使用する機械学習技術

著者 |ブライト・リャオ「プログラマーから見たChatGPT」の記事では、開発者のChatGPTに対...

賈強淮: Ant大規模知識グラフの構築とその応用

1. アトラスの概要まず、ナレッジグラフの基本的な概念をいくつか紹介します。 1. ナレッジグラフと...

GPT-5 が誕生しました。50,000 個の H100 が必要です。世界のH100総需要は43万個、Nvidia GPUは品薄の嵐に

「誰がどれだけの H100 を受け取るのか、そしていつ H100 を受け取るのかは、シリコンバレーで...

公共の場での顔認識は全面的に禁止される可能性があります。ちょうど今、欧州議会はAI規制を強化することを決定した

[[427521]]昨日、欧州議会はAI生体認証技術に基づく大規模な監視の全面禁止を求める決議を可決...

...

大規模モデルを低コストで便利に使用するには? Amazon Web Services が生成型 AI を実現する方法

現在、私たちは「百機種戦争」の時代に突入しており、テクノロジー企業は人工知能分野で主導権を握ろうと、...

ChatGPTがついにオンラインになり、回答のソースを提供できるようになりました

たった今、OpenAI が重要なニュースを発表しました。ChatGPT が正式にインターネットに接続...

2022年のディープラーニングの5つのトレンド

ディープラーニングは、データから段階的に優れた高度な洞察を抽出するために複数の処理層を活用する人工ニ...

...