ThunderSoft の Sun Li: AI 対応産業の課題と解決策

ThunderSoft の Sun Li: AI 対応産業の課題と解決策

[51CTO.comからのオリジナル記事] 現在、人工知能はセキュリティ、金融などのサブセクターを強化し、重要な作業プロセスに参加し、さまざまな実用的なサービスを提供しています。組み込み分野の加速的な進化に伴い、人工知能は幅広い注目を集め、より多くのシナリオで使用されるようになりました。 ThunderSoft はインテリジェント端末オペレーティングシステムをベースとし、組み込み人工知能の主要技術に重点を置いています。最近、サンダーソフト、清華大学、クアルコムは共同で「ThunderWorld 2018 組み込み人工知能カンファレンス」を開催し、組み込み人工知能分野における技術の最先端、業界動向、注目の問題について議論しました。

[[253111]]

サンダーソフト副社長、サン・リー氏

メインフォーラムでは、サンダーソフト副社長の孫立氏が「インテリジェントビジョンの『スクワット』と『スタート』」と題した講演を行い、画像システムの構築における困難と対策、3D画像技術の普及、組み込みAIアルゴリズムアプリケーションの最適化、AIによる業界の強化などについて詳しく説明しました。

画像システム構築における課題と解決策

視覚技術は多くの分野にまたがる学際的な科目であり、画像キャプチャにはカメラを使用することが前提条件となります。キャプチャプロセスは複雑で、モジュールによる画像の取得と適用、メインチップの電力消費、パフォーマンス、システムの最適化、顔認識、美容、従来のステッチ、光学処理、ノイズ低減などの一連のアルゴリズムが含まれます。

取得の課題に加えて、優れた画像システムを構築するには、画像処理アルゴリズム (露出、ホワイト バランス、フォーカス、ワイド ダイナミック HDR、ノイズ低減など)、チップ アクセラレーション、画質調整なども必要です。ハードウェアの断片化により、複雑な画質調整プロセス (実験室と実際のシナリオの両方) が必要になり、消費電力、パフォーマンス、堅牢性も考慮する必要があります。

孫李氏は、画質調整が画像処理において最も重要な部分であると語った。最高の画質を実現するには、画像パイプライン全体、3A (フォーカス、露出、ホワイトバランス)、その他多くの詳細をデバッグする必要があります。

[[253112]]

IQ – 3段階の画質調整

画像品質のデバッグは 3 つの段階に分かれています。

1. ***ソフトウェア機能のチェック、IQ に影響する重大なバグがないことの確認、元の画像 (EXIF、AE パラメーター、キャリブレーション データ) の検証など、基本的なソフトウェアとドライバーが適切に準備されていることを確認します。

2. 関連する専門機器を設定し、LSC、AWB、AE、ガンマ、コントラスト強調、CCM、DPC、ノイズフィルタリング、エッジ強調、その他のパラメータ検出および処理などのラボパラメータ調整を実行します。

3. 実際のシーンでパラメータを調整し、人物、ペット、風景、ポートレート、屋外、低照度、オフィス、自宅、フラッシュ、逆光、映画などの参照機器と比較して撮影し、調整します。

ハードウェアアクセラレーションを有効に活用して、電力消費とパフォーマンスの問題を解決します

ハードウェア アクセラレーションは、画像コンピューティングを向上させる上で重要な要素です。GPU や CPU などの組み込みハードウェアを使用するには、多面的な機能が必要です。組み込みハードウェアはアルゴリズムの高速化に非常に役立ちますが、電力消費の問題もあります。車内の複数のカメラをつなぎ合わせるなどのシナリオでは、GPU を選択することをお勧めします。近年、車載ADASチップの高画質化の要求は、外付けISPから内蔵ISP、ベイヤーセンサーへと変化し、現在は外付けISPを使用するのが主流となっている。今後、自動車分野もフィーチャーフォンからスマートフォンへの携帯電話と同様の進化を遂げていくだろう。主な推進力としては、熱問題などの BOM コスト削減や、サラウンド ビュー アプリケーションの接合問題などが挙げられます。 ASIL 互換性、長期投資、厳格な路上テストなどの要件は、自動車特有の高い障壁です。

3D画像技術普及の課題と解決策

3D画像技術の活用は、画像ビジョンのもう一つのトレンドです。普及の過程では、以下の大きな課題を克服する必要があります。

  • 規模の問題により、BOM コストは一般の人々が購入できるレベルまではまだ削減されていません。
  • さまざまな光学設計、断片化(ToF、構造化光、双眼鏡、アクティブ双眼鏡など)。
  • 組み込み SoC (PC 支援から組み込み ARM ベースまで) の深度マップの計算能力。
  • 複数の使用セットの完全なモデリング問題。
  • RGBD、3D ベースの人工知能における学術的進歩。

孫立氏は、サンダーソフトはワイドダイナミックレンジ/HDR、ノイズ低減、AI技術の導入などにより、従来の画質問題を解決することに注力しており、長年にわたる継続的な投資と研究開発により、映像技術分野で豊富な経験を蓄積してきたと述べた。

組み込みAIアルゴリズムアプリケーションを最適化するための難しさと解決策

AIは現在、組み込み/エッジAIは未来であり、組み込み/エッジインテリジェントビジョンデバイスの数も急速に増加しています。このような背景から、ThunderSoft は Qualcomm Snapdragon 845 プラットフォームをベースにした人工知能エンジン、TurboX AI Kit を発売しました。 TurboX AI Kit には、高性能な組み込みデバイス/エッジ AI 開発プラットフォーム、豊富な組み込み AI 開発、分析、最適化、デバッグ ツール、デバイス AI の実装と普及の加速、エコシステムの構築支援という 3 つの主な機能があります。

現在、組み込み AI アルゴリズムの適用を制限している主な問題には、限られたコンピューティング リソース、多様なアプリケーション シナリオと要件、未熟なエコシステム、断片化された端末処理プラットフォーム、パフォーマンス (精度と速度) のバランス/トレードオフ、電力消費とコストなどがあります。これらの問題に対処するには、ハードウェアとソフトウェアの深い統合や体系的な設計などの側面を掘り下げる必要があります。

AIを活用した産業の課題と解決策

AI が研究室から出て産業に力を与えるようになると、あらゆる面で課題に直面することになります。顧客の観点から見ると、彼らが期待するのは、純粋なアルゴリズムではなく、総合的なソリューション(データの取得、プライバシーの問題、トレーニング、生産管理システム、プライベート クラウドの展開、フロントエンドとバックエンドなど)です。

お客様がAI技術の予算を測る際、ハイエンド技術としてのAIではなく、生産性向上(ユーザーエクスペリエンスの向上、売上コンバージョン率など)、業務効率の最適化、業績に応じて維持できる予算の余裕度を基準としており、これは現状の高額なAI投資コスト(人員、サーバーなど)とは矛盾しています。

業界の顧客のワークフローと部門機能が高度な生産性を中心に展開および最適化されていない場合、顧客は、自己トレーニング、アップグレード、および一度で展開できる人工知能プラットフォームの構築に一度の投資を行うことを期待しています。現在必要なカスタマイズされたアルゴリズムと比較して、将来的には、解決する必要がある現場の問題を中心に、アルゴリズムに少人数の人員が対応するプロセスを確立する必要があります。

では、AI を活用した業界が直面するこれらの困難にどう対処すればよいのでしょうか? AI にはアルゴリズムだけでなく、プラットフォームとエンジンが必要です。たとえば、下の図は、ThunderSoft のインテリジェントな視覚的欠陥検出ソリューションのレンダリングです。

[[253113]]

ThunderSoftのインテリジェントな視覚的欠陥検出ソリューションのレンダリング

具体的な操作方法は、まず従来のCV技術によって複雑な背景を除去し、欠陥が画像に現れるようにしてから、実際の分類を実行します。

今後、AIを応用する企業が増え、AIの人気は高まり続けるでしょう。市場が徐々に拡大するにつれて、AIの応用範囲は特定の分野から人々の日常生活へと徐々に広がっていくでしょう。インテリジェント化のトレンドが続くにつれて、インテリジェントビジョンの応用はさらに拡大、深化して、徐々により多くの新興分野に移行します。インテリジェントロボット、自動運転、顔認識、セキュリティ、医療などの分野での応用はますます増えていきます。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  2018 年の AI テクノロジーのブレークスルーの完全なコレクションをご紹介します。

>>:  人工知能はターミネーターとなるのか?ぜひ見に来てください!

ブログ    

推薦する

Keras 対 PyTorch: どちらが「ナンバーワン」のディープラーニング フレームワークでしょうか?

「最初のディープラーニングフレームワークをどのように選択するか」は、初心者にとって常に頭痛の種でし...

...

農業生産の効率性を向上させるために、知能ロボットが力を発揮している

現在、知能ロボットは急速な発展期に入り、生活のあらゆる分野で非常に重要な役割を果たし、人類にとっての...

...

大雨後のドローンと衛星ネットワーク

7月21日、鄭州市の西40キロにある米河鎮は停電、インターネット、道路が遮断され、完全な情報孤島とな...

生成AI投資分析:テック大手はベンチャーキャピタルよりも積極的であり、コンピューティングパワーの支出は起業のハードルを押し上げる

ジェネレーティブ AI スタートアップの需要は高く、テクノロジー大手からの CVC および VC 資...

大規模なマルチモーダルモデルは、学習しすぎると能力が低下しますか?新しい研究:教育省+の一般専門家が紛争を解決

微調整により、一般的な大規模モデルを特定の業界のアプリケーションにより適したものにすることができます...

人々は長い間、運転免許試験に悩まされてきました。自動運転は、その苦しみを緩和できるのでしょうか?

運転するには運転免許証を持っていることが前提条件であり、運転免許証を取得するには運転免許試験を受ける...

...

AI技術により人類の寿命が延びる

現在、50歳以上の人口は世界で最も急速に増加している年齢層となっており、当然ながら世界経済と医療制度...

PaddleOCRのスーパーパワーを解き放つ

光学文字認識 (OCR) は、機械が画像やスキャンされた文書からテキストを認識して抽出できるようにす...

より安全な街路のためのリアルタイムのインテリジェントビデオ分析

[[401969]]英国政府は最近、夜間経済が回復する中で安全が最優先事項であることを国民に再確認さ...

効率的な多次元空間ポイントインデックスアルゴリズム - Geohash と Google S2

[[201793]]導入毎晩残業して家に帰るときは、Didiやシェア自転車を使うこともあります。ア...

AIの4つのタイプについてお話しましょう

人工知能が流行するにつれ、人々はそれがどのように機能し、何ができるのかについて多くの疑問を抱いていま...