デジタルツインがディープラーニングのデータ格差を埋める

デジタルツインがディープラーニングのデータ格差を埋める

企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する必要があり、デジタル ツインが成功の鍵となります。

今日の世界では、データが王様です。 Amazon、Apple、Facebook、Google、Walmart、Netflix など、世界で最も価値のある企業には共通点が 1 つあります。それは、データが最も価値のある資産であるということです。これらの企業はすべて、ディープラーニング (DL) を使用してこのデータを活用します。

[[329342]]

どのようなビジネスに携わっていても、データは最も貴重な資産です。独自の DL を実行してこれらの資産を保護する必要があります。ディープラーニングを成功させるための最も重要な要素は、適切な種類のデータが十分にあることです。ここでデジタルツインが登場します。

デジタル ツインは、実際の物理プロセス、システム、またはデバイスのデジタル レプリカです。簡単に言えば、デジタルツインは現実世界を仮想世界に再構築したものです。要するに、デジタル ツインは、特に危険、高価、または時間のかかるプロセスを伴うディープラーニング プロジェクトの成功の鍵となる可能性があります。

ディープラーニングの将来性

現在までに、半導体製造業を含むほぼすべての業界が、DL が戦略的優位性を生み出す可能性を認識しています。ディープラーニングはニューラル ネットワークを使用して高度なパターン マッチングを実行します。ディープラーニングは、顔認識や音声認識、医療画像分析、バイオインフォマティクス、材料検査など、さまざまな分野に応用されています。

半導体製造においては、製品の欠陥分類などの分野にディープラーニングが応用されています。大手企業のほとんどは、この有望な新しい競争環境で優位に立つために奮闘しています。

企業がディープラーニングとそのメリットを模索し始めると、多くの企業が次の 2 つの事実に気づきます。1 つ目は、ディープラーニングのプロトタイプを簡単に立ち上げられること。2 つ目は、「優れたプロトタイプ」から「製品品質」の結果を得るのは難しいことです。

現在、低コストから無料のディープラーニング プラットフォーム、ツール、キットが利用できるようになったため、ディープラーニング アプリケーションの初期開発は、通常のアプリケーション開発に比べて非常に迅速かつ比較的容易になりました。ただし、ディープラーニング アプリケーションの製品化は、従来のアプリケーションの製品化よりも簡単ではなく、より困難な場合もあります。

その理由はデータにあります。実稼働品質の結果をもたらさないディープラーニング アプリケーションと、特定の問題を解決する方法を完全に変えるディープラーニング アプリケーションの違いは、通常、十分なデータと、適切な種類のデータが十分にあるかどうかです。

ディープラーニングにおけるデータギャップ

ディープラーニングはパターンマッチングに基づいており、マッチングするターゲットを表すデータをニューラルネットワークに提示することで「プログラム」されます。大量のデータにより、ネットワークがオブジェクトを認識するように(そしてそれがオブジェクトではない場合を認識するように)トレーニングされます。

ディープラーニングには、プロトタイプを迅速に作成し、概念実証を提供する強力な機能があります。しかし、ディープラーニングの本当の利点は開発のスピードではありません。これは、データの力を解き放ち、他の方法ではできないことを可能にする事実です。

あらゆるディープラーニング アプリケーションの成功は、トレーニングに使用されるデータセットの深さと幅によって決まります。トレーニング データセットが小さすぎたり、狭すぎたり、または「標準的」すぎる場合、ディープラーニング手法は標準的な手法よりも優れた結果を出すことはできません。実際、もっと悪い結果になるかもしれません。ネットワークが目の前の問題の正しい性質を把握できるように、すべての重要な状態やデモンストレーションを表すのに十分なデータでネットワークをトレーニングすることが重要です。

自動運転や半導体製造などの一部の分野で難しいのは、最も深刻な異常のいくつかが(幸いなことに)めったに発生しないことです。しかし、ディープラーニング アプリケーションで、車の前を走る子供 (または致命的なフォトマスク エラー) を認識するには、このようなケースを多数使用してネットワークをトレーニングする必要がありますが、現実には、現実世界にはこのようなデータはそれほど多くありません。デジタル ツインは、ネットワークがこれらの状態を認識できるように適切にトレーニングするのに十分な異常データを作成する唯一の方法です。


上図は標準偏差をつけた正規分布曲線です。半導体製造では、運転と同様に、「異常」なイベントは非常にまれですが、最悪のケースではチップが故障する可能性があるため、ニューラル ネットワークはできるだけ多くの異常なイベントについてトレーニングする必要があります。全体的な平均効果は十分ではありません。

デジタルツインがギャップを埋める

実際のプロセス、システム、機器を仮想的に表現したデジタル ツインは、ディープラーニング ネットワークを正常にトレーニングするために適切な量と種類のデータを作成するための重要なツールです。

デジタル ツインを使用して DL トレーニング データを作成する理由はいくつかあります。

  • 取得するデータは顧客のものである可能性があるため、ディープラーニングのトレーニングに使用することはできません。
  • ディープラーニングに必要なデータを作成するリソースを、クライアントのプロジェクトに完全に割り当てなければならない場合があります。
  • ディープラーニング アプリケーションを開発しましたが、ニューラル ネットワークを必要な精度に調整してトレーニングするには特定のデータが必要であることがわかりましたが、ファブ リソースを使用してデータを作成するコストは法外に高額です。
  • ディープラーニング ネットワークを適切にトレーニングするのに十分な異常データを見つけることができないことはご存じでしょう。最後の状況はほぼ普遍的です。

理想的には、データを完全に制御するには、3 つのデジタル ツインが必要です。つまり、独自のプロセスをシミュレートするための入力データを提供するために生産パイプラインで先行するプロセス/機器のデジタル ツイン、独自のプロセス/機器のデジタル ツイン、および検証のために出力を下流に送ることができるように生産パイプラインでプロセス/機器に続くデジタル ツインです。

2019 SPIE レチクル テクノロジー カンファレンスで、D2S はディープラーニング技術を使用して作成された 2 つのデジタル ツイン、走査型電子顕微鏡 (SEM) デジタル ツインと間接リソグラフィー技術 (ILT) デジタル ツインを紹介する論文を発表しました (図 2 は SEM デジタル ツインの出力を示しています)。デジタル ツインの出力は一般に製造業には不十分ですが、これらのデジタル ツインはディープラーニング ニューラル ネットワークのトレーニングと検証に使用されてきました。重要なのは、これらのデジタル ツインはシミュレーションではなくディープラーニングによって生成されることです。

これは、ディープラーニングを他の DL に必要なデータを生成するツールとして使用する例であり、ディープラーニングへの投資による複利的なメリットを示しています。

上図は、SEM デジタルツインによって生成されたマスク SEM 画像と実際の SEM 画像の 2 つの例を示しています。同じ位置の水平カットラインに沿った画像強度も表示されます。画像が非常に似ているだけでなく、エッジでの信号応答も同様です。

ディープラーニングの成功へのロードマップ

これらすべては大変な作業のように思えます。コンサルティング会社にディープラーニングを依頼してみませんか? 忘れないでください、データが王様です! データを保護し、ディープラーニングを自分で実行しましょう。ありがたいことに、私たちが従うことができる確立された成功への道があります。

まず、ディープラーニングに影響を与えるプロジェクトを特定する必要があります。慎重に選択する必要があります。ディープラーニングはパターンマッチングなので、その分野に該当するものを選択する必要があります。欠陥分類などの画像ベースのアプリケーションに適しています。工場内のすべての装置は、問題が発生しない限りほとんど参照されない大量の動作データを作成します。

この貴重なデータを事後の診断ツールとして使用するだけでなく、工場全体のデータを継続的に監視し、問題が発生する前のパターンにフラグを立てるようにディープラーニング アプリケーションをトレーニングすることで、問題が影響を及ぼす前に特定して修正し、ダウンタイムを節約できます。

たとえば、Mycronic 社は、2020 SPIE Advanced Lithography Conference での eBeam Initiative ランチタイム プレゼンテーションで、マシン ログ ファイルのデータを使用してディープラーニングを活用し、「ムラ」(人間にとっては不快な明るさの不均一な効果)などの異常を予測する方法を明らかにしました。これは、フラット パネル ディスプレイ (FPD) マスクでは画像処理アルゴリズムで検出するのが非常に難しいことで知られています。

多くの場合、オペレーターは非常に面倒でエラーが発生しやすいプロセスを実行しますが、従来のアルゴリズムを使用して自動化することは困難であるため、ディープラーニングに適しています。目視検査であろうと他の手段であろうと、特定の状況を検査する専門家は、その作業を正しく実行できる可能性が非常に高くなります。しかし、同様の状況の例を数多く経験すると、人間は間違いを犯し、ますます信頼できなくなっていきます。

状況によっては、ディープラーニングは人間ほど優れていない可能性があります。しかし、場合によっては人間よりも優れた結果を出すこともあります。人間はタスクに費やす時間が長くなるにつれてミスが増えますが、ディープラーニングの成功確率は量や時間とともに低下することはありません。

ディープラーニングの成功へのギャップを埋める

ディープラーニング プロジェクトを特定したら、データを厳密に制御しながら成功への道を歩むためのさまざまなリソースを利用できます。ディープラーニングを初めて使用し、ディープラーニングのパイロット プロジェクトに対する包括的なサポートをご希望の場合は、Center for Deep Learning for Electronics Manufacturing (CDLe、www.cdle.ai) に参加できます。これは、才能とリソースを結集して当社独自の問題領域におけるディープラーニングの最先端技術を推進し、企業全体のあらゆる製品へのディープラーニングの導入を加速して、お客様に提供する製品を改善することを目的とした業界リーダーのコンソーシアムです。

すでにディープラーニング プロジェクトを開始しているが、ディープラーニング データのギャップが原因で問題が発生している場合は、D2S が、DL を成功させるために強化および適応させるために必要なデジタル ツインの構築をお手伝いします。

<<:  人工知能が建設業界の様相を変えている

>>:  自動運転車は交通事故のほとんどをなくすことはできないかもしれない

ブログ    
ブログ    

推薦する

...

ドローンは将来何ができるのか

ドローンは、専用のリモートコントロールユニットを介して自律飛行できる無人航空機 (UAV) です。コ...

...

貪欲アルゴリズムについて質問するのはやめてください。

[[323204]]序文三角形の最短経路と和を求めるとき、貪欲アルゴリズムを使用して解決できますか...

銀行における会話型 AI – 企業が犯しがちな 3 つの間違い

金融サービス業界は、特定の金融プロセスに不可欠なレガシー機器やシステムを使用しているため、他の業界に...

...

Baidu PaddlePaddleがHuawei Kirinと提携し、中国のAIの道を歩む

7月3日、北京で開催されたBaidu Create 2019 Baidu AI Developer ...

人工知能と自然言語処理の概要: AI の 3 つの主要段階と NLP の主な応用分野

最近、Xenonstack は Jagreet Kaur 氏による「人工知能の概要とビッグデータにお...

Gemini ProはGPT-3.5ほど優れていません。CMUは徹底的な比較研究を実施し、公平性、透明性、再現性を確保しています。

Google Gemini はどれほど強力ですか?カーネギーメロン大学は、専門的かつ客観的な第三者...

...

...

...

GPT-4 はもう怠け者ではありません! OpenAI、5つの大型モデルを最大80%割引で販売

OpenAI深夜アップデート! 5 つの大きなモデルが一気に投げられました。新しい GPT-4 Tu...

2020年Qizhi開発者会議が北京で盛大に開幕、第一弾の1000万インセンティブボーナスが発表された

2020年12月2日午前9時、知恵とリソースを集めることを目的とした2日間のOpenI/O 2020...

推薦システムで学ぶべき対照的な学習方法

みなさんこんにちは。私はDiaobaiです。今日は、レコメンデーションシステムで学ぶべき対照学習法に...