Google GlassのDIY貧弱版、カスタムジェスチャーコントロール、Raspberry Piがまたもや新しい遊び方を開発

Google GlassのDIY貧弱版、カスタムジェスチャーコントロール、Raspberry Piがまたもや新しい遊び方を開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

目の前に映し出された電子映像を、かっこいい手振りで操作する、これがSF映画の基本構成ではないでしょうか?

今、誰かがそれをSF映画の現実に持ち込んだ。指を動かすだけで、目の前の世界をコントロールできます。

スマートガジェットの作成に熱心な YouTube ブロガーの Teemu Laurila さんは、Raspberry Pi を使用して、カスタムジェスチャーを認識できる AR グラスを DIY しました。

設定したいジェスチャーをデバイスに入力するだけで、クールな操作を実現できます。

大胆なアイデアがあります!

手作りARグラスの中の世界

ショーを始めましょう!

指をつまんで上下に引くと明るさを調整できます。 (これは一人称視点です)

ジェスチャー認識のために、ディスプレイはレンズ画像に重ねて表示されます。

より直感的な視点で、メガネを通して効果を見てみましょう。

DIYプロセス

AR グラス自体にテクノロジーが満載されており、現実世界にサイバーパンクな雰囲気を与えます。

もっとクールなほうがいい。指をパチンと鳴らすだけでコマンドが実行できる。面白いと思いませんか?

まず、デバイスにどのような部品を含めるかを設計する必要があります。

ハードウェアには、メガネのメインフレームに加えて、レンズグループ、0.6 mm PETG投影レンズも含まれており、アクセサリはポリ乳酸素材の3Dプリントで作られています。

なんせDIYスマートデバイスですから、万能ミニコンピューターRaspberry Piを使わない手はないですよね?

ソフトウェア部分に関しては、ジェスチャー認識プログラムは Python オープンソース プロジェクトMediaPipeに依存しています。

さらに、Teemu Laurila は 2 つのプログラミング スクリプトも作成しました。

1つは指をつまんで明るさをコントロールする応用例、もう1つはジェスチャーをリアルタイムビデオでキャプチャし、コンピューターに送信して処理し、スマートグラスに重ね合わせるというものです。

条件が揃ったので、組み立てて試してみましょう。

何度も調整を重ね、最終的にさまざまな部品が組み合わされて次の装置が完成しました。

プログラムをデバイスで利用できるようにするには、まずプログラムのサポートとして Raspberry Pi が必要です。

次に、メモリ、ドライバー、動作環境、マルチメディア インターフェイス、ネットワークなどの条件を設定して、デバイス全体をオーバークロックで実行できるようにします。

ハードウェアとソフトウェアの環境が準備できたら、アプリケーションをデバッグします。

アプリケーション機能の中核であるジェスチャ認識モデルは、手のひら認識モデル BlazePalm (手の全体的なフレームと方向を認識するために使用)、ランドマーク モデル (3 次元の手のノードを認識する)、ジェスチャ認識モデル (認識されたノードを一連のジェスチャに分類する) の 3 つのフレームワークで構成されています。

認識アルゴリズムのトレーニング中に、BlazePalm モデルは手のひらの初期位置を識別し、モバイル端末でのリアルタイム認識を最適化します。

BlazePalm によって認識される手のひらの範囲内で、Landmark モデルは 21 個のステレオ ノードの座標を識別します。

これに基づいて、ジェスチャ認識モデルは、関節角度に応じて各指の状態を識別し、その状態を事前定義されたジェスチャにマッピングし、基本的な静的ジェスチャを予測します。

Raspberry Pi Zero W を通じてジェスチャー情報をキャプチャします。画像情報はコンピューターに送信され、ジェスチャー認識AIによって処理されます。その後、デバイスに送信され、対応するジェスチャ コマンドが発行され、投影された画像に同期されます。

その過去と現在

ちょっと待ってください、カメラ、マイクロプロジェクター、コンピュータープロセッサーがあり、ディスプレイが片側に投影されています。この手のARグラスはどこかで見たことがあるような気がします。

そうです、使用されているジェスチャー認識コードも Google によってオープンソース化されています。

スマートフォンのようなGoogleスマートグラスと同じ機能はありませんが、音声制御やタッチ機能と比較すると、Teemu Laurilaのスマートグラスはカスタムジェスチャーを使用してコマンドをトリガーすることを選択しており、よりブラックテクノロジーの雰囲気があります。

さらに、Google Glass のカメラは写真の撮影とビデオの録画にのみ使用されますが、Teemu Laurila のカメラはジェスチャー コマンドの受信やコマンドの伝達にも使用されます。同時に、視覚的な観察を容易にするために、投影にはより大きな正方形のレンズも選択されました。

このデバイスは、Teemu Laurila が完成させたスマート グラスの 2 番目のバージョンであり、外観とパフォーマンスの両方が改善されています。

材料の選択に関しては、1mm厚ではなく0.6mm厚の投影レンズが使用され、アクリル酸の代わりにポリ乳酸材料が使用され、ブラケットを固定するためにボルトが追加され、接着剤は廃止されました。

最も重要な最適化は、カメラが正方形のレンズを使用して画像をより鮮明にすることです。

Teemu Laurila 氏は、興味のある視聴者が自分で再現できるように、2 つの追加コードを GitHub プラットフォームで共有しました。

参考リンク:
https://www.tomshardware.com/news/raspberry-pi-smart-glasses-recognize-hand-gestures
https://www.youtube.com/watch?v=60Os5Iqdbsw
https://www.youtube.com/watch?v=Gu4oOYo38rQ

GitHub リンク:
https://github.com/Teneppa/CameraStream
https://github.com/Teneppa/HandTrackingBrightnessControl

<<:  Alibaba Damo AcademyのJin Rong氏:テクノロジーから科学へ、中国のAIはどこへ向かうのか?

>>:  豊富なインテリジェントビデオ分析システムは、豊富なAIアルゴリズムでよりインテリジェントなシナリオを実現します。

ブログ    
ブログ    

推薦する

キロメートル認識誤差5%未満の世界最先端の超長距離精密3Dセンシング技術をリリース。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

NetEase Fuxi Game AI Botの擬人化と様式化:AIGAはゲーム探索を強化

1. AIGCからAIGAへAIGC は AI によって生成されたコンテンツを指し、すでに広く理解さ...

自動運転分野における機械学習アルゴリズムの応用に関する包括的なレビュー

機械学習は、車内外のセンサーからのデータを融合して、運転者の状態を評価し、運転シナリオを分類するため...

MetaチーフAIサイエンティストLeCun Yang氏:ChatGPTは犬ほど賢くない

6月16日のニュース: 人工知能技術の急速な進歩に伴い、その潜在的な危険性についての議論がますます白...

Google Brain の公開: アルゴリズムのエラー修正と AI バイアスの解決に重点を置く

テンセントテクノロジーニュース、1月29日、海外メディアの報道によると、グーグルCEOサンダー・ピチ...

...

GPT-3の良き「パートナー」:この方法はモデルの劣化を軽減し、出力をより自然にします

テキスト生成は、多くの自然言語処理アプリケーションにとって重要です。しかし、ニューラル言語モデルの最...

なぜ人工知能は技術的な問題ではなく、社会的な研究の問題なのでしょうか?

[[252833]]無人スーパーで買い物をすることに慣れている人なら、ある日のある瞬間、他のスーパ...

ストーリーを伝えれば、動画が編集されます。AI による動画編集の自動化により、パンダの目を持つ編集者が解放されます。

ビデオ編集は、編集者が適切なフレームを見つけてつなぎ合わせる必要がある、時間と労力を要する作業です。...

掃除ロボットが話し始めた。人工知能アシスタントは、家庭の6つの主要分野で努力している。

[[348486]]従来の掃除ロボットは、何も言わずにただ働くだけの家庭内の「ロールモデル」です。...

人工知能による影の検出と除去、反射に基づく影の検出と除去方法を実現

AI による影の検出と除去、反射ベースの影の検出と除去方法に向けて、概要: 影は画像によく見られる要...

いくつかの負荷分散アルゴリズムの原理とコード実装

ポーリング アルゴリズム: 受信したリクエストをバックエンド サーバーに順番に転送します。現在のサー...

...

マスク氏はAIデーでテスラに関する難しい技術的質問に答える予定

北京時間8月19日朝のニュースによると、2019年4月にテスラが「自動運転の日」イベントを開催したと...

人工知能のこれら 5 つのトレンドは世界にどのような影響を与えるでしょうか?

人工知能はもはや未来の技術ではありません。私たちの日常の作業を自動化する機械はますます賢くなり、人工...