空中でスクリーンに文字を書くのは魔法のようです。指をつまむだけで実現します。

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

空中にお守りを描くという第 2 レベルのスキルを欲しくない人がいるでしょうか?

魔法のブラシとして機能する汎用 AI を作成したほうがよいでしょう。

これは、書いたり描いたりするためのハンドトラッキングプログラムです。開発者はこれをYoHa ( Your Hand Tracking) と名付けました。

このプログラムは、遅延や遅れのないTensorFlow.jsに基づいたリアルタイム認識を実装します。

指をつまむと絵筆になり、拳を握るだけで簡単にキャンバスをきれいにすることができます。

YoHa を使って自分自身に特殊効果を描く効果は非常に優れているため、555 個の星を獲得できるのも不思議ではありません。

このAIをどうやってプレイするのですか?

このジェスチャー認識プログラムはオープンソース化されており、開発者の Benjamin は、この「魔法」を使用する機会をすべての人に惜しみなく提供しています。

自分のパソコンにインストールして遊ぶことができ、1行のコードで簡単に実装できます。

npm インストール @handtracking.io/yoha

また、Web ページから直接モデルをダウンロードして、書き込みや描画を行い、オンラインで試すこともできます。

YoHa は現時点では指をつまむ動作と拳を握る動作にしか反応できませんが、TensorFlow.js のサポートにより、そのパフォーマンスは決して低くありません。

21個の手関節の位置決め、左右の手の方向検出、手の姿勢検出などをすべてリアルタイムで実現できます。

「バイヤーショー」も同様に優れているかどうか見てみましょう。

ルーン文字の絵が醜すぎるというだけで魔法使いにはなれないことが判明

このような興味深い AI の原理は何でしょうか?

YoHa モデルは、TensorFlow.js ディープラーニングフレームワークを使用して、最初からトレーニングを行います。開発プロセスには、トレーニングと推論の 2 つの部分が含まれます。

モデルのトレーニングフェーズでは、カスタムデータセットをトレーニングデータとして使用するカスタムニューラルネットワークが使用され、オンラインのリアルタイム推論では TensorFlow.js 推論フレームワークが使用されます。

ただし、TensorFlow.js のサイズ制限により、YoHa はコンピューターよりもモバイルデバイスでのパフォーマンスが低下します。

さらに、YoHaのローカル実行速度はオンライントライアルよりもはるかに高速です。AIを飼いならすには、まず家に連れて帰って育てる必要があることがわかりました。

ジェスチャー認識は何に役立ちますか?

YoHa の開発者であるベンジャミン氏は、このプロジェクトは当初、ネットワークの双方向性を高めるために作成されたと述べています。

「既存のソリューションには私が求めていたものがなかったので、自分で新しいソリューションを作りました」

彼は本当に実践的な人です。欲しいものがない場合は、自分で作ります。

ジェスチャー認識は非常に人気があるので、VR/AR をもっと楽しくするために、より多くの遊び方を開発し、より豊富な機能を追加してみてはいかがでしょうか。

前述の YoHa のパフォーマンス欠陥に対応して、Benjamin はプレイヤーに高性能な代替手段である汎用ジェスチャ認識モデル MediaPipe も提供しました。

ハイエンドのプレーヤーがより高いパフォーマンスを要求する場合、このクラシックモデルをベースに機能を拡張することができます。

例えば、最近MediaPipeをベースに開発された「air-drawing 」という類似プロジェクトは、ゲームプレイの点でYoHaとは少し異なります。

興味があれば、AI を飼い慣らして文章を書いたり描いたりしてみましょう。

GitHub アドレス:
https://github.com/handtracking-io/yoha
トライアルアドレス:
https://handtracking.io/draw_demo/
https://loicmagne.github.io/air-drawing/

<<: 人工知能 (AI) は、研究室から実際のアプリケーションまでどのように異なるのでしょうか?

>>: ライフル銃で動くロボット犬の発明者が恐怖を巻き起こす：プログラミング制御は恐れる必要はない

改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた

ブログ

アルゴリズム、データ、機械学習機能... AI スタートアップの堀とは何でしょうか?

ブログ

人工知能の時代において、Web フロントエンドは何ができるのでしょうか?

ブログ

大規模言語モデルを導入し、国内初のコンピューティングパワーエコシステムをサポートする新しいオープンソースRLフレームワークRLLTEが登場

ブログ

メタバース＋AIとデータの未来は明るい

ブログ

2020年の人工知能レビュー：AIが時代に知性をもたらす

ブログ

Microsoft AI が IMO コンテストに参加します!小さな目標：数学の金メダル

ブログ

Java と Python のアルゴリズムとデータ構造に関する面接の質問

ブログ

動的プログラミングアルゴリズムのルーチンをマスターするにはどうすればいいですか?

ブログ

空中でスクリーンに文字を書くのは魔法のようです。指をつまむだけで実現します。

このAIをどうやってプレイするのですか?

ジェスチャー認識は何に役立ちますか?

改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた

アルゴリズム、データ、機械学習機能... AI スタートアップの堀とは何でしょうか?

人工知能の時代において、Web フロントエンドは何ができるのでしょうか?

大規模言語モデルを導入し、国内初のコンピューティングパワーエコシステムをサポートする新しいオープンソースRLフレームワークRLLTEが登場

メタバース＋AIとデータの未来は明るい

2020年の人工知能レビュー：AIが時代に知性をもたらす

Microsoft AI が IMO コンテストに参加します!小さな目標：数学の金メダル

Java と Python のアルゴリズムとデータ構造に関する面接の質問

動的プログラミングアルゴリズムのルーチンをマスターするにはどうすればいいですか?

推薦する

AI による顔を変える動画が何百万人ものユーザーを獲得。たった 1 ステップで楽しさから恐怖感まで

SASは、IoTイニシアチブにAIを組み込むことで企業が競合他社を飛び越えることができると述べている

作業効率を大幅に向上できるAIツール

日本俳優連合がAI法案を提案、「声の肖像権」創設求める

ガベージクリーニングは必須 - Java ガベージコレクションアルゴリズム

モザイクでも止められない！これらのAIアルゴリズムはワンクリックで高解像度を実現できます

リチウム電池の防爆結果がネイチャー誌の表紙に登場、UCLAの中国チームが制作

自動運転の倫理的ジレンマを解決する: 道徳規範を数式に変換する

深い思考 | 大規模モデルの機能の限界はどこにあるのでしょうか?

OpenAI が 10 億ドルで Microsoft に売却された後、汎用人工知能にはまだ希望があるのでしょうか?