AI は真面目な仕事しかできないなんて誰が言ったのでしょうか? Google は最近、顔を見ながら生計を立てるのを手伝ったり、歌うように話させたりといった変わったタスクを実行できる面白い AI をいくつかリリースしました。 これらは、Google AI を操作する 7 つの「型破りな」方法です。 一日中遊べますよ〜 ゲーム1: ダンスしながらピアノを弾く 普通の人がピアノを弾くときは、ピアノの前に座って鍵盤を押したり、ギターやアコーディオンを演奏姿勢で持って演奏したりします。 しかし、Google の「Body Synth」というプロジェクトは違います。このプロジェクトでは、コンピューターの前に座り、手を鍵盤として、足を弦として使い、踊ったり歌ったりして自分自身を演奏することができます。 まずは効果を見てみましょう。Quantum Bitがお届けするGoogle AI楽器ソロ「Chords」をお楽しみください。 原理は非常に簡単です。カメラをオンにすると、人間の姿勢認識が自動的に起動します。手足と頭は異なるトーンに対応します。 体の特定の部分の動きを検知すると、それに応じた音を発することができます。 私の言葉を繰り返してください。 1~2~3~4~5~6~7~ 嬉しいです〜 デフォルトの C メジャー キーを例にとると、頭を振ると「so」という音が出ます。 左手を動かすとミになります。 右手を動かしてやってみてください。 右足を動かすとベースの音が聞こえます。 左足を動かすとベースになります。 カメラに背を向けた状態でも使用可能です。 さらに、トーンのトーンも設定できます。 または、音声コントロールスイッチをオンにすることもできます。デフォルトの音色はギターです。「ストリングス」と叫ぶとオーケストラになります。「ドラムス」と叫ぶとドラムビートになります。 ゲームプレイ 2-5: 外見で生計を立てる 「手足でピアノを弾く」だけでなく、「顔で生計を立てる」こともできます。 もちろん、本当に顔だけで生計を立てられるというわけではありませんが、顔を使って一連の作業を完了させることはできます(生計を立てること)。 たとえば、サウンド キャンバス ツールを使用すると、顔を使って描いたり書いたりすることができます。 Sound Canvas を開いた後、デフォルト設定ではキーボードとマウスを使用して描画します。 これはあまりにも低レベルであり、Windows 98 に付属するペイント プログラムのレベルに近いです。 したがって、最初にトラッキングを変更し、ボディを選択してから、カメラを開いて顔で描画する必要があります。 この時、顔の向きが画面上の筆の位置になります。頭をゆっくり動かし、少し回転させながら画面に線を描いていきます。 たとえば、「量子ビット」という 3 つの単語を書きます。 人間は顔の用途を発見すると、新しい道具を開発し始めました。 書くことに加えて、ピアノを弾くこともできます。 キーボードはピアノを演奏するのに使われます。操作は顔で文字を書くのと似ています。顔の向きが画面上の小さな点の位置になります。小さな点を操作して画面上のキーを押すと、対応する音が鳴ります。 前回の「ダンスとピアノ演奏」と同様に、キーボードの音色やトーンも選択できます。5 音だけでは足りない場合は、最大 15 のキーに設定できます。2 オクターブあれば、多くの音楽を演奏するのに十分です。 もちろん、2オクターブだとキーが狭かったり、フェイスが大きすぎて操作しづらいので、マウス操作に戻したりもできますが… 慣れてきたら、Clarion Lite もプレイできます。これは、顔でピアノを弾くというプロジェクトですが、いくつかの異なるトリックがあります。 画面上の各色の領域はこの音色に対応しており、小さな点を顔でその上に置き、頭を振ることでトリガーされ、音楽が表示されます。 しかし、音楽を演奏するには、ある程度の音楽の知識が必要です。初心者でもすぐにできる操作はあるのでしょうか? 問題ありません。Google は、「顔を DJ として使う」という Sampler プロジェクトも用意しています。このプロジェクトには、ドラム、ギター、ホルン、ハープシコードの 4 つの短い音楽が含まれています。顔を使って小さな点をコントロールし、その上に動かすだけで、自動的に再生が始まります。 さて、次回の公演はQuantum位による「顔で生計を立てる音楽家」をお楽しみ下さい。 (途中に聞き覚えのある曲がありますので、聞いたことがある方はコメント欄をご覧ください) ゲームプレイ6: 歌うのと同じように話す 私の同僚に雷軍のファンがいますが、Miのファンではありません。彼は単にビリビリの鬼獣セクションで有名な歌手、雷不思のファンです。 簡単に言えば、Guichu はチューニングを通じて文章を歌にすることです。Bilibili のユーザーは全員才能のある人ですが、一般の人にとってこの操作はまだ困難です。 このWord Synthを試してみてはいかがでしょうか〜 いくつかの単語を入力し、好みに合わせてメロディーを微調整し、さまざまなサウンドとトーンの組み合わせを試して、本当に不気味なボーカルを構築してみてください。 試してみましたが、再生できるビデオは 3 つだけだったので、GIF ファイルとオーディオ ファイルを使用しました。 QuantumBits の RUOK 00:00 00:08 このプロジェクトの背後では、Google Cloud のテキスト読み上げ API が主に使用されており、DeepMind が開発した WaveNet を利用して聞こえる音を合成しています。 ゲーム7: 音で描く これは実際には音楽を視覚化するツールです。 いわゆる音楽には、人間の声とさまざまな楽器が含まれます。マイクをオンにしてハミングしたり、内蔵サウンドを呼び出して効果を確認したりできます。 すべての入力サウンドは、ヒルベルト スコープやスペクトログラムなどのさまざまなモードで表示でき、サウンドの詳細なテクスチャとメロディの形状を表示できます。 聴覚障害のあるミュージシャンによると、このツールは、耳が聞こえないときやはっきりと聞こえないときに、より上手に歌うことを学ぶのにも役立つそうです。 真剣に暴露する しかし、Google は、ただ 1 日遊ぶためだけのものではない、非常に多くの素晴らしい機能を考案しました。 上記はすべて、インターネットと AI テクノロジーを通じて、より多くの人が創造性を発揮できるようにする方法を模索することを目的とした Creatability というプロジェクトの一環です。 ニューヨーク大学のクレア・カーニー・ボルペは、アートセラピストとしての仕事を通じて、あらゆる階層の人々と出会ってきましたが、創造のプロセスに参加することで誰もが恩恵を受けることができると信じています。 たとえば、絵を描いたり音楽を作ったりすることで、自閉症の中学生を支援したり、さまざまな技術的手段を活用して、目の不自由な人がディナーパーティーの計画やデザインを完成するためのツールを構築したりしています。 彼女は同じ目的を念頭に、Google チームやアクセシビリティ コミュニティのパートナーと協力して Creatability プロジェクトを作成しました。 このプロジェクトの助けを借りれば、聴覚障害があっても音楽制作に参加することができます。身体の不自由な方でも、指や頭を画面に向かって動かすことで、音楽の魅力を感じることができます。 Google のプロモーションビデオでは、身体に障害のある人たちの笑顔が本当に輝いています。 このプロジェクトを支える AI の力は主に、機械学習技術をブラウザに実装できるようにする Google の TensorFlow.js などのツールです。 教師、学生、研究者、アーティストなど、どなたでも参加できます。実際に使ってみることも、このテクノロジーを使って独自に作成したプロジェクトを開発して提出することもできます。 もちろん、それにアクセスするには科学的な方法が必要であることが前提です〜 |
<<: 生死に関わる問題:病院のICU病棟で人工知能は何ができるのか?
データ侵害疲労は長年の課題です。最高情報セキュリティ責任者 (CISO) は、絶え間ない問題解決...
現在、経済や文化の交流のグローバル化に伴い、主流言語や共通言語が勢力を増し、不利な立場にある言語は絶...
Chiplet は、製品の歩留まり、パッケージの歩留まり、さまざまなコストなどを考慮しながら、大規...
[[404457]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...
[[440885]] [51CTO.com クイック翻訳]次のようなシナリオを想像してみてください。...
4月26日、中国サイバースペース管理局の主催で「人工知能-社会実験の観点から見た社会ガバナンス」を...
ニューラル ネットワークでは、活性化関数によって、指定された入力セットからノードの出力が決定されます...
必要なのは2枚の写真だけで、追加のデータを測定する必要はありません——ディンディン、完全な 3D ク...
ビショップの PRML は機械学習のバイブルと言っても過言ではありません。この本では、パターン認識と...
[[430082]] 【51CTO.com クイック翻訳】はじめに今日、機械学習 (ML) は、ビジ...
今では、ほとんどの企業リーダーがクラウド コンピューティングの価値を理解しています。すでに多くの人が...
UAEの人工知能、デジタル経済、リモートワークアプリケーション担当国務大臣オマール・オラマ氏は先週、...
IBMは、人工知能とほぼリアルタイムの洞察を活用して組織が安全で効率的かつ生産性の高い職場を構築でき...
国産大型モデルはパラメータ優先から実用性優先へとシフトし、長期化期に入っている。 9月7日、2023...