Zoomに狂った外国人がビデオ会議ロボットを開発、同僚たちはすでに大笑い

Zoomに狂った外国人がビデオ会議ロボットを開発、同僚たちはすでに大笑い

[[321983]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

前の世代の年長者たちがキッチンでおいしい料理を準備し、次の世代の子供たちは横で楽しくゲームやおもちゃで遊んでいます。あなただけが、上半身は明るくてきれいな服を着て、下半身はパジャマに裸足で、ビデオ会議ソフトウェアの中で人間のように振る舞い、退屈な会議の議題を次々と処理しています。

因果応報、今度は在宅勤務の外国人がビデオ通話によるオフィスワークで発狂する番だ。

中には不満を言う人もいました。

私たちは Zoom によって作成された仮想世界に住んでおり、一日中 Zoom の中で生活しています。

在宅勤務で日常生活に戻れると思っていても、実はZoomで生活をシミュレーションしているだけなのです。

さて、オフラインになってサボってもいいですか?

上司は気づくでしょう。

まともなことをして、私が猫と遊んだり、どうぶつの森に行ったりしている間に、私に代わって会議を開いてくれるロボットを作ったほうがいいでしょう。

いいアイデアですね。マット・リードというアメリカ人がそれを実行し、Zoom ミーティング専用のスタンドインを作成しました。

Zoombot はオープンソースで、試用可能です。操作は簡単で、プロセスはまったく複雑ではありません。

バーチャルな自分を作る方法

地球上にすでに存在するテクノロジーを使って、ビデオ会議に出演できる仮想人物を作成するにはどうすればよいでしょうか?

他の人が何を言っているかを理解するには、音声テキスト変換と意味理解のテクノロジーが必要です。

他の人に応答するには、複数ラウンドの会話と TTS 機能が必要です。

話すときにはリップシンクや表情も必要であり、そのためには GAN を使用する必要があります。

また、業務に関連した事項についての議論であるため、業務に関連する業務分野のナレッジマップを準備する必要がある。

会議に出席していない場合は、会議の内容と上司から新しいタスクが割り当てられたかどうかを要約する必要があります。要約できる自然言語生成システムが必要です。

さらに、その効果は現実的でなければならず、上司に間違いが発見されないようにする必要があります。

なんてことだ、そんなにたくさんのスキルを知っているのに、なぜまだ働かなければならないのですか?自分でビジネスを始めたほうが良いのではないですか?

マットはあまり知識がなかったので、最も単純かつ残酷な方法を使用しました。

自分のビデオを録画し、一文ずつ応答を設定します。

とにかく、「職場用語」は少なく、「えーっと」「わかりました」「ちょっと待ってください」でやり過ごす人が常にいます。

そこでマットは、画面録画ソフトウェアを使用して、コンピューターの前にいる自分の映像を録画しました。彼は Mac の QuickTime を使用して画面を録画し、次のように返信を設定しました。

-"大丈夫ですか?"

- 「ご心配ありがとうございます。」

- "わかりますか?"

- 「よく聞こえません。」

-"バイバイ!"

-「ああ、後で話そう。みんな気をつけてね。」

その後、仮想ウェブカメラを設置し、Zoomの入力をこの仮想ウェブカメラに設定します。こうすることで、ビデオ会議を行う際に、同僚のパソコンに送信される映像は、その場でカメラが録画した内容ではなく、Mattさんが事前に録画した映像になります。

[[321984]]

こうして映像と音声で、会議ロボットが完成します。

面白い部分は彼が担当しているのですか?

あなたは少し懐疑的かもしれません:

それでおしまい?本当に真実を隠せるのでしょうか?上司になるなんてバカなことですよね?

マットは同僚との会議でこれを試してみたところ、全員が大笑いしました。

確かに自動で返事をしてくれるし、セリフもかなりアクティブだったんですが、コマ送り効果や単語が飛び出す音など、エンターテイメント作品っぽさを感じましたね、ハハハハハ。

言わざるを得ませんが、このマット兄弟は、まさにサボり界の江太公であり、職場の案山子であり、大小さまざまな会議を延々と開催する上司を嘲笑する模範です。

[[321985]]

これまでたくさんのロボットを見てきましたが、このロボットは本当にユニークで、他のロボットとは一線を画しています。

プロデューサーは広告会社だった

それで、この会議ロボットを使って上司を騙したマットは失業保険を受け取ったのでしょうか?

考えすぎです。彼はイアン・グッドフェローもフォローする技術的かつ創造的な専門家です。

ただ、「善人」グッドフェローが彼に何らかの指導を与え、GAN を追加して会議ロボットのビデオをよりスムーズにするかどうかはわかりません。

マットの面白い会議ロボットは、実は「Red Pepper」というクリエイティブ企業のクリエイティブ技術専門家としての彼の仕事の一部です。

[[321986]]

△この椅子の使い方はなかなか独創的だ

言い換えると、「クリエイティブ企業」のほとんどは「非常にクリエイティブなソリューションを提供する広告会社」です。たとえば、皆さんがよくご存知の日用品会社は、「ドライブ」広告で有名です。これらの「ドライブ」のアイデアは、広告会社 Huanshi Interactive から来ています。

つまり、マットはこんなに面白くて魔法のようなものを作ったにもかかわらず、真剣に仕事をしているのです。

例えば、彼らはかつて、NLP モデル GPT-2 によって作成されたレシピを実際に調理したことがあります。

GPT-2:

フライドコーンポテトピザ シェフのエド・バーガー・ジュニアは最近このポテトピザのレシピに注目しましたが、あなたにも気に入ってもらえたら嬉しいと思います。よくやった、シェフ。前菜として、スライスしたイチゴ 4 個と一緒にテーブルに置き、一緒にお召し上がりください。

レッドペッパーチーム:

[[321987]]

GPT-2:

??????????????????? (これは料理の名前です)

玉ねぎ860個(薄切り)

セロリを薄切りにする

砕いたバルサミコ酢

酢と塩、それにチリ少々

漢方薬、できればケッパー

非乳製品チーズ 50g + 糖蜜

下の層またはジャガイモに味付けをする

栄養情報: 3400ポンドコルドバ

1人分: 17.1ドル リンゴ1/2個(粗くすりおろしたもの)

レッドペッパーチーム:

[[321988]]

残念なことに、タマネギはかなり小さくなってしまいました。

ポータル

最後に、正直に言うと、この面白いプロジェクトはオープンソース化されました。

必要な場合は、GitHub から入手してください。

https://github.com/mcreed/zoombot

<<:  「AI論文のオープンソースコードの義務化に反対する理由」

>>:  アリババがコアテクノロジーを公開:推論性能が2位より5倍速く、4つの世界選手権で優勝した方法

ブログ    
ブログ    
ブログ    

推薦する

強力な顔認識システムを騙すには、額に紙を貼り付けてください。 Huawei製、Face IDは終了

[[275013]]額にお守りを貼るとAIがあなたを認識できなくなるって知っていましたか?たとえば、...

LoraHubはレゴのように組み立てることができ、LoRAのモジュール特性を探索することができます。

低ランク適応 (LoRA) は、基本的な LLM が特定のタスクに効率的に適応できるようにする、一般...

原子力 + AI: 原子力技術の未来を創造するのか?

近年、原子力技術と人工知能(AI)の融合により、原子力AIと呼ばれる強力な相乗効果が生み出されていま...

米国の刑務所、受刑者の通話を分析するために人工知能を導入する計画

下院の主要委員会が、受刑者の通話を分析するための人工知能の使用に関する報告書の提出を求めたことにより...

「最もわかりにくい」Paxos アルゴリズムと、データベースの高可用性におけるその使用法をわかりやすい言葉で理解する

最近、Paxos アルゴリズムについてみんなが議論しています。私はオンラインで多くの記事を読みました...

顔認識を法的に規制する方法

[[359388]]政府機関による顔認識技術の利用に対する法的規制に関して、特別ライセンス制度は、顔...

...

メールを受け取りましたか? GPT-3.5-Turbo-Instructがリリースされ、マルチモーダル大型モデルGobiも公開されました

今月初め、OpenAIは初の開発者会議「OpenAI DevDay」を2か月後に開催することを公式発...

...

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実...

...

機械学習の成功事例5つ

IT リーダーが、人工知能と機械学習を使用してビジネス上の洞察を得る方法を共有します。組織が顧客の好...

GPT-4ではMITでコンピュータサイエンスの学位を取得できない

ある研究者が、MITのコンピューターサイエンスの学位の宿題や試験問題を解くことができると主張するチャ...

...

AI 導入の謎を解明: クラウドとエッジ

現在、ディープラーニング テクノロジーを展開できる方法としては、デバイス上への直接展開、クラウド内へ...