ソラは人間の代わりにはなれない!アマゾンのエンジニアは主張:実際の仕事上の対立はAIでは解決できない

ソラは人間の代わりにはなれない!アマゾンのエンジニアは主張:実際の仕事上の対立はAIでは解決できない

今週、OpenAIのビデオAIツール「Sora」が登場するや否や大きな話題を呼んだ。

「仕事を失う」という恐怖は、本当に多くの人々を襲っています

写真

しかし、アマゾンのエンジニアであるキャメロン・グールド氏は、AIをそれほど恐れる必要はなく、AIによって職を失うこともないと考えている。

なぜ?理由は次の通りです。

プロンプトのパラドックス

まず、生成 AI をクリエイティブ コンテンツに適用すると、生成されるのは一般的に画像、動画、一般的なノンフィクション コンテンツになります。

生成 AI モデルにプロンプ​​トを与えることは、あなたが言うことをすべて文字通りに受け止めてあなたを困らせることだけを目的とする意地悪な子供のベビーシッターをするようなものです。

言葉遣いは正確でなければならず、結果をまったく異なる方向に傾ける可能性のある重要でない詳細に 1 文字も無駄にしてはいけません。

しかし同時に、モデルが誤解しないように、できるだけ詳細な情報を提供する必要があります。

この矛盾した操作は、とにかくひどいです!

コンピューターと一方的に会話をしながら、なぜ期待した結果が得られなかったのかを理解しようとすると、3 時間も頭を悩ませ続けることになるかもしれません...

写真

グールド氏は、ソフトウェアエンジニアとしてのキャリアの中で、コンピューターとのこのような一方的な対話には慣れてきたが、生成型 AI の経験は間違いなくそれよりも悪いと語った。

これは、べき等関数を備えた予測可能なプログラミング言語ではありません。

写真

これは完全なブラック ボックスであり、同じ入力が与えられても、ほぼ毎回まったく異なる結果が生成される可能性があります。

AI にプロンプ​​トの一貫性を保つように依頼しても、AI が言うことを聞かない場合があります。

時価総額数十億ドルの企業はこの現実に悩まされている。

最近、カナダの裁判所は、チャットボットが誤解を招くアドバイスをしたために乗客が航空券のほぼ2倍の金額を支払わされたとして、エア・カナダが乗客の1人に賠償金を支払うよう判決を下した。

写真

本当に早いですが…

もちろん、一貫性の面での欠点があるにもかかわらず、生成 AI は物事を迅速に生産するのに役立ちます。

写真

たとえば、上の写真は生成 AI を使用して作成されており、作成にはわずか数秒しかかかりませんでした。

つまり、AI によってアーティストよりも速く絵を描くことができるようになる可能性があるのです。

Sora を使用すると、一般の人々が以前よりも何倍も速く、より複雑なメディア マテリアルを生成することも可能になります。

では、1 人で複数人分の仕事をこなせるようになった今、アーティスト、ソフトウェア エンジニア、コピーライターの数は本当に減るのでしょうか?

いいえ、詳細は間違っています。

答えはそれほど単純ではありません。

生成 AI を使用してアートを作成するときに、「いや、これは私が望んでいたものではない」と思うことがあります。

これはフォーラムでよく見られる意見でもあります。

これはプロンプトに詳細が欠けているためであり、より具体的なプロンプトを与える必要があると主張する人もいるかもしれません。

この見解は理にかなっています。

写真

私たち自身の映画と、1億ドル以上の収益を上げているプロの映画との違いは何でしょうか?

私たち自身の個人ブログとプロの専業ライターのブログの違いは何でしょうか?

自分たちで制作したゲーム ビデオ タイトルと 30 時間の AAA ビデオ ゲーム タイトルの違いは何でしょうか?

答えは細部にあります。

AI 生画像

アマチュアとプロを分けるのは細部です。

生成 AI を使用して、プロフェッショナルなコンテンツと同じくらい印象的な作品を作成したい場合は、多くの詳細を含むプロンプトが必要になります。

また、モデルが望むものを生成するには、多くの試行錯誤が必要です。

生成 AI は、オートコンプリート、コンパイラ、スペルチェッカー、その他の支援ツールと同じ単なるツールです。

それは、自分自身の仕事でない限り、あなたのために仕事をすることはありません。

Sora の例に戻りましょう。

無音ビデオのみを生成できます。音声も会話もなく、物体も話したり音を出したりすることはできません。

写真

しかし、映画を作るには、それを使う必要があります。

スクリプトを生成しますか?

台本を読んでいますか?

スクリプトに合わせたビデオを生成しますか?

現代の映画が興味深いのはなぜでしょうか?

突然、仕事を完了するために、さまざまな生成 AI ツールを統合する必要が生じました。

確かに、OpenAI にはビデオに音楽を追加できる Jukebox という音楽生成ツールがありますが、セリフを追加することはできません。

写真

ビデオにセリフを追加するにはどうすればいいですか?その仕事はあまりにも困難に思えます。

特定のシーンのビデオを生成するだけでなく、シーン内の登場人物の口の動きやセリフの一貫性を保つ必要もあります。

さらに、ビデオ ジェネレーターは単語がどのように話されているかを知る必要があります。音色だけでなくリズムも同様です。

これらすべての詳細に対処するには、どれだけの人手が必要になるか想像してみてください。

細かいところはかなり難しくなります。

あらゆるレベル、あらゆるステップにおいて、実質的な結果をもたらす詳細事項が多数存在します。

写真

グールド氏は最近、「現実には驚くほど多くの詳細がある」というブログ記事を読んでとても気に入ったと語った。

写真

現実の詳細は無限ですが、AI モデルのトークンは限られています。

それだけでは限界があり、その後は仕事をやり遂げるために他の人に頼る必要があります。

人間は今でも圧倒的に重い荷物を持ち上げています。

写真

宇宙の植民地化に関する重要な詳細

詳細は少なく、多様性は増す

細部にこだわるのは本当に疲れるようです。

シンプルにしておくとどうなるでしょうか?ほんの数分で書ける非常に短い説明だけを提供する必要がある場合はどうでしょうか?

最終的には多種多様な結果が得られますが、そのほとんどはあなたが考えていたものとはまったく一致しません。

プロンプトは非常に普遍的であるため、必要なものを見つけるには、何百、何千もの結果を調べる必要があります。

使える結果が見つからない可能性もあります。

プロンプトが単純すぎる場合は、モデルの豊かな想像力により、選択できるアレンジが無限に提供されます。

たとえば、「a man」というプロンプトを入力すると、あらゆる種類の男性が見つかります。

写真

しかし、実際に私が求めていたのは、青い髪、茶色い目、口ひげ、そしてフード付きの黒いジャケットを着た男性でした。

ヒントとして「a man」だけを入力した場合、正確な出力を見つけるのにどれくらいの時間がかかりますか?

深さと幅の間には、労力を最小限に抑えられるバランスがあります。

これには、詳細についての批判的思考と多くの検索が必要です。

AIは人間に取って代わることはできない

では、なぜ AI は人間に取って代わらないと言えるのでしょうか?

なぜなら、ビジネスは画像やビデオクリップの生成といった小さな問題を解決するために存在しているわけではないからです。

企業とは、利害関係者にとってより大規模で複雑な問題を解決することです。

これらの問題を解決する上で最も難しいのは物流です。

大規模で複雑な問題を解決するには、大規模な問題解決者のグループによる時間と労力が必要であり、物事を前進させるには、そのグループ全員が他の問題解決者によって組織化される必要があります。

ランダムに 2 人を選び、自分の仕事を管理および整理するように依頼すると、基準やスケジュールが一貫していない可能性が高くなります。

これらを連携させる場合は、同時に作業して同じ品質の結果を生み出すように標準を設定する必要があります。

凝集性は強みであり、個々のユニットの一貫性を保つために何らかの作業を行う必要があります。

単独で活動するチームはタスクを正常に達成できますが、単一の環境に複数のチームを導入すると、多くの競合が発生します。

写真

相互に依存する複数のチームが共通の目標に向かって作業する場合、有意義な成果を達成するには、一定レベルの結束が必要です。

この「結束」作業は実際には非常に複雑であり、多くの場合非論理的で感情的な対人関係の対立を解決することが必要になります。

明らかに、AI はこの種の紛争を解決することはできません。

要約すれば、

  • 企業は多くの人々や企業の大きな問題を解決することで利益を上げます
  • 大きな問題は多くのチームが関与するため解決が難しい
  • 人間関係の対立を解決し、結束を維持するために、これらのチームを調整する方法を慎重に計画する必要があります。
  • 人間関係の紛争を解決するには、人こそが最も信頼できる資源である

明らかに、ロボットはこれらの仕事をこなす能力がまったくなく、そのパフォーマンスはひどいものとなるでしょう。

AIはあなたの仕事を奪わない

この事実は、生成 AI の現状を詳しく見てみると明らかになります。

現時点ではこの作業を自動化する方法はありません。

プロンプト インターフェースとモデルにおける自律性と批判的思考の欠如は、重要な制限につながります。

はい、生成 AI は確かに作業効率の向上に役立ちますが、それだけです。

写真

「AI はあなたの仕事を奪うことはない」という意見に賛同する人はますます増えています。

あなたにとって本当の脅威は、あなたよりも巧みに AI ツールを使用できる人です。

生成 AI は作業をスピードアップするのに役立つ優れたリソースですが、作業を完全に自動化することはできません。

必要なのは、それらをツールボックスに追加して習得することだけです。

参考文献:

https://www.camggould.com/posts/The-AI-Endgame/

<<:  MATRIX: 社会シミュレーションは、GPT4よりも配慮した大規模なモデル値の自己整合を促進します

>>:  2024年の製造業の現状:完全デジタル化

ブログ    
ブログ    
ブログ    

推薦する

自動車技術が新たな時代を切り開きます!メルセデス・ベンツ、BMW、Google、Amazon、Qualcommの次世代レイアウト!

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)次世代のス...

2021年にITリーダーがAIと機械学習に期待すること

毎年末と翌年の初めに、IT 思想リーダーが翌年のテクノロジー、革新的なサービス、業界の進歩などの開発...

AI戦略について尋ねるべき10の質問

近年、AI テクノロジーに投資している企業の大多数は、一般的に、AI アプリケーションを業務改善やコ...

Kindred AIは、ロボットをより賢くするために、人々にVRメガネをかけて訓練することを望んでいる

(原題: Kindred AI は強化学習を利用して、人間やサルに VR メガネをかけてロボットを訓...

2019 年の NLP における最先端のブレークスルーを振り返る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

調査によると、ChatGPTはプログラミングの質問に答える際に50%以上のエラー率があることが判明

米パデュー大学の調査によると、OpenAIが開発した人工知能チャットボット「ChatGPT」は、ソフ...

スマートホームとは何ですか?そしてそれは必要ですか?

スマートホームのコンセプトを最も簡単に説明すると、それは家の自然な進化であるということです。スマート...

ロボット兵士はもはやSFではない

ロボット兵士はまもなく現実のものとなり、戦争作戦の遂行において人間の兵士を支援し、負傷した兵士に医療...

GPT-4 はタイプ I の性格を持っていることが判明しました。ビッグモデルMBTIテストがByteから登場

誰かが実際に大規模モデルで MBTI をテストしたというのは驚くべきことです。結果は良好です。 Ch...

ポストパンデミック時代に成功するためのコードを習得するには? AIと自動化にも依存している

COVID-19パンデミック以前は、経営幹部は、ビジネス運営の最適化、収益性の向上、イノベーションの...

...

3つの興味深い写真: 負荷分散アルゴリズムの改善が必要

図1: 負荷分散アルゴリズムの改善が必要[[91541]]図2: 開発者対テスター、非常に奇妙な図[...

...

Xiaolin が LRU アルゴリズムを破壊!

[[411501]]この記事はWeChatの公開アカウント「Xiao Lin Coding」から転...

人工知能の数学的基礎 - 線形代数における行列

この記事は、行列の性質、行列の原理、行列の応用という 3 つの側面から、人工知能の数学的基礎である線...