プログラマーから見たChatGPT

プログラマーから見たChatGPT

著者 |ブライト・リャオ

私はもともとAI技術に興味があったソフトウェア開発エンジニアで、ディープラーニングが流行し始めた2015年、2016年頃から関連技術を学び始めました。当時、私たちは研究に興味を持っていた社内の学生たちも組織して共同研究を行いました。最終結果は、いくつかのコミュニティ共有といくつかの学習記事にまとめられました(こちらをご覧ください:https://brightliao.com/tags/ai/)。

OpenAIが昨年ChatGPTをリリースして以来、AIの能力は再び世界を驚かせています。このような時点で、関連する技術を再学習する必要があります。

ChatGPTとは

ChatGPT とは何かを紹介するコンテンツはすでにインターネット上にたくさんあります。まとめると、ChatGPT についてはいくつかの理解があります。

  • ChatGPT は、OpenAI によって開発された会話生成用の AI モデルです。
  • GPT は「Generative Pre-trained Transformer」の略で、事前トレーニング済みの生成 Transformer モデルであることを意味します。
  • ChatGPT は、Web ページ、書籍、インターネット上の会話などの大規模なテキスト コンテンツから学習し、入力された自然言語を正確に理解し、自然で一貫した応答を生成することができます。
  • ChatGPT は、インテリジェントなチャットボット、仮想アシスタント、仮想カスタマー サービス、その他のアプリケーションの構築に使用できます。記事、スクリプト、デザインの作成に役立ち、プログラムの作成とデバッグにも役立ちます。
  • ChatGPT の計算プロセスは非常に複雑で、1000 億を超えるパラメータが関係し、多数のグラフィック カードを使用した並列計算が必要です。

では、開発者にとって ChatGPT のさまざまな機能は何でしょうか?私たちが慣れ親しんでいるものと比較して、どのように理解すればよいのでしょうか?以下では主にこの観点から私の意見を述べたいと思います。

決定論と非決定論

一般的な開発者の観点から、ChatGPT は通常のプログラムとどう違うのでしょうか?最大の違いは決定論と不確実性だと思います。

私たちが作業用に作成するソフトウェア プログラムのほとんどは、決定論的な方法で動作します。例えば、この記事はMarkdown形式で書かれていますが、Markdown形式を特定の方法で解析し、特定の方法で表示できるプログラムがあります。

ChatGPT モデルは非常に異なり、より確率的かつ非決定論的な方法で動作します。自然言語自体が不確実性に満ちていることは誰もが知っています。たとえば、「みんな彼を軽蔑している」という同じ文は、「彼」が非常に好き嫌いが激しく、他人を見下しているという意味になる場合もあれば、「彼」は能力が乏しく、みんなから見下されているという意味になる場合もあります。それはどういう意味ですか?これはさまざまな文脈や状況によって異なります。

ChatGPT モデルは自然言語の意味をより正確に理解できるため、入力されたテキストを包括的に分析し、最も確率の高いものを選択できます。

同時に、ChatGPT モデルはさまざまな応答を生成することができ、これも確率によって制御されます。 ChatGPT モデルは、指定されたテキストに基づいて次の単語を生成することによって機能します。次の単語をどうやって選ぶのでしょうか?プログラムは設定に基づいて、確率の高い単語をランダムに選択します。このランダム性により、AI の応答の多様性が生成されます。次の単語を生成するときに常に最も確率の高い単語を選択すると、ChatGPT モデルは決定論的なプログラムになります。

自動最適化によって得られる複雑な関数

開発者の観点から見ると、ChatGPT は実際には入力テキストに基づいて他のテキストを出力する通常の関数として見ることができます。この関数が実現できる機能はより強力であり、確率に基づいています。

この機能の実装は、主に開発者がコードを記述して実装する他の方法とも異なります。 ChatGPT モデルは、他の AI モデルと同様に、トレーニングを通じて実現されます。

簡単に言えば、その実装プロセスは次のとおりです。この機能を実装するために、一連のパラメータをランダムに初期化し、この機能に必要なと思われる多数の入力と出力のペア(つまり、トレーニング データ セット)を準備し、これらのデータを使用してトレーニングを行いました。トレーニング プロセスは、実際には、以前にランダムに初期化したパラメーターを調整するプロセスです。これらのパラメータを長期間にわたって広範囲に調整した結果、この関数は、指定した入力に対して期待どおりの出力を返す可能性が高いことがわかりました。この時点で、関数は実際には確率的な方法で実装されます。

パラメータを調整するプロセスは、高校数学の連立方程式を解くプロセスに例えることもできます。たとえば、2 つの未知数を持つ方程式 ax + by = c が与えられた場合、2 つのセットの abc の値がわかっていれば、x と y を解くことができます。ここでのトレーニングは、このような abc 値のペアを多数見つけ、それらの値を使用して x と y を解くことと同じです。ただし、ここでのソリューションでは、実際にはベクトル計算ベースのテクニックがいくつか使用されています。

理解不能なブラックボックス

これまでの理解があれば、ChatGPT が神秘的なテクノロジーだとは思わないと思います。これは、通常の関数実装メカニズムとは少し異なります。

おそらく、このパラメータ最適化方法を使用して複雑な機能を実装すると、興味深く、刺激的なものになるでしょう。しかし、実際には、この実装方法にも問題があります。

おそらく最大の問題は、この機能がなぜ機能するのか理解するのが難しいことです。

これは、関数に多数のパラメータ、特に ChatGPT などの大規模なモデルが含まれていることが一因です。たとえば、ChatGPT3.5 バージョンには 1,750 億個のパラメータが含まれています。これほど多くのパラメータがある場合、各パラメータの役割を手動で分析することは明らかに不可能です。

一方、これらのパラメータがどのように計算されるかはわかりません。パラメータ調整プロセスにも非常に長い時間がかかり、入力と出力のペアが非常に大きくなるためです。これらのパラメータが最終的に最適値に近い点に収束できることは、数学的な観点からのみ説明できます。しかし、それぞれの最適化の具体的な影響を分析することはできません。

このような AI モデル、つまりインテリジェント機能は、それ自体が理解不能なブラックボックスであると言えます。

理解するのが難しいため、常に良好なパフォーマンスを発揮する一方で、特定のシナリオでは予想外に悪い結果になる可能性があるため、使用時には注意が必要です。これは、現在の人工知能技術が非常に優れているように見えるが、実際に実用化すると、常に何らかの問題が発生する重要な理由でもあります。

実際、ChatGPT に、ChatGPT モデルの適用においてどのような課題に直面するかを尋ねると、次のように返答されます。

ChatGPT には大きな可能性がありますが、いくつかの課題と制限も抱えています。たとえば、不正確または意図しない応答が生成されたり、偏見やデリケートなトピックの取り扱いに関する問題が発生する可能性があります。

要約する

上記のことを理解した上で、ChatGPT をもう一度見てみると、不思議に思わなくなると思います。

ChatGPT のリリース以来、多くの人がこれは人類にとって汎用人工知能に向けた画期的な進歩であると信じていますが、一方で、実際には本質的な改善はないと考える人もいます。多くの人が自分のキャリア開発に深い不安を抱いており、多くの人がSFの世界の未来に触れたと感じており、多くの人がこれはまた一攫千金のチャンスだと考えています。

おそらく、機械学習技術の原理を理解して、それを合理的に理解できるようにすることが、すべての人に必要なのでしょう。

<<:  クラウドベースの生成 AI システムを実行するためのベスト プラクティス

>>:  写真をビデオに変換するには、指 1 本だけが必要です。 Gen-2スポーツブラシが無料で利用可能になりました。ネットユーザー:史上最高のアップデート

ブログ    
ブログ    
ブログ    

推薦する

Microsoft Copilot は、コード インタープリター、DALL·E 3、ChatGPT を備えた完全バージョンに進化しました。

Copilot のリリース 1 周年を記念して、一連のメジャー アップデートが予定されています。 ...

Tech Neo 11月号: コンテナプラットフォーム管理の実践

51CTO.com+プラットフォームは、オリジナルの技術コンテンツの選択と絶妙なレイアウトを通じて、...

デジタルヘルスと医療AIベンチャーキャピタル投資は2021年第1四半期に42億ドルに達した

CB Insightsのデータによると、遠隔医療は2021年第1四半期に139件の取引で過去最高の4...

通信ネットワーク運用イベントのナレッジグラフの構築

1. 通信ネットワーク運用シナリオまず、通信ネットワーク運用の背景についてご紹介します。通信ネットワ...

今日のアルゴリズム: 文字列内の単語を反転する

[[423004]]文字列が与えられたら、文字列内の各単語を 1 つずつ逆にします。例1:入力: 「...

...

百新銀行と百度クラウドAI+銀行金融技術シンクタンク会議が開催、オープンバンキングについて議論

11月19日、北京で「百度銀行&百度クラウドAI+銀行金融技術シンクタンク」が開催されました。カンフ...

NVIDIA はフーリエ モデルを使用して前例のない天気予報精度を実現

現代の数値天気予報 (NWP) は 1920 年代にまで遡ります。今日では、数値天気予報はいたるとこ...

2019 AIIA開発者会議記者会見が北京で開催

10月10日、2019 AIIA人工知能開発者会議の記者会見が北京で開催されました。 2019年AI...

機械学習を使用して画像キャプションを生成する

最近のディープ ニューラル ネットワークの開発以前は、業界で最も優秀な人材でもこの問題を解決できませ...

機械学習クラウド プラットフォームにはどのような機能が必要ですか?

[[344159]]効果的なディープラーニング モデルを作成するには、モデルを効果的にトレーニング...

ボストンダイナミクスのスポットが工場に入り、作業を開始しました!現代自動車はそれを夜間警備に配備し、工場の安全管理官に変身させる

ボストン・ダイナミクスのロボットは見た目はかっこいいのですが、使い道がないので、好評は得られても人気...

グラフ分野における初のユニバーサルフレームワークが登場しました。 ICLR'24 Spotlightに選ばれ、あらゆるデータセットと分類問題を解決できる

普遍的なグラフモデルはありますか?分子構造に基づいて毒性を予測するだけでなく、ソーシャル ネットワー...

レノボグループが従業員の払い戻しの内部監査を実施できるようRPAロボットを導入

数万人の従業員を抱える大企業にとって、従業員の払い戻しに関する内部監査の難しさは想像に難くありません...

ターゲット検出にはこの記事で十分です! 2019年版オブジェクト検出の総合ガイド

[[272485]]ビッグデータダイジェスト制作編纂者:張瑞怡、寧静コンピュータ ビジョンは、デジタ...