写真 トークン、ベクトル、埋め込み、アテンション、これらの AI モデル用語は、いつも馴染みがありそうでもあり、馴染みがないと感じますか? 答えが「はい」の場合、本日のポピュラー サイエンスの記事は見逃せません。多数の例と視覚的なグラフィックを組み合わせて、最も単純なものから最も複雑なものまで、AI ビッグモデルの中核となる概念を説明します。 導入テクノロジー企業の継続的な進歩と国際競争により、AIビッグモデルは私たちの生活にますます統合されるようになりました。一般の人にとっては、高度な AI アルゴリズムを勉強する必要はないかもしれませんが、この AI の波に取り残されないようにするには、LLM の原則について基本的な理解が必要です。 LLM (大規模言語モデル) がどのようにテキストを生成するかを理解することは、これらのモデルがなぜこれほど多用途な認知エンジンであるのか、そして他に何を作成するのに役立つのかを理解することです。 トークンとベクトル化まず、トークン化とベクトル化から始めましょう。この部分では、AIビッグモデルの最初のレイヤー、つまりAIビッグモデルが人間の言語をどのように理解するかを明らかにします。この部分の説明は、AI ビッグモデルの基本的な数学的観点を構築するのにも役立ちます。
写真
写真
写真
写真
写真
写真
写真
写真
写真 トランス大規模モデルが人間の言語をどのように理解するかを理解した後、それは特別なことではなく、LLM によって実証された強力な機能と一致していないと感じるかもしれません。そうです、トークン化とベクトル化だけでは、LLM をそれほどスマートにすることはできません。次に、AI モデルの核心である Transformer に進みましょう。LLM が現在のようにスムーズに解析および書き込みできるのは、Transformer のおかげです。Transformer は、コンピューターが言語を理解する方法を根本的に高速化し、強化します。 トランスフォーマー モデルに関する研究は、2017 年 6 月に Google の 8 人の AI 研究者によって初めて発表されました。AI の新時代を開いたのは、よく知られている「Attention is All You Need」でした。Attention は、私が以下で焦点を当てる中核概念でもあります。上記の数学モデルに基づいて、LLM の基本的な概念的抽象化を構築できるように導きます。
写真
写真
写真
写真
写真
写真
写真 これらの文を組み合わせると、モデルは付随するテキストに注意を払うことで、各単語の正しい意味を識別することができます。
写真
写真
写真
写真
写真
写真
写真
写真 法学修士LLM の基本的な数学原理とモデル概念の抽象化を理解した後、ワクワクしてきましたか? 最後に、世界で最も先進的な大規模予測モデルが、このような多彩な AI アプリケーションの世界を構築するために何をしたかを見てみましょう。 ビッグモデルがビッグと呼ばれる理由は、そのトレーニングがインターネット全体の基本コーパスによってサポートされているからです。この巨大なコーパスから、モデルはパターンを認識し、最終的に次善の選択肢を予測することを学習します。次に、大きなモデルに向き合って、LLM がどのように知性を備えて出現し、最も人間に近い人工知能になるのかを明らかにします。
写真
写真
写真
写真
写真
写真
写真
写真 要約するトランスフォーマーは、さまざまな最先端の AI アプリケーションの作成につながりました。 Bard や ChatGPT などのチャットボットの駆動に加え、モバイル キーボードのオートコンプリート機能やスマート スピーカーの音声認識も駆動します。 しかし、その本当の力は言語を超えたところにあります。発明者は、トランスフォーマー モデルが繰り返し現れるテーマやパターンを認識し、予測できることを発見しました。 Dall-E、Midjourney、Stable Diffusion などのツールを使用した画像内のピクセルから、 GitHub Copilot などのジェネレーターを使用したコンピューター コードまで。音楽の音符やタンパク質の DNA を予測して、薬物分子の設計に役立てることもできます。 何十年もの間、研究者たちは要約、翻訳、検索、取得を行うための専門モデルを構築してきました。トランスフォーマーはこれらのアクションを単一の構造に統合し、多種多様なタスクを実行できるようにします。 統一された言語モデルを通じて、画像、音楽、ビデオからのマルチモーダルアプリケーションが実現され、これはこれまでのすべての AI アプリケーションよりも強力です。これがこのストーリーの魔法の部分です。 参考リンク: [1] https://ig.ft.com/generative-ai/ |
<<: 自動テストの落とし穴は何ですか?どうすれば解決できるでしょうか?
>>: AI規制に関するマスク氏の見解:規制は面倒だが、審判がいるのは良いことだ
調査によると、2022年までにインテリジェントオートメーションのトレンドが拡大し、デジタル変革が急速...
[[334729]]機械学習を行う際には、データのクラスター分析を行う必要があることがよくあります。...
科学技術分野において、国境を越えた融合による新しいものによってもたらされる破壊的な競争は、あくまでも...
[51CTO.com からのオリジナル記事] スマートカーといえば、真っ先に思い浮かぶのは自動運転で...
ロボット界のインターネット有名人といえば、ボストン・ロボット・ドッグを挙げなければなりません。そして...
現代の人工知能は、現代の科学技術の中で最も驚くべき強力な技術の 1 つとなり、破壊的な技術でもありま...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
誰もが考えを持っており、監査人もそれぞれ心の中にさまざまな考えを持っています。表面的には、監査スキル...
2016年はボットにとって歴史的な年でした。Facebookなどの主要プラットフォームがMessen...
この研究では、スタンフォード ビジョン アンド ラーニング ラボ (SVL) の Silvio/Fe...
[[253703]]プライバシーやデータバイアス規制などの問題から、モデルのトレーニングやセルフサー...