2016 年には、財務報告書に基づいてプレスリリースを書くという、人間と機械によるライティング コンテストがありました。 対戦相手は、自然言語生成会社Automated Insightsが開発したロボット「WordSmith」と、アメリカの公共放送の記者スコット・ホースリー氏だ。 コンテストの最終結果は、ロボットが人間の2倍以上の速さで書いたというものでした。 もちろん、2つのプレスリリースを比較すると、スコットが書いたものの方がより鮮明で、詳細かつ感情的です。 原稿に基づく翻訳 数年前から、訓練された人工知能が人々のニーズに合わせてさまざまな記事を生成できるようになったことがわかります。 今では、1日に数千語のオンライン記事を作成することも問題ありません。 地球上で最も強力な言語モデルである GPT-3 は、毎日 45 億文字を作成できます。 ただし、これらの言語モデルのほとんどは、ユーザーに対して限定的なインタラクティブ サポートしか提供できません。 さらに、機能ごとに言語モデルを個別にトレーニングするのはコストがかかりすぎます。 上記の問題を解決するために、Google Research のチームは、AI 駆動型のクリエイティブ ライティング アシスタントである Wordcraft テキスト エディターを提案しました。 Wordcraft は、ほんの少しのサンプル学習と対話で、さまざまなユーザーインタラクションを提供し、さまざまなストーリー執筆タスクをサポートするほか、ライターがストーリーのアウトラインを計画し、執筆および編集するのを支援することもできます。 例えば、学校で一番大変だったことは、記事を書き続けたり書き直したりすることでした。 さらに、チームは、一般的な言語モデルの代わりに会話モデルを使用するという Wordcraft 独自の利点を調査しました。 ストーリー作成環境では、モデルの予期しない出力が創造の一形態であるため、言語モデルの機能と限界を探索できます。 人間とコンピュータの相互作用の観点から、Wordcraft は、人々が言語モデルとどのように相互作用するか、モデルに対する人々の要件、モデルが生成できるもの、そして人々の最終的な作品にどのようにフィードバックするかを学習できます。 研究チームはまた、トレーニング ループに人間からのフィードバックを組み込み、その後のトレーニングと評価のために動的なデータセットを収集する予定です。 Google AI ワードアシスタントGoogle の研究者は、作成のさまざまな段階でユーザーに自然言語生成サポートを提供できる AI アシスタントを構築しました。
AIアシスタントを搭載したテキストエディターは見た目が非常にシンプルで、左側に空白の書き込み領域があり、右側にAIガイドによる操作ボタンとAI生成テキストが表示されます。 ユーザーのニーズに応じて、エディターはさまざまなインタラクション オプションを提供します。 1つの質問、1つの答え、簡単に解決著者は、Meena と GPLM という 2 つの言語モデルをテストしました。Meena は、以前の会話の内容を入力として受け取り、次の会話を予測します。一方、GPLM は、与えられた以前のテキストに基づいて書き込みを続けます。 実験の結果、著者らは、Meena が、同様のサイズだがそのようなタスクでの対話についてトレーニングされていない一般言語モデル (GPLM) よりも優れていることを発見しました。 そのため、研究者たちは最終的にミーナを選択し、ストーリー作者とアシスタント間の会話を模倣するこの形式が、ユーザーのストーリー作成にさらに役立つと考えたのです。 著者は、各タスクごとに、異なるタスクのための複数のフェーズの対話を作成しました。 ユーザーは「剣」を書き直すように要求し、モデルは対応する対話環境にストーリーを添付し、AIに応答を求める 著者らは、人間は会話の形式に慣れているため、数回の学習だけで非常に自然な出力を生成できることを発見しました。 さらに、対話モデルがタスクを理解できない場合、またはさらに情報が必要な場合は、単に「それを言う」だけです。
著者らは、このような応答はユーザーがプロンプトを改善する方法を理解するのに役立つと考えています。 GPLM が不明瞭なプロンプトに遭遇すると、意味のない継続が生成されることがよくあります。 さらに、会話中にユーザーは「キャラクターは対立を解決するために何をすべきか」と尋ねるかもしれません。 この場合、ユーザーは、単にテキストを続けるためのモデルではなく、ライティングパートナーを探していることは明らかです。 継続 継続は、言語モデルによって実行される最も基本的なタスクです。 会話モデルがタスクをよりよく理解できるように、著者らは説明的なテキストを使用して質問を改良しました。
上記の入力に基づいて、モデルは次のことを推奨します。
充填記入は難しい作業です。たとえば、ユーザーが段落を書き終えた後、AI アシスタントにストーリーの新しいアイデアを考え出させたり、いくつかの単語を置き換えたりしてもらいたい場合があります。
モデルは、ユーザーが選択したテキストに基づいて質問を書き換え、それを AI に渡して処理します。
そこでAIは次のように応答しました。
興味深い答えですが、あまり効果的ではありません。 2 番目の応答は、メタテキストを生成するモデル、つまりストーリーを書くのではなくストーリーについて話すモデルの問題を示しています。 メタテキストの生成を最小限に抑えるために、著者らは AI が学習するためのプロンプトをいくつか構築しました。 この時点では、AI の出力は正確には 4 語ではありませんが、改善されています。
12 語を出力するように依頼すると、AI はより長い提案をしました。
拡大執筆プロセスの一部には、特定のストーリー要素に詳細を追加するなど、すでに書かれた内容を拡張することが含まれます。
この例では、ユーザーは老人についての詳しい情報を知りたいので、AI は次のように応答します。
リライトさらに、作者はAIに物語のトーンを書き換えさせることも試みました。
モデルは対応する出力を生成します:
話をもっと面白くするよう頼まれると、モデルはこう答えた。
言葉の技巧は始まりに過ぎないユーザー生成記事は、AI ライティング アシスタントと連携するライターの将来も反映しており、ライターが自分の語り口を修正したり、文章を書き直したりするのにも役立ちます。 AI アシスタントの執筆の方向性は、作家にインスピレーションを与える可能性が高いです。 あらゆる利点には欠点がある。 Wordcraft も完璧ではありません。その最大の欠点の 1 つは、Meena と GPLM の言語品質が作成プロセス中に一定にならないことです。 少し前にAIダンジョンゲームでGPT-3が人間の道徳的要求に沿わない内容を提案したのと同じように、言語モデルの驚くべき模倣能力も人工知能のダークサイドを明らかにすることになるでしょう。 Wordcraft によって生成されるテキストも、主に言語モデルがインターネットのテキストからトレーニングされるため、偏りが生じる可能性があります。 トレーニングテキストに偏った内容や差別的な内容が含まれていても、レビューやフィルタリングが行われなければ、言語モデルはそれらの内容を学習してしまいます。これらの問題が解決されて初めて、Wordcraft は正式に使用できるようになります。 |
>>: 上海交通大学のオープンソーストレーニングフレームワークは、大規模な集団ベースのマルチエージェント強化学習トレーニングをサポートします。
2017年は「人工知能」が輝きました。ディープラーニング「AlphaGo」が柯潔に勝利し、無人運転...
マイクロソフトは 10 月 4 日、OpenAI の最新の DALL-E 3 画像ジェネレーターがす...
[[406559]] Python 中国語コミュニティ (ID: python-china)一部の予...
明らかな理由から、ワクチンの開発が現在最優先事項となっています。安全で効果的なコロナウイルスワクチン...
[[216302]] Leifeng.com(公式アカウント:Leifeng.com)AI Fina...
スマート医療産業の急速な発展は、多くの患者に恩恵をもたらしています。伝統的な医療業界をアップグレード...
少し前に、機械知能 AI テクノロジー年次会議がオンラインで開催されました。デューク大学電気・コンピ...
MIT 博士号取得者であり太極拳の著者でもある胡元明氏は、学界から産業界へスムーズに移行しました。胡...
Diffie-Hellman暗号化アルゴリズムの欠点[[225219]]前回の記事では、Diffie...
AI ソフトウェア テストの分野では、将来的に複数の開発トレンドに直面する可能性があり、そのいくつか...
現在、ナビゲーションや通信などの技術が継続的に進歩し、ドローンの開発はより成熟し、業界の規模も拡大し...
そうです、グラフィックカードを作っている会社、NVIDIA です。 NV はグラフィック カード メ...
C# のデータ構造とアルゴリズムで線形リストを構築するためのクラスは何ですか? C# のデータ構造と...