この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 DeepMind は本日、JAX をベースにした 2 つのライブラリ、Haiku と RLax をリリースしました。 JAX は Google によって提案され、TensorFlow 用の簡略化されたライブラリです。これは、線形代数用のコンパイラである XLA と、ネイティブ Python コードと Numpy コードを自動的に区別するライブラリである Autograd を組み合わせて、高性能機械学習の研究に使用します。 今回リリースされた 2 つのライブラリは、それぞれニューラル ネットワークと強化学習を対象としており、JAX の使用を大幅に簡素化します。 Haiku は JAX をベースにしたニューラル ネットワーク ライブラリであり、ユーザーは使い慣れたオブジェクト指向プログラミング モデルを使用し、JAX の純粋な関数変換に完全にアクセスできます。 RLax は、強化学習エージェントを実装するための便利なビルディング ブロックを提供する、JAX 上のライブラリです。 興味深いことに、Reddit ユーザーは Haiku ライブラリの名前が「ax」で終わらないことに驚きました。 もちろん、ネットユーザーの中には、この2つのライブラリを肯定する意見も出ている。 それがJAXを推進したことは間違いありません。 それでは、Haiku と RLex の本当の姿を見てみましょう。 俳句Haiku は、JAX のニューラル ネットワーク ライブラリであり、ユーザーは使い慣れたオブジェクト指向プログラミング モデルを使用しながら、JAX の純粋に機能的な変換に完全にアクセスできます。 モジュール抽象化 hk.Module と単純な関数変換 hk.transform という 2 つのコア ツールを提供します。 hk.Module は、独自のパラメータ、他のモジュール、およびユーザー入力に関数を適用するためのメソッドへの参照を含む Python オブジェクトです。 hk.transform を使用すると、JAX の純粋に機能的な変換に完全にアクセスできます。 JAX には多くのニューラル ネットワーク ライブラリがありますが、Haiku の特別な点は何でしょうか?ポイントは5つあります。 1. HaikuはDeepMindの研究者によって大規模にテストされている DeepMind は、Haiku と JAX で多くの実験を比較的簡単に再現しました。これらには、画像および言語処理、生成モデル、強化学習における大規模な結果が含まれます。 2. Haikuはライブラリであり、フレームワークではない これは、モデル パラメータやその他のモデル状態の管理など、いくつかの特定の事項を簡素化するように設計されています。他のライブラリと組み合わせて記述でき、JAX の他の部分と連携して動作します。 3. Haikuは新しいスタートアップではない これは、DeepMind のほぼ普遍的に採用されているニューラル ネットワーク ライブラリである Sonnet のプログラミング モデルと API に基づいて構築されています。 JAX 関数変換へのアクセスを維持しながら、状態管理のための Sonnet のモジュールベースのプログラミング モデルを保持します。 4. 俳句への移行は簡単 慎重な設計により、TensorFlow と Sonnet から JAX と Haiku への移行は比較的容易です。新しい関数 (hk.transform など) とは別に、Haiku は Sonnet 2 の API となる予定です。 5. Haiku は JAX を簡素化します 乱数を処理するためのシンプルなモデルを提供します。変換された関数では、hk.next_rng_key() は一意の rng キーを返します。 では、Haiku はどのようにインストールするのでしょうか? Haiku は純粋な Python で書かれていますが、JAX を介して C++ コードに依存しています。 まず、以下のリンクの手順に従って、関連するアクセラレータ サポートを備えた JAX をインストールします。 https://github.com/google/jax#インストール その後、インストールを完了するには、簡単な pip コマンドを 1 つだけ実行する必要があります。
次に、ニューラル ネットワークと損失関数の例を示します。
RLaxRLax は、強化学習エージェントを実装するための便利なビルディング ブロックを提供する、JAX 上のライブラリです。 提供される操作と関数は完全なアルゴリズムではなく、強化学習のための特定の数学的操作の実装です。 RLax のインストールも非常に簡単で、pip コマンドで実行できます。
JAX jax.jit 関数を使用すると、すべての RLax コードを異なるハードウェア上でコンパイルできます。 RLax に関して注意する必要があるのは、その命名規則です。 多くの関数は、出力を計算するために、連続する時間ステップにわたるポリシー、アクション、報酬、および値を考慮します。この場合、接尾辞 _t と tm1 は通常、各入力がどのステップで生成されたかを示すために使用されます。次に例を示します。 q_tm1: 遷移のソース状態における操作の値。 a_tm1: ソース状態で選択された操作。 r_t: 目標状態で収集された結果の報酬。 q_t: ターゲット状態における操作値。 Haiku と RLax は両方とも GitHub でオープンソース化されています。興味のある読者は「ポータル」のリンクからアクセスできます。 ポータル 俳句: https://github.com/deepmind/haiku RLax: https://github.com/deepmind/rlax |
<<: 予想外だが妥当: ガートナーの 2020 年データ サイエンスおよび機械学習プラットフォームのマジック クアドラントの解釈
>>: Googleは社内でAIを使ったコンピュータチップの開発を試みていることを明らかに
1. テキスト生成入門まず、現段階で人気のテキスト生成について紹介します。 1.人工知能の発展段階人...
Analytics Insight は、世界を次のレベルのイノベーションに押し上げるトップ 10 ...
この記事はWeChatの公開アカウント「Internet of Things Think Tank」...
会話型 AI ロボットとのコミュニケーションを経験したことがあるなら、非常にイライラした瞬間を間違い...
人工知能の発展と応用に伴い、AI テストは徐々に私たちの視野に入ってきました。従来の機能テスト戦略は...
長年にわたり、強力なパスワード、定期的なデータ バックアップ、多要素認証は、個人情報を安全に保つため...
Reference News Networkは1月4日、スペインの新聞Vanguardiaが2020...
ディープラーニングは人工知能(AI)分野の継続的な発展を促進し、多くの技術的進歩を達成しました。同時...
私たちが SF の世界に引き込まれると、人工知能と機械学習 (AI/ML) の概念は、映画「マトリッ...
最近起きた自動車事故は、被害者の身元が明らかになったこと、運転支援技術の台頭と普及、中国の有名自動車...
[[196544]]最近、カリフォルニア大学サンタクルーズ校 (UCSC) の Stewart 研究...
最近はテクノロジーがあらゆるところに存在し、それに伴って変化も起こっています。つまり、ビジネス戦略に...