大規模な論文を読むための素晴らしいツールがここにあります! 67ページの論文を5秒で翻訳し、スクリーンショットを撮って直接質問し、Webページで試してみる

大規模な論文を読むための素晴らしいツールがここにあります! 67ページの論文を5秒で翻訳し、スクリーンショットを撮って直接質問し、Webページで試してみる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

昨晩、NetEase Youdaoの「Zi Yue」教育モデルが正式にリリースされました。

このビッグモデルは「偽物ではない」ため、リリースされるとすぐに使用でき、誰でも遊ぶことができます。たとえば、Youdao Translationデスクトップバージョンでは、すでにビッグモデルのAIボックス機能がリリースされています。

最も興味深い使用法の 1 つは、大きなモデルを使用して論文を読むことです。これは、Web 上で試すことができるYoudao の速読機能です。

写真

論文をアップロードしてから数秒以内に、ビッグモデルがそれを素早く翻訳し、テキストで質問できるだけでなく、わからない質問に答えるためにスクリーンショットを撮ることもできます。

NetEase Youdaoは記者会見で、「Zi Yue」モデルの全体的な会話能力はChatGPTほど優れていないものの、論文を読む際には独自のスキルを備えていると紹介した。

結局のところ、ChatGPT は長い論文を読むことができないというのはよく知られた事実です。

しかし、NetEase Youdaoの主任科学者であるDuan Yitao氏は次のように述べた。

「Zi Yue」大規模モデルはChatGPTソリューションとは多少異なり、「次のコンテキストを読み取った後に前のコンテキストを忘れる」という問題は発生しません。

では、論文を読む上での「字月」の秘訣とは何でしょうか。また、実際に使用するとどれほど効果があるのでしょうか。

論文を速読するためのヒントは何ですか?

多くの AI 論文読み上げアプリと同様に、 Youdao Speed Readingでも論文を素早く読み上げることができます。

ここでは、数学に関する AI 論文をアップロードしてみます。大規模なモデルがテキスト全体を翻訳するのに約5 秒かかります。

特定の段落に焦点を当てたい場合は、各翻訳に対応する元のテキストをマークすることができます。

次に、テキストスクリーンショットを使用して論文のあらゆる詳細について質問することができ、大きなモデルがそれに答えることができます。

たとえば、この論文のハイライトと、それが以前の研究と比べてどのように改善されているかを簡単に説明します。

数秒以内に回答できるだけでなく、情報源をマークして「間違ったことを言う」ことを避けることもできます。

理解できない特定の固有名詞がある場合は、ワンクリックでその単語をハイライトし、文章の説明を求めることができます。

Youdao Speed Readingは文脈を結び付け、その起源と使用法を分析できます。

もちろん、ChatGPTと比較すると、わからないセクションのスクリーンショットを直接撮る方が便利です。

最後に、論文を簡単に要約してみましょう。また、結果を素早く提示し、論文で引用されている情報の出典を特定して、「間違ったことを言っている」かどうかをチェックすることもできます。

このように、論文をじっくり読みたい場合でも、「量子速度読書」を達成したい場合でも、NetEase Youdao を使用するとすぐに完了できます。

しかし、経験の中で、まだ完璧ではない機能もいくつか見つかりました。たとえば、このビッグモデルではオンラインで情報を検索できません。論文に関連する引用数や同僚による関連研究を知りたい場合、ビッグモデルでは答えられません。

これらの質問に答えるために、私たちはNetEase YoudaoのCEOである周鋒氏とNetEase Youdaoの主任科学者である段一涛氏にも話を聞き、「Zi Yue」論文読解モデルの背後にある原理を理解しました。

Duan Yitao氏は、大型モデルは現時点ではインターネットに接続する機能はないが、「複数の文書を連続して読み取る」能力はすでに備えていると紹介した。

つまり、「オンラインで情報を検索する」機能はありませんが、異なる論文間の関係性を把握したい場合は、複数の文書をアップロードして、大きなモデルに複数の論文を同時に読み取らせることができます。

複数のドキュメントを連続して読み取る機能はありませんが、この機能は大規模なモデルに対応するために拡張できます。ネットワーク機能に関しては、将来的に検討される可能性もありますが、現時点での主な改善点は、専門用語の翻訳と文書の解析機能です。

また、ChatGPT をはじめ、多くの大規模モデルの製品では、「長いテキスト」を完全に読み取る機能がなく、前のテキストを読んだ後に次のテキストを忘れてしまうことがあります。 「紫月」の大型モデルでもこの​​問題は発生するのでしょうか?

Duan Yitao 氏は、NetEase のビッグモデル ソリューションは ChatGPT とは若干異なると述べました。NetEase はベクトル データベースを使用して「メモリ」の向上に役立てています。

つまり、アップロードされた論文はビッグモデルによって分析・分割され、検索機能を使用して質問の関連する断片が検索されるため、「文脈を忘れる」という問題は発生しません。

周鋒氏はさらにこう説明した。

この分野ではベクター データベースも人気のある方向性です。

長いテキストを解釈する大規模モデルの能力だけに頼ると、主にその答えが間違っている可能性があるため、その答えを信頼できない可能性があります。しかし、独自の知識ベースを定義するのと同等のベクトル データベースを使用すると、この問題を解決できます。

AI機能も多数導入

網易優道は、優道速読のほかにも、「優道」モデルに基づいた5つの製品を開発しました。

LLM 翻訳、バーチャル口頭コーチ、AI ライティングガイダンス、文法トレーニング、AI ボックス。

たとえば、デスクトップ版のYoudao辞書では、 AIボックス機能が全面的に導入され、英語の文章を直接磨くことができます。

単語のハイライトをオンにすると、Web ページ上でそれを使用して、文書内にすでに書かれている英語の文章を、専門的、口語的、よりフレンドリー、よりゴージャスなど、希望どおりに直接書き換えることもできます。

塩分の多い食生活の人にとっては朗報と言えるでしょう。

さらに、大型モデルを搭載したバーチャルオーラルコーチ「Hi Echo」もございます。

これは、Android フォンで直接試すことができる英語のスピーキング練習アプリです。

「通話に応答」した後、英語でEchoとランダムに会話することができます。ビッグモデル機能に基づいてシーンとコンテキストを理解し、フィードバックを提供します。

会話の後、Echo は発音、文法、その他の側面に基づいて提案や「スコア」も提供し、誰もが自分の発音や文法のどこに問題があるかを把握して、より上手に話す練習をすることができます。

さらに、「Zi Yue」大模型には、英語の宿題を書く際の問題を解決するための文法解説機能も搭載されています。

記者会見では、大学入試や高校入試の実際の英語テスト問題が例として使用されました。「Zi Yue」モデルに基づいて、このアプリケーションは確かに的を絞った問題解決のアイデアと方法を提供し、類似のテスト問題を推奨することで、学生が1つの事例から別の事例へと推論を導き、カリキュラムのテストポイントを真に理解するのに役立ちます。

また、文章作成ガイダンス機能もあり、これは特に、資料が足りない、文章が書けない、主題が見つからない、話題から逸れてしまうなどの問題を解決するために設計されています。修正プロセス中、AI ライティング ガイダンスは、表現、構造、コンテンツの深さ、感情の豊かさという 4 つの側面から総合的な改善提案も提供します。

現段階でビッグモデルが何ができるかについて、NetEase Youdao CEO の周鋒氏は興味深い比喩を使った。

今日の大型モデルには、一定の思考能力が備わっています。これまでの AI と異なる点は、言語推論の能力はあるものの、話す文章や話す単語ごとに、基本的にそれほど深く考えることができないという点です。

例え話をしましょう。酔っ払って話しているようなものですよね?私は特に深く考えることはできませんが、非常に流暢に、そして絶えず話します。

NetEaseの「Zi Yue」の大型モデル機能に興味がある方は、下のURLをクリックして体験してみてください〜

紙の速読: https://read.youdao.com/

その他の機能トライアルアドレス: https://aicenter.youdao.com/

<<:  「初の常温常圧超伝導体」に対する共同研究者の反応:内容に欠陥あり

>>:  精度が極めて低いです! OpenAIがAI検出器を削除、ICMLの傑出した論文が非難される

ブログ    
ブログ    

推薦する

意見: 機械学習は私たちの注目を必要としています!

機械学習は、私たちがもっと注目する価値のある強力なテクノロジーです。機械学習アプリケーションについて...

ビル・ゲイツがダボス会議でAIについて語る: プログラマーはAIを使って生産性を50%向上させた

ダボスで開催された世界経済フォーラムで、マイクロソフトの元社長兼CEOのビル・ゲイツ氏が、ヤフー・フ...

パンデミックの中、大量のAIロボットが職務に就いている

2016年、著名な科学ライターでありシリコンバレーの投資家でもある呉軍氏は、大胆に次のように予測しま...

今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理...

人工知能はすでに人間の減量を手助けするのに忙しい

今日はカロリーを消費しましたか?近年、生活水準の向上や生活習慣の変化に伴い、肥満は徐々に多くの人々を...

自動運転業界は2021年に爆発的な成長を遂げるでしょうか?

2020年は自動運転業界が徐々に安定する年だ。ウェイモなどの巨大企業が商業化の模索を開始し、テスラ...

Nvidia が企業秘密を盗んだと非難される!ビデオ会議で証拠が明らかになり、関与した従業員は有罪を認めた

Nvidia はビデオ会議を開催しただけで訴えられたのですか? ? ?はい、きっかけはほんの数枚のコ...

...

2020年末レビュー: AIの失敗トップ10

これは、Synced の年末総集編「AI の失敗」の第 4 弾です。私たちの目標は、AI 研究を非難...

オペレーティング システムに関して、一般的に使用されているスケジューリング アルゴリズムをいくつ知っていますか?

オペレーティング システムには多くのスケジューリング アルゴリズムがあり、ジョブ スケジューリングに...

AI は今後 10 年間で BAT のリセット ボタンとなるでしょうか?

中国の王朝には必ず一つの法則がある。一代か二代で王位は行き詰まりを迎える。漢の時代には呂后の乱、唐の...

アンドロイドが電気羊に乗れるようになりました!世界初の四足ロボット羊:妹は座ると少し震える

「アンドロイドは電気羊の夢を見るか?」このジョークは半世紀以上にわたって、SFの世界からテクノロジー...

任意のデータセットに基づいて LLM (大規模言語モデル) ロボットを作成する

今日、偶然Embedchainというウェアハウスを見つけ、とても便利だと思ったので、皆さんとシェアし...

2020 年のデータサイエンスの 4 つの注目トレンド

データ サイエンスの新しい機能は進化を続け、あらゆる業界に浸透しています。世界中の組織がデジタル変革...