大規模な論文を読むための素晴らしいツールがここにあります! 67ページの論文を5秒で翻訳し、スクリーンショットを撮って直接質問し、Webページで試してみる

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

昨晩、NetEase Youdaoの「Zi Yue」教育モデルが正式にリリースされました。

このビッグモデルは「偽物ではない」ため、リリースされるとすぐに使用でき、誰でも遊ぶことができます。たとえば、Youdao Translationデスクトップバージョンでは、すでにビッグモデルのAIボックス機能がリリースされています。

最も興味深い使用法の 1 つは、大きなモデルを使用して論文を読むことです。これは、Web 上で試すことができるYoudao の速読機能です。

写真

論文をアップロードしてから数秒以内に、ビッグモデルがそれを素早く翻訳し、テキストで質問できるだけでなく、わからない質問に答えるためにスクリーンショットを撮ることもできます。

NetEase Youdaoは記者会見で、「Zi Yue」モデルの全体的な会話能力はChatGPTほど優れていないものの、論文を読む際には独自のスキルを備えていると紹介した。

結局のところ、ChatGPT は長い論文を読むことができないというのはよく知られた事実です。

しかし、NetEase Youdaoの主任科学者であるDuan Yitao氏は次のように述べた。

「Zi Yue」大規模モデルはChatGPTソリューションとは多少異なり、「次のコンテキストを読み取った後に前のコンテキストを忘れる」という問題は発生しません。

では、論文を読む上での「字月」の秘訣とは何でしょうか。また、実際に使用するとどれほど効果があるのでしょうか。

論文を速読するためのヒントは何ですか?

多くの AI 論文読み上げアプリと同様に、 Youdao Speed Readingでも論文を素早く読み上げることができます。

ここでは、数学に関する AI 論文をアップロードしてみます。大規模なモデルがテキスト全体を翻訳するのに約5 秒かかります。

特定の段落に焦点を当てたい場合は、各翻訳に対応する元のテキストをマークすることができます。

次に、テキストとスクリーンショットを使用して論文のあらゆる詳細について質問することができ、大きなモデルがそれに答えることができます。

たとえば、この論文のハイライトと、それが以前の研究と比べてどのように改善されているかを簡単に説明します。

数秒以内に回答できるだけでなく、情報源をマークして「間違ったことを言う」ことを避けることもできます。

理解できない特定の固有名詞がある場合は、ワンクリックでその単語をハイライトし、文章の説明を求めることができます。

Youdao Speed Readingは文脈を結び付け、その起源と使用法を分析できます。

もちろん、ChatGPTと比較すると、わからないセクションのスクリーンショットを直接撮る方が便利です。

最後に、論文を簡単に要約してみましょう。また、結果を素早く提示し、論文で引用されている情報の出典を特定して、「間違ったことを言っている」かどうかをチェックすることもできます。

このように、論文をじっくり読みたい場合でも、「量子速度読書」を達成したい場合でも、NetEase Youdao を使用するとすぐに完了できます。

しかし、経験の中で、まだ完璧ではない機能もいくつか見つかりました。たとえば、このビッグモデルではオンラインで情報を検索できません。論文に関連する引用数や同僚による関連研究を知りたい場合、ビッグモデルでは答えられません。

これらの質問に答えるために、私たちはNetEase YoudaoのCEOである周鋒氏とNetEase Youdaoの主任科学者である段一涛氏にも話を聞き、「Zi Yue」論文読解モデルの背後にある原理を理解しました。

Duan Yitao氏は、大型モデルは現時点ではインターネットに接続する機能はないが、「複数の文書を連続して読み取る」能力はすでに備えていると紹介した。

つまり、「オンラインで情報を検索する」機能はありませんが、異なる論文間の関係性を把握したい場合は、複数の文書をアップロードして、大きなモデルに複数の論文を同時に読み取らせることができます。

複数のドキュメントを連続して読み取る機能はありませんが、この機能は大規模なモデルに対応するために拡張できます。ネットワーク機能に関しては、将来的に検討される可能性もありますが、現時点での主な改善点は、専門用語の翻訳と文書の解析機能です。

また、ChatGPT をはじめ、多くの大規模モデルの製品では、「長いテキスト」を完全に読み取る機能がなく、前のテキストを読んだ後に次のテキストを忘れてしまうことがあります。「紫月」の大型モデルでもこの問題は発生するのでしょうか？

Duan Yitao 氏は、NetEase のビッグモデルソリューションは ChatGPT とは若干異なると述べました。NetEase はベクトルデータベースを使用して「メモリ」の向上に役立てています。

つまり、アップロードされた論文はビッグモデルによって分析・分割され、検索機能を使用して質問の関連する断片が検索されるため、「文脈を忘れる」という問題は発生しません。

周鋒氏はさらにこう説明した。

この分野ではベクターデータベースも人気のある方向性です。

長いテキストを解釈する大規模モデルの能力だけに頼ると、主にその答えが間違っている可能性があるため、その答えを信頼できない可能性があります。しかし、独自の知識ベースを定義するのと同等のベクトルデータベースを使用すると、この問題を解決できます。

AI機能も多数導入

網易優道は、優道速読のほかにも、「優道」モデルに基づいた5つの製品を開発しました。

LLM 翻訳、バーチャル口頭コーチ、AI ライティングガイダンス、文法トレーニング、AI ボックス。

たとえば、デスクトップ版のYoudao辞書では、 AIボックス機能が全面的に導入され、英語の文章を直接磨くことができます。

単語のハイライトをオンにすると、Web ページ上でそれを使用して、文書内にすでに書かれている英語の文章を、専門的、口語的、よりフレンドリー、よりゴージャスなど、希望どおりに直接書き換えることもできます。

塩分の多い食生活の人にとっては朗報と言えるでしょう。

さらに、大型モデルを搭載したバーチャルオーラルコーチ「Hi Echo」もございます。

これは、Android フォンで直接試すことができる英語のスピーキング練習アプリです。

「通話に応答」した後、英語でEchoとランダムに会話することができます。ビッグモデル機能に基づいてシーンとコンテキストを理解し、フィードバックを提供します。

会話の後、Echo は発音、文法、その他の側面に基づいて提案や「スコア」も提供し、誰もが自分の発音や文法のどこに問題があるかを把握して、より上手に話す練習をすることができます。

さらに、「Zi Yue」大模型には、英語の宿題を書く際の問題を解決するための文法解説機能も搭載されています。

記者会見では、大学入試や高校入試の実際の英語テスト問題が例として使用されました。「Zi Yue」モデルに基づいて、このアプリケーションは確かに的を絞った問題解決のアイデアと方法を提供し、類似のテスト問題を推奨することで、学生が1つの事例から別の事例へと推論を導き、カリキュラムのテストポイントを真に理解するのに役立ちます。

また、文章作成ガイダンス機能もあり、これは特に、資料が足りない、文章が書けない、主題が見つからない、話題から逸れてしまうなどの問題を解決するために設計されています。修正プロセス中、AI ライティングガイダンスは、表現、構造、コンテンツの深さ、感情の豊かさという 4 つの側面から総合的な改善提案も提供します。

現段階でビッグモデルが何ができるかについて、NetEase Youdao CEO の周鋒氏は興味深い比喩を使った。

今日の大型モデルには、一定の思考能力が備わっています。これまでの AI と異なる点は、言語推論の能力はあるものの、話す文章や話す単語ごとに、基本的にそれほど深く考えることができないという点です。

例え話をしましょう。酔っ払って話しているようなものですよね？私は特に深く考えることはできませんが、非常に流暢に、そして絶えず話します。

NetEaseの「Zi Yue」の大型モデル機能に興味がある方は、下のURLをクリックして体験してみてください〜

紙の速読: https://read.youdao.com/

その他の機能トライアルアドレス: https://aicenter.youdao.com/

<<: 「初の常温常圧超伝導体」に対する共同研究者の反応：内容に欠陥あり

>>: 精度が極めて低いです! OpenAIがAI検出器を削除、ICMLの傑出した論文が非難される

大規模な論文を読むための素晴らしいツールがここにあります! 67ページの論文を5秒で翻訳し、スクリーンショットを撮って直接質問し、Webページで試してみる

論文を速読するためのヒントは何ですか?

AI機能も多数導入

インターネットの大失敗: 破壊された破壊者

Photoshop 2020が登場、人工知能でデザインが簡単に

PaddlePaddle をベースに構築された産業グレードの ICNET アプリケーションの予測速度は、TensorFlow を 20% 上回ります。

強化学習とゲーム理論を活用して、EAのテストAIは賢いものになった

GitHub の年末特典: プログラミングチャットボットがすべてのユーザーに公開され、ネットユーザーはこれをゲームチェンジャーと呼ぶ

5分で初めてのPythonチャットボットを構築

Nacos ランダムウェイト負荷分散アルゴリズム

2020年にスパムはなくなるでしょうか？

推薦する

ついにビッグデータ、機械学習、データサイエンスをわかりやすく説明する人が出てきた

1 つの記事で 4 つの基本的なニューラルネットワークアーキテクチャを理解する

深い思考：テイクアウトの背後にある人工知能アルゴリズムの秘密

外国人の機械学習エンジニアは失業に直面しているのに、なぜ彼らはまだMLの学習にこだわるのでしょうか?

鍵となるのは人工知能コンピューティングセンターを構築し、それを活用することだ

以前保存した Keras モデルをロードすると結果が異なる理由: 経験と教訓

女神の若々しい姿が全開！テンセントのAIモデルGFPGANがGitHubのホットリストで1位に

脳をシミュレートする NLP、クヌース賞受賞: 文解析のためのニューロン集団計算

AIが産業のデジタル変革をどのように促進するか

Google AI ビデオがまた大ヒット！オールラウンドなユニバーサルビジュアルエンコーダーであるVideoPrismに30のSOTAパフォーマンスアップデートが実装されました

単一の GPU のみを使用して 7B モデルを微調整します。ユニバーサルマルチモーダルツール LLaMA-Adapter は閾値を取り除き、その効果は驚くべきものです

清華大学の趙明国氏：AIチップ＋ロボット、アルゴリズムのボトルネックを突破

AIアプリケーションの実践と業界のエンパワーメントに焦点を当てたWOT2019グローバル人工知能カンファレンスが成功裏に終了しました。