無料の AI ベスト論文検索ツール: ワンクリックで結果を表示し、数分で論文の表とデータを抽出

無料の AI ベスト論文検索ツール: ワンクリックで結果を表示し、数分で論文の表とデータを抽出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習はどんどん普及してきており、学ばないと時代に取り残されてしまう気がします。

しかし、論文を読むのは時間がかかり、面倒で、指示がなければ費用もかかる可能性があります。

機械学習に関する論文は本当にたくさんあります。

Google の AI 専門家であり、Google Brain の責任者でもあるジェフ・ディーン氏は、精密な計算を行った結果、平均して毎日 100 件の新しい機械学習論文が世界中で発表されているという数字を導き出しました。

これはちょうど1年前の結果です。

では、この膨大な論文の海の中から最高の論文を見つけるにはどうすればいいのでしょうか?

多くの役に立つ記事で、「AI のあらゆる分野の情報を見つけるための最良のツール」として知られる Papers with Code という Web サイトが言及されていると思います。

そして今、Papers With Code はメジャーアップデートを受け、Reddit のホットリストに載っています。ネットユーザーは「素晴らしい!」と言っています。

現在、ウェブサイトには 2,500 を超えるランキングと 20,000 を超える論文結果が掲載されています。

さらに、結果を arXiv の表に直接リンクできるようになり、結果をクリックするだけで論文の結果を抽出できるようになりました。

では早速、見ていきましょう。

論文検索ツールの大幅なアップデート

このアップデートは、主に新しい結果インターフェース、自動結果抽出、大規模なデータベース更新の 3 つの側面から構成されます。

まず最初に、結果を arXiv 論文の元の表に直接リンクする新しい結果インターフェースです。

たとえば、この ImageNet ランキングを見ると、下の結果の行の 1 つをクリックすると、論文内の表に直接リンクできます。より直感的でわかりやすいと思いませんか?

さらに、この新しいインターフェースは新しい論文の結果エディターとしても機能し、ユーザーは論文の結果をコミュニティに直接追加することができ、その結果は内部テーブルに直接リンクされます。

このインターフェースは現在、LaTex ソースを含む arXiv 論文でのみ機能することに注意してください。

次に、結果の抽出を自動化します。

同社は過去1年間、機械学習の論文から結果を自動的に抽出することに取り組んできた。

現在、生産における結果抽出のための新しい人間とコンピュータの相互作用システムがあります。私たちのモデルは、arXiv ML 論文ごとに、人間が受け入れたり拒否したりできる推奨事項を生成できます。このシステムは、性能が大幅に向上したため、従来の最先端システムよりも実用的なアプリケーションに適しています。

関連する手法は arXiv で公開され、GitHub でオープンソース化されています。また、トレーニング モデルの結果抽出用に構造化注釈付きデータセットもリリースされており、将来の最適化の向上が期待されています。また、このタスクでのモデルのパフォーマンスを評価するためのデータセットもリリースされています。

さらに、リソースデータも大幅に拡張されました。現在、ウェブサイトには 800 を超える新しいリーダーボードと 5,500 を超える新しい結果が掲載されています。すべてのデータは無料のオープンデータライセンスの下で利用可能であり、ここから JSON 形式でダウンロードすることもできます。

コード付き論文について

Papers with Code は、機械学習愛好家が最新の公開論文やソースコードを追跡し、最先端の技術の進歩を迅速に理解できるように支援することを目的として、2018 年 7 月に設立されました。

このウェブサイトは、CV、NLP、医療、音声、ゲーム、タイミング、オーディオ、ロボット工学、音楽、推論、コンピュータ コードなどの幅広い ML 分野をカバーしています。

ウェブサイト上のすべてのコンテンツは編集可能でバージョン管理されています。

ホームページに直感的なインデックスがあります。

また、各フィールドの下には、論文ランキングだけでなく、それに関連付けられたコードも表示されます。

このウェブサイトは、arXiv 上の最新の機械学習論文と GitHub 上のコードをマッチングさせ、ユーザーがタイトルのキーワードで検索したり、「注目の研究」を人気度や GitHub コレクションの数で並べ替えたりできるようにしています。

履歴書を例に挙げてみましょう。

コンピューター ビジョンは、セマンティック セグメンテーション、画像分類、オブジェクト検出、画像生成、ノイズ除去の 5 つのサブカテゴリに分かれています。

セマンティックセグメンテーションのカテゴリをクリックすると、まずセマンティックセグメンテーションの簡単な紹介が表示され、その後に論文のランキングが表示されます。

見たい論文とコードをクリックするだけです。

Papers with Code ウェブサイトを運営する会社は、英国ロンドンに拠点を置く Atlas ML で、創設者は Robert Stojnic 氏と Ross Taylor 氏です。

創設者の一人であるロバート・ストイニック氏は、2012年にケンブリッジ大学で計算生物学の博士号を取得しました。 2018 年 7 月に Atlas ML とウェブサイト Papers with Code を設立し、現在は Atlas ML の CEO を務めています。

[[333583]]

ロス・テイラーは、2014 年にケンブリッジ大学で経済学の修士号を取得しました。卒業後は金融業界でソフトウェア開発と機械学習モデル設計に従事しました。2018 年に Atlas ML を共同設立し、現在は CTO を務めています。

昨年末、設立からわずか1年ちょっとのPapers with CodeがFacebook AIへの正式統合を発表した。しかし、両者は引き続きプラットフォームの独立性を維持しており、関連サービスやコミュニティ、ウェブサイトの運営や交流方法に変更はない。

もう一つ

このような高品質のリソース Web サイトを紹介した後でも、論文をどのように読むのか疑問に思うかもしれません。

以前、清華大学の特別賞受賞学生である Gao Tianyu 氏による記事を掲載しました。その中で、論文の探し方や論文研究のヒントが紹介されていました。

まず、論文を分類します。

現在のトピックに関連する論文を包括的に把握し、それぞれの論文についてある程度理解する必要があります。

一方で、これらの研究自体はあなたの研究に非常に関連していますが、他方で、「トピックの衝突」の場合、あなたが取り組んでいるプロジェクトは、他の人によって先に突破されている可能性があります。

他のサブフィールドや他の分野の論文は、現在の研究にあまり刺激を与えない可能性があるため、読み飛ばしてもかまいません。しかし、それが研究分野全体にとって指導的な意義を持つ場合や、大きな進歩や成果を達成した場合には、慎重に研究し、要約する必要があります。

この題名に応えて、高天宇は水文学の第一法則も提唱した。

タイトルが長いほど、水文学に関するものである可能性が高くなります。タイトルが短いほど、より有用な情報が含まれることが多いです。

また、文書管理ツールや論文の読み方のヒントなどもシェアしていますので、ぜひ読んでみたい方は下記リンクをクリックしてください!

<<:  今日のビジネスにおける自然言語処理の 8 つの応用

>>:  EasyDL Professional Notebookモデリング機能の詳しい説明

ブログ    

推薦する

ロボットもこのように遊べるのでしょうか?自分の目で確認したら、これが私の欲しいロボットだ!

「タイムレイダース」を覚えていますか? 1つは1999年、もう1つは2018年のもので、わずか19年...

Gemini vs ChatGPT: Google の最新 AI と ChatGPT のどちらが優れているのでしょうか?

Google は、最新かつ最も強力な AI モデルである Gemini 1.0 を発表し、AI の...

...

GitHub CEO: AIはプログラマーに取って代わることはできない

GitHub の CEO である Thomas Dohmke 氏は最近、人工知能とソフトウェア開発の...

ビッグデータとAIの連携

人工知能と機械学習は、組織がビッグデータからより優れたビジネス洞察を得るのにどのように役立つのでしょ...

AI業界の「第2の成長曲線」を牽引する清華大学傘下のRealAIが第3世代のAI製品をリリース

12月9日、清華大学人工知能研究所、北京市知源人工知能研究所、北京市瑞来スマートテクノロジー株式会社...

ビッグデータアルゴリズムとアプリケーションシナリオパート1: 統計と分布

アルゴリズムはビッグデータの最も価値のある部分です。ビッグデータマイニングとは、大量、不完全、ノイズ...

7つのダイナミックなトレンドが将来のAIサービス市場を形作る

[Lieyun.com (WeChat ID: )] 9月14日レポート(小白訳)ソフトウェアは世界...

...

Equinix CIO: AI を活用して潜在能力の高いパートナーを見つける

多国籍データ インフラストラクチャ企業である Equinix は、機械学習の確率モデルを使用して潜在...

Fudan DISC、クロスビジュアル言語モダリティ事前トレーニングモデルMVPTRを発表

復旦大学データインテリジェンスおよびソーシャルコンピューティング研究所復旦大学のデータインテリジェン...

英国で今年、自動運転車が合法化される

[[397045]]画像ソース: https://pixabay.com/images/id-358...

Wi-Fi の AI がワイヤレス接続をどのように形作るか

2023年までに、おそらく人工知能ほど普及するテクノロジーはなくなるでしょう。生成型 AI の爆発的...

AI投資を最大限に活用するための6つのステップ

人工知能は、将来の発展にとって大きな破壊的技術の 1 つであるとよく考えられています。これにより、多...