CMU は、復旦大学とオハイオ州立大学の研究者と共同で、モデルの理解度分析とモデル評価ランキングを組み合わせた研究支援ツールである ExplainaBoard を立ち上げました。これは、単一システムの診断、データセット分析、信頼性分析などのタスクを完了することができ、研究者の学術経験を効果的に向上させます。 論文を読んでいるときに他の人のアイデアは理にかなっていると感じても、自分のアイデアを設計するときにどこから始めればよいかわからないことがありますか? 「モデルはうまく機能しているが、詳細かつ包括的な説明がない」という理由で、レビュー担当者から低い評価を受けることがよくありますか? 新しいモデル構造の探索に疲れたとき、データセットの特性を探索して、分野の発展をより健全な方向に導くことに興味がありますか?新しい分野に初めて触れたとき、その分野の現在の開発状況やボトルネックをどうすれば素早く理解できるでしょうか? 少し前にインターネット上で白熱した議論を巻き起こした自動レビューシステムを覚えていますか? CMU のチームは最近、説明可能なシステムランキング (Explain a Board) を発表しました。これは科学研究の補助製品として位置付けられています。「モデル理解可能分析」と「モデル評価ランキング」という一見無関係な 2 つの要素を巧みに組み合わせ、日常の科学研究で重要でありながら見落とされがちな多くの部分を「ワンクリック」操作に変換し、研究者の学術体験を向上させます。 システムリンク: 論文リンク: 現在、ExplainaBoard は、単一タスクでは分類、抽出、生成を含む9 つの主流の NLP タスクをサポートしており、 40を超えるデータセットと300を超えるモデルが関係します。マルチタスクでは、 40を超える言語と9 つのクロス言語タスクを含む多言語評価ベンチマークをサポートしています。 技術通訳ディープラーニング モデルの急速な発展により、リーダーボードはさまざまなシステムのパフォーマンスを追跡するための主流のツールになりました。しかし、リーダーボードで上位にランクされるモデルには威信が伴うため、多くの研究者は、モデルの特性に関するより深い科学的理解を無視して、評価指標の数を改善することにのみ焦点を当てています。 ExplainaBoard はこのような背景から生まれました。ExplainaBoard はさまざまなモデルをランク付けするだけでなく、モデルやデータ セットに関連する、理解しやすくインタラクティブで信頼できる分析メカニズムを多数提供します (下の図を参照)。 具体的には、以下の機能を実行できます。 単一システム診断対処できる質問: 「私のモデルの得意なこと/苦手なことは何ですか? 」 診断システム解決できる質問: 「私のモデルは他のモデルと比べてどう優れているのか? 」 データセット分析回答可能な質問: 「データセットの特徴は何ですか? 」 一般的なエラー分析解決できる問題: 「システムの一般的な予測誤りのトップ 5 は何ですか? 」 きめ細かなエラー分析回答可能な質問: 「モデルの予測ミスはどこで発生するのか、そしてそれはどのようなものか? 」 システムの組み合わせ解決できる問題: 「上位 5 つのシステムを組み合わせると、より強力なシステムが得られますか? 」 信頼性分析答えられる質問:「モデルの予測はどの程度信頼できるか? 」 校正分析解決できる問題: 「予測の信頼性は、その正確さに応じてどのように調整されるか? 」 応募の見通し応用面では、プロジェクトリーダーの劉鵬飛博士によると、ExplainaBoardはDeepMind、Google、Huggingface、Paperswithcodeなど多くの企業から協力の招待を受けており、投資家の好意も得ているという。
|
<<: シーメンスは自動化を推進力として変革の新たな機会を捉える
>>: 新型コロナウイルスワクチンの製造はAIに頼っているのか?ジョンソン・エンド・ジョンソンとPwCがAIをどのように活用しているかを学ぶ
ロボット工学は医療分野で一般的になりつつあり、生物医学工学の分野における医療用ロボットへの資金提供が...
ACM ゴードン・ベル賞は 1987 年に設立され、計算機協会によって授与されます。スーパーコンピュ...
[[316046]]独自の NLP アプリケーションで使用できる 12 個のツールを見てみましょう。...
自動運転車が公道を走るようになると、必然的に道路上の「暗黙のルール」のいくつかを学習する必要が出てき...
[[121946]]序文以前、このブログでクイックソートアルゴリズムに関する人気のチュートリアル記事...
本日北京時間のデイリーメール紙の報道によると、有名な技術専門家は、今後10年間で人工知能技術の発展に...
ビッグデータダイジェスト制作著者: カレブ周知のとおり、Apple の App Store のポリシ...
[[286440]] ▲ イラスト出典:エドモン・デ・ハロ2016年、ロンドンに拠点を置くアルファ...
人工知能は、企業のデジタル変革の方法を変え、効率性、俊敏性、顧客中心の機能を最前線にもたらします。要...
最近、モスクワのバス運転手たちは少々パニックになっている。チャットグループでは、「バスの中でアジア人...
Alpaca、Vicuna、Baize、Koala などの多くの大規模言語モデルの出現により、研究者...