AIはすでにLeetCodeを実行できる

AIはすでにLeetCodeを実行できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI はすでに、面接で遭遇する次のようなアルゴリズム的な質問を解くことができます。

論文の引用数を記録する配列の場合、各要素は負でない整数です。これらの論文の h 指数 (つまり、最大 h 件の論文が少なくとも h 回引用されている) を出力する関数 h_index を記述してください。
例:
入力: [3, 0, 6, 1, 4]
出力: 3

AI が出した Python の答えは次のとおりです。

counts.sort(reverse = True) が役に立たず、人々の血圧を上昇させることを除けば、テストに合格したと見なすことができます。

カリフォルニア大学バークレー校の研究チームは、上記の質問を「面接レベル」の難易度に分類しました(海外のプログラマーの面接の質問は少し簡単なようです)。

さらに、より簡単な「入門レベル」とより難しい「競技レベル」があり、合計5,000問のテストのうち、AIが回答できるのは15%です

また、GPT-2 を使用して LeetCode 専用の AI をトレーニングし、タスクの 80%を完了できたと主張する人もいました。

LeetCode を磨くときに震えていませんか?

GPT-NeoがGPT-3に勝利

この研究で使用された質問形式は自然言語の質問幹であり、これは以前の研究で一般的に使用された疑似コードとコード間の翻訳とは異なります。

質問は、Codeforces、Kattis、その他の質問練習ウェブサイトから収集された 10,000 問で、そのうち 5,000 問はトレーニングに使用され、残りの 5,000 問はテスト セットとして使用されます。

質問の幹の平均の長さは 293.2 語で、テスト セットには質問ごとに平均 21.2 のテスト ケースがあります。

複雑なアルゴリズムを必要とせず、1~2 年の経験を持つプログラマーが回答できる初級レベルの質問が 3,639 問あります。

面接レベルの質問には、ツリーやグラフなどのデータ構造に関するものや、一般的なアルゴリズムの変更を必要とするものなどがあり、その数は 5,000 に上ります。

残りは、USACO、IOI、ACM などの大会レベルに達する競技レベルの難易度です。

研究者らは、GPT-2、GPT-3、そして「高度模倣版」 GPT-Neoの1億パラメータ版と15億パラメータ版を訓練した。

パラメータスケールが「わずか」 27億のGPT-Neoと、さらにパラメータスケールが低いGPT-2は、パラメータスケールが1750億のGPT-3よりもテストケース合格率で優れています。

厳密モードでは、すべてのテストケースに合格すると完全に正解とみなされます。最高のパフォーマンスを示した GPT-Neo は 1.12% しか合格しませんでしたが、それは56問です (いずれにしても私よりは優れています)。

GPT-Neo は、GPT を再現しようとする EleutherAI チームのオープンソース プロジェクトです。

パラメータスケールは GPT-3 よりもはるかに小さいですが、トレーニングデータには Stack OverFlow や Stack Exchange などの技術的な Web サイトがより多く含まれており、これがコード生成で勝っている理由の 1 つであると考えられます。

GPT-3 のパフォーマンスが GPT-2 よりも悪い理由については、テキストが多すぎるためではないかと推測する人もいます。自然言語の生成は得意ですが、ロジックと問題解決には過剰適合しています

AI「テストソルバー」を評価する方法

論文が発表されるや否や、人々の想像力は驚愕した。

面接に合格しなかったが、私が書いたアルゴリズムが合格した場合はどうなるのでしょうか?

誰かが彼に答えました。

問題ありません。あなたはアルゴリズムのアシスタントになることができます。

次のステップについては、多くの人が「自己回帰GPT の代わりに自動エンコーディング言語モデルを使用するとどうなるか」といった提案をしています。たとえば、 CodeTrans

あるいは、GPT を使用して、回答できない質問を生成します。

△ 葛藤があるんですよね?

楽観主義者は、これによって人々の創造性が解放され、将来のプログラミングではコードの記述が少なくなり、アーキテクチャとエンジニアリングの作業が増えると考えています。

要件を記述するだけでコードを生成できたら素晴らしいだろうと考える人もいます。

こんにちは、IDE。データベースを使用して、JavaScript の追加、クエリ、変更、削除操作をテストとともに実行したいと考えています。

△ Ruby on Railsは良い選択です

悲観論者は、将来、人間のプログラマーはメンテナンス作業と機械生成コードのレビューしかできなくなるだろうと考えています。

AI「テストソルバー」が怖いですか?

論文の宛先:
https://arxiv.org/abs/2105.09938

データセットアドレス:
https://github.com/hendrycks/apps

LeetCode プロジェクトを自動的に更新します:
https://github.com/gagan3012/プロジェクトコードpy

<<:  清華大学とアリババDAMOアカデミーが開発した業界初の少数サンプルNERデータセット

>>:  次世代ビジネスインテリジェンスのトレンドと機会

推薦する

人工知能の代表的な応用分野トップ10の一覧と技術原理の図解

[[329146]]この記事では、「アルゴリズム」という単語を非常に簡略化して使用し、単一のアルゴリ...

SAPはイノベーションで顧客の成功を支援し、AI時代のデータ主導のビジネス変革の未来を形作ります

SAP は、AI 時代において顧客がデータの潜在能力を最大限に活用し、より深い洞察、より速い成長、よ...

この記事では人工知能とは何かを徹底的に解説します!

人工知能 (AI) は、自然科学のさまざまな分野を網羅しており、主に特定の種類の知的な人間の活動をモ...

絶対に対立なんかじゃない!短期的にはAIが人間に取って代わることができない5つの分野

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

インテリジェント車両認識技術がスマートシティへの道を開く

著者:Chris Kadoch 氏は Rekor Systems の最高技術責任者です。 [[376...

...

Alibaba Damo AcademyのJin Rong氏:テクノロジーから科学へ、中国のAIはどこへ向かうのか?

ダートマス会議から数えると、AIは65年の歴史を歩んできました。特に近年のディープラーニングの台頭に...

マイクロソフトはIBMとアマゾンに続き、警察への顔認識技術の販売を拒否

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

グラフなしの ICLR'24 のための新しいアイデア! LaneSegNet: 車線セグメンテーションを考慮したマップ学習

序文と著者の個人的な理解自動運転システムの下流アプリケーションにとって重要な情報である地図は、通常、...

AIは人間ではないため、米国特許庁はAIの発明の全てを認めない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

スマートシティで人工知能の可能性を最大限に引き出すにはどうすればよいでしょうか?

スマート シティ コンセプトの中心にあるのは、情報通信技術 (ICT) の力を活用して都市の課題に対...

人工知能をより賢くするにはどうすればいいでしょうか?オープンソースプラットフォームが必要です

[[332916]]ニーダーザクセン州オスナブリュック、2020年6月19日:メラニー・プロッパ先生...

TikTok本社は米国に残り、ByteDanceが管理権とコアアルゴリズムを保持する

事情に詳しい関係者らは、米政府に提出した提案に基づき、バイトダンスがティックトックの本社を米国内に維...

...