GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

仕事をうまくやり遂げたいなら、まず道具を研がなければなりません。

仕事で独自の ML プロジェクトを実施する前に、その分野の最先端の進歩を理解し、先人の経験を吸収する必要があります。

しかし、arXiv には毎日何百もの新しい論文が掲載されています。どれを読む価値があるのでしょうか?

この目的のために、Amazon のエンジニアである Eugene Yan 氏らは論文集を作成しました。この GitHub プロジェクトでは、Google、Amazon、Facebook などの大手企業のデータサイエンスや機械学習に関する論文やブログ投稿を継続的に共有しています。

これらの論文/記事は、検索ランキングから NLP や CV まで 24 の異なるカテゴリをカバーしており、こちらからご覧いただけます。

データ品質

データエンジニアリング

データマイニング

分類

戻る

推奨アルゴリズム

検索ランキング

埋め込み

自然言語処理

シーケンスモデリング

予測する

コンピュータビジョン

強化学習

異常検出

グラフィックス

最適化

情報抽出

弱い監督

生成する

効率

検証とA/Bテスト

倫理

練習する

失敗

現在の星評価は2.3kです。

推奨アルゴリズムを例に挙げてみましょう。

業界が異なれば、ビジネスも大きく異なります。アルゴリズムの基本的なフレームワークは似ていますが、正確な推奨モデルをトレーニングするには、細部にはまだ多くの違いがあります。

このリストには、電子商取引、ビデオ、音楽、コースなど、さまざまなビジネス向けの推奨アルゴリズム技術に関するブログ/論文が集められています。

たとえば、Alibaba の「Alibaba における E コマース推奨のための行動シーケンス トランスフォーマー」などです。

この論文では、Alibaba の電子商取引推奨システムにおける動作シーケンス Transformer の応用について紹介します。

研究者らは、Transformer モデルを使用して、ユーザーの行動シーケンスの背後にある連続的な信号をキャプチャし、パーソナライズされた推奨事項の有効性を高め、クリックスルー率を向上させることを提案しました。実験検証の後、彼らはこのモデルをオンラインの Taobao に展開し、この方法がベースラインと比較してオンラインのクリックスルー率を大幅に向上できることを実証しました。

論文リンク:
https://arxiv.org/abs/1905.06874

パーソナライズされた動画の推奨に関しては、YouTube、Netflix、TikTok の技術的ソリューションがすべて含まれています。

たとえば、YouTube の「YouTube のおすすめ機能のためのディープ ニューラル ネットワーク」は 1,039 回引用されています。

この論文では、ディープラーニングが YouTube の推奨システムにもたらす大幅なパフォーマンスの向上について強調しています。まず、研究者らはディープ候補ジャーニーモデルとディープランキングモデルを詳しく紹介しました。その後、研究者らは、膨大な数のユーザーを抱える大規模な推奨システムの設計、反復、維持から得た実践的な経験と洞察を論文で共有しました。

論文の宛先:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

さらに興味深いのは、この論文/記事のリストには失敗した経験もいくつか含まれていることです。

たとえば、Google フォトはかつて写真にタグを付ける際に重大なミスを犯しました。黒人を「ゴリラ」とラベル付けしたのです。

最近人気の GPT-3 は、その前身である GPT-2 の「バイアス」問題を解決していません。生成されたテキストでは、イスラム教徒は常に暴力と死に関連付けられています。

著者について

このプロジェクトの主な管理者は、Amazon の応用科学者 Eugene Yan です。

彼はシンガポール経営大学で心理学と人材管理の学士号を取得し、ジョージア工科大学でコンピューターサイエンスの修士号を取得しました。

現在の主なタスクは、消費者データを活用して機械学習システムを構築し、ユーザーエクスペリエンスを向上させることです。

ポータル

プロジェクトアドレス:
https://github.com/eugeneyan/applied-ml

<<:  顔認識の応用シナリオは拡大し続けています。顔スキャンは便利で安全である必要があります。

>>:  時間畳み込みネットワーク: 時系列の次の革命?

ブログ    
ブログ    

推薦する

...

戦場のアルファ碁:人工知能がもたらす軍事革命が静かに始まった

人工知能と機械学習が人間の世界を完全に変える運命にあることは疑いようがありません。これは軍事分野にも...

...

危険が迫っています!マスク氏、AIが5年以内に人間を超える可能性があると警告

[[335742]]メディアの報道によると、7月30日、マスク氏はニューヨークタイムズ紙との独占イン...

...

研究によると、AppleのCSAMスキャンアルゴリズムは簡単に騙される可能性がある

最近、インペリアル・カレッジ・ロンドンの研究チームは、画像の内容を変えずに画像内容をスキャンするアル...

GCN グラフ畳み込みネットワークの紹介

この記事では、GCN と呼ばれるよく知られたグラフ ニューラル ネットワークについて詳しく説明します...

人工知能を導入する際にプライバシーを保護するための 3 つの重要なセキュリティ対策

AI 戦略を導入する前に、企業はプライバシーを保護し、セキュリティ標準への準拠を確保するために新しい...

PaddlePaddle を使い始める: 対話システムにおける感情分析から始める

1. 背景人工知能の時代では、さまざまなディープラーニングフレームワークが普及しており、フレームワー...

本物と見間違えるほどリアルなAI変顔技術は本当に完璧なのか?

囲碁界の無敵の「アルファ碁」から、どこにでもある「顔認識」まで、機械学習は人々の生活に驚異的な変化を...

...

製造業の変革を促進、産業改革のためのAI主導ソリューション

製造業において、インダストリー 4.0 は単なる流行語ではなく、新たな現実となっています。新型コロナ...

Hadoop、Spark、Hive とはいったい何でしょうか? アルゴリズムを開発するには、これらを学ぶ必要がありますか?

[[422888]]みなさんこんにちは。私は梁唐です。最近、多くの新人がアルゴリズム エンジニアに...

人工知能の発展には限界が必要

一般的な理解によれば、人工知能とは、手動でしかできないタスクを、人間以​​外のツールで完了できること...