GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

GitHub で 2.3k スターを獲得した ML 論文のリストを入手し、自分の仕事に活用しましょう。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

仕事をうまくやり遂げたいなら、まず道具を研がなければなりません。

仕事で独自の ML プロジェクトを実施する前に、その分野の最先端の進歩を理解し、先人の経験を吸収する必要があります。

しかし、arXiv には毎日何百もの新しい論文が掲載されています。どれを読む価値があるのでしょうか?

この目的のために、Amazon のエンジニアである Eugene Yan 氏らは論文集を作成しました。この GitHub プロジェクトでは、Google、Amazon、Facebook などの大手企業のデータサイエンスや機械学習に関する論文やブログ投稿を継続的に共有しています。

これらの論文/記事は、検索ランキングから NLP や CV まで 24 の異なるカテゴリをカバーしており、こちらからご覧いただけます。

データ品質

データエンジニアリング

データマイニング

分類

戻る

推奨アルゴリズム

検索ランキング

埋め込み

自然言語処理

シーケンスモデリング

予測する

コンピュータビジョン

強化学習

異常検出

グラフィックス

最適化

情報抽出

弱い監督

生成する

効率

検証とA/Bテスト

倫理

練習する

失敗

現在の星評価は2.3kです。

推奨アルゴリズムを例に挙げてみましょう。

業界が異なれば、ビジネスも大きく異なります。アルゴリズムの基本的なフレームワークは似ていますが、正確な推奨モデルをトレーニングするには、細部にはまだ多くの違いがあります。

このリストには、電子商取引、ビデオ、音楽、コースなど、さまざまなビジネス向けの推奨アルゴリズム技術に関するブログ/論文が集められています。

たとえば、Alibaba の「Alibaba における E コマース推奨のための行動シーケンス トランスフォーマー」などです。

この論文では、Alibaba の電子商取引推奨システムにおける動作シーケンス Transformer の応用について紹介します。

研究者らは、Transformer モデルを使用して、ユーザーの行動シーケンスの背後にある連続的な信号をキャプチャし、パーソナライズされた推奨事項の有効性を高め、クリックスルー率を向上させることを提案しました。実験検証の後、彼らはこのモデルをオンラインの Taobao に展開し、この方法がベースラインと比較してオンラインのクリックスルー率を大幅に向上できることを実証しました。

論文リンク:
https://arxiv.org/abs/1905.06874

パーソナライズされた動画の推奨に関しては、YouTube、Netflix、TikTok の技術的ソリューションがすべて含まれています。

たとえば、YouTube の「YouTube のおすすめ機能のためのディープ ニューラル ネットワーク」は 1,039 回引用されています。

この論文では、ディープラーニングが YouTube の推奨システムにもたらす大幅なパフォーマンスの向上について強調しています。まず、研究者らはディープ候補ジャーニーモデルとディープランキングモデルを詳しく紹介しました。その後、研究者らは、膨大な数のユーザーを抱える大規模な推奨システムの設計、反復、維持から得た実践的な経験と洞察を論文で共有しました。

論文の宛先:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

さらに興味深いのは、この論文/記事のリストには失敗した経験もいくつか含まれていることです。

たとえば、Google フォトはかつて写真にタグを付ける際に重大なミスを犯しました。黒人を「ゴリラ」とラベル付けしたのです。

最近人気の GPT-3 は、その前身である GPT-2 の「バイアス」問題を解決していません。生成されたテキストでは、イスラム教徒は常に暴力と死に関連付けられています。

著者について

このプロジェクトの主な管理者は、Amazon の応用科学者 Eugene Yan です。

彼はシンガポール経営大学で心理学と人材管理の学士号を取得し、ジョージア工科大学でコンピューターサイエンスの修士号を取得しました。

現在の主なタスクは、消費者データを活用して機械学習システムを構築し、ユーザーエクスペリエンスを向上させることです。

ポータル

プロジェクトアドレス:
https://github.com/eugeneyan/applied-ml

<<:  顔認識の応用シナリオは拡大し続けています。顔スキャンは便利で安全である必要があります。

>>:  時間畳み込みネットワーク: 時系列の次の革命?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

「天機」が本日ネイチャー誌の表紙を飾る:清華大学のShi Luping氏のチームが世界初の異種融合脳型チップをリリース!

清華大学は、世界初の異種融合脳型コンピューティングチップ「天機チップ」を開発しました。このチップで駆...

Panda-Gym のロボットアームシミュレーションを使用したディープ Q 学習強化学習

強化学習 (RL) は、エージェントが試行錯誤を通じて環境内でどのように動作するかを学習できるように...

ビル・ゲイツ:人工知能に国境を簡単に引いてはいけない

[[260361]]新華社によると、ビル&メリンダ・ゲイツ財団の共同議長ビル・ゲイツ氏は最近スタンフ...

...

機械学習は自動化を成功させる鍵となるのでしょうか?

機械学習 (ML) は情報技術 (IT) の柱の 1 つであり、人工知能のサブセットとして定義できま...

百度の新しいAI翻訳機は80以上の言語をリアルタイムで翻訳できる

海外旅行の際、最大の問題は言語かもしれません。相手の言っていることを理解できれば、他のコミュニケーシ...

...

コンピュータビジョンによる3D再構成 - 自動運転に焦点を当てる

最近、私は何かに没頭しています。没頭するというのは、諦めるということではなく、むしろ醸成していくプロ...

App Store 中国、検索アルゴリズムを最適化:名前による検索を復活

約1週間の不安が去った後、国内のiOSアプリ開発者はようやく落ち着くことができた。中国におけるApp...

...

科学者たちは指紋の水分調節メカニズムを研究しており、これはロボットや義肢の開発に役立つだろう。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Pytorch の核心であるモデルの定義と構築を突破しましょう! ! !

こんにちは、Xiaozhuangです!今日はモデルの定義と構築についてお話ししましょう。初心者に最適...

Ruan Yifeng: Github のオブジェクトカウントアルゴリズム

Github を使用しているときに、次のプロンプトを見たことがありますか? $ gitクローン ht...

メタバース: 新たな人間コミュニティか、それとも徹底的な監視による「金儲けの道具」か?

バーチャルリアリティヘッドセットは何年も前から市場に出回っており、多くのティーンエイジャーもこれらの...