Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

ビッグデータ概要

編纂者:張南星、魏青、銭天培

マイクロソフトのような大企業は、どのような AI 人材を雇用できるのでしょうか?

AlphaGo を手書きで書ける天才になる必要があるのでしょうか? それとも、鋭い観察力を持ち、今後 20 年間の AI の発展の見通しをその場で想像できる必要があるのでしょうか?

もちろん違います!

今日、Wen Zhai Jun は Microsoft AI 面接の質問をいくつか見つけ、最も基本的な回答をしました。 (これは最も基本的な回答であることに注意してください。より良い回答を得るために、記事の最後にメッセージを残していただいても結構です。)

謎に包まれた Microsoft AI の面接の質問は、実は非常に取り組みやすいものです。一緒に答えてみましょう!

k 個のシーケンス(たとえば k=2)を結合して並べ替える

コードは上記の通りです。最も簡単な方法は、もちろんバブルソート法です。最も効率的ではありませんが、説明と実装は簡単です。

L1/L2 正則化メトリックの違いは何ですか?

L1 ノルム損失関数は、最小絶対差 (LAD) および最小絶対誤差 (LAE) とも呼ばれます。主な目的は、目標値 (y_i) と予測値 (f(x_i)) の絶対差の合計を最小化することです。

フォーミュラ1

L2 ノルム損失関数は、最小二乗誤差 (LSE) とも呼ばれます。これは主に、目標値(Yi)と予測値[f(xi)]の差の二乗の合計を最小化することにあります。

フォーミュラ2

エラーが大きい場合、L2 は L1 よりも大きなペナルティを与えます。さらに、L2 正則化を追加すると、モデル係数は 0 に収束しますが、完全にゼロにはなりません。一方、L1 損失関数では、一部の係数が完全にゼロになる可能性があります。

パーセンタイルを見つけるにはどうすればいいですか?

上記の質問を例に挙げてみましょう。過去 12 時間に、このショッピング モールを訪れた人は合計 1,000 人です。ショッピング モールの顧客数が全体の 30% に達したのはいつ頃でしょうか。

多項式回帰やスプライン平滑化などの手法を使用して、次の図を作成できます。

つまり、乗客数の30%は3,000人に相当します。

Y 値が 3000 の点から水平線を描きます。曲線と交差するときに垂直線を描き、水平軸上の対応する時間値を見つけます。

良い視覚化と悪い視覚化をどのように区別するのでしょうか?

この質問に対してはさまざまな答えがあるでしょう。たとえば、外れ値を適切に処理しない視覚化は、適切な視覚化とは言えません。

たとえば、一連の小さな数字の中に大きな数字が含まれる配列 ([1,2,3,4,7777,5,6,9,2,3]) がある場合、この配列を視覚化すると、次の図が表示されます。

右画像 → オリジナル画像、中央画像 → 正規化値、左画像 → 標準化値

このデータをより良く視覚化するにはどうすればよいでしょうか? 上の図に示すように、分析値を標準化または正規化しても、結果として得られる折れ線グラフではこの配列を適切に表現できません。私たちは何をすべきでしょうか? お気軽にメッセージを残してご意見をお聞かせください。

逆行列をより速く計算するにはどうすればいいでしょうか?

例えば、ガウス・ジョルダン法が考えられます。

2x2 行列であれば非常に簡単です。

逆行列は次のようになります。

ad-bc≠0

a と b を入れ替え、b と c の負数を取って、正方行列 ad-bc で割ります。

差異の定義

分散は、各データ ポイントとデータ セット全体の平均との差の二乗の合計です。言い換えれば、それはデータの変動性です。次の図は、分散が何であるかを非常によく説明しています。

まず、各犬の身長と平均身長の差を計算します。分散を計算するには、各差を二乗して合計し、平均を求めます。

最後に、この記事に登場するすべてのコードを以下に示します。

https://colab.research.google.com/drive/1DYimC5CEKeXdT15tbptifYL2v5MPkyHj

関連レポート:

https://towardsdatascience.com/my-take-on-microsoft-ai-interview-questions-with-interactive-code-part-1-c271388af633

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  畳み込みニューラル ネットワークの設計を始めたいですか?これは包括的なデザインガイドです

>>:  Scikit-learn をご存知ですか?これらの機能をご存知ですか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ルカン氏は再び冷や水を浴びせる: 本を読むことしかできない言語モデルが「人間のような知性」を達成することは決してないだろう

昨年のChatGPTのリリース以来、業界内外で大規模言語モデルへの熱狂が巻き起こり、Googleの社...

機械学習の経験を人生の指針に活用する: 学習効率を最大化する方法

[[185313]]原作者 | ライムンド・マンテローラ編集チーム | Aileen、Huang W...

アマゾン ウェブ サービスが中国で新たな機械学習サービスを開始

[51CTO.com からのオリジナル記事]現在、ますます多くの企業が機械学習や人工知能に多額の資金...

2024年に注目すべき主要な通信技術のトレンド

通信業界は、革新的な技術の発展と顧客の要求により急速に進化しています。 2024 年は、通信業界にと...

MITはレーザー彫刻機にAIを搭載し、材料を自動的に識別し、98%の精度で彫刻の強度を判定した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能: スマートシティを支える頭脳

[[347829]]私たちが知っているかどうかに関わらず、人工知能 (AI) はすでに私たちの生活の...

最短経路問題の探究: ダイクストラのアルゴリズム

[[386543]]前回、データ構造としてのグラフについて書きましたが、グラフ アルゴリズムのテスト...

Xunlei 創設者 Cheng Hao: 人工知能起業における 6 つの核心課題

編集者注:この記事はWeChatの公開アカウントHaoge Says(ID:haogetalks)か...

...

初心者向けガイド: 自然言語処理のためのニューラル ネットワーク

この記事を読むと、次のことがわかります。自然言語処理の分野に最も大きな影響を与えたニューラル ネット...

AIの「ショートカット」がシミュレーションを数十億倍高速化

[[314916]]シミュレーターは、NASA がエアロゾル モデルを使用してオーストラリアの火災に...

NVIDIA が 2023 年のトップ 10 研究プロジェクトを公式に発表しました。 「Neuro Angelo」はAIを使って3D仮想世界を作り出し、数秒で本物そっくりのダビデ像に変身する

2023年は人工知能が爆発的に成長する年となるでしょう。赤は人工知能、青は機械学習を表すマイクロソフ...

米国が新たなオープンソースAIアルゴリズムを開発:モザイクの美しさを自動修復

ぼやけた写真を見ると、本来の姿を復元したいという衝動にかられることはありませんか?以前の技術ではこれ...

自動運転自転車が発売されました。これを見た後ではもう運転したくありません!ホットカミング

Google Bikeが先行販売を開始しました。まだ自転車に乗りたいかなんて聞くまでもありません。車...

AI および機械学習プロジェクトはどの程度安全ですか?

[[355693]]人工知能と機械学習はメリットをもたらす一方で、新たな脆弱性ももたらします。この...