Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

ビッグデータ概要

編纂者:張南星、魏青、銭天培

マイクロソフトのような大企業は、どのような AI 人材を雇用できるのでしょうか?

AlphaGo を手書きで書ける天才になる必要があるのでしょうか? それとも、鋭い観察力を持ち、今後 20 年間の AI の発展の見通しをその場で想像できる必要があるのでしょうか?

もちろん違います!

今日、Wen Zhai Jun は Microsoft AI 面接の質問をいくつか見つけ、最も基本的な回答をしました。 (これは最も基本的な回答であることに注意してください。より良い回答を得るために、記事の最後にメッセージを残していただいても結構です。)

謎に包まれた Microsoft AI の面接の質問は、実は非常に取り組みやすいものです。一緒に答えてみましょう!

k 個のシーケンス(たとえば k=2)を結合して並べ替える

コードは上記の通りです。最も簡単な方法は、もちろんバブルソート法です。最も効率的ではありませんが、説明と実装は簡単です。

L1/L2 正則化メトリックの違いは何ですか?

L1 ノルム損失関数は、最小絶対差 (LAD) および最小絶対誤差 (LAE) とも呼ばれます。主な目的は、目標値 (y_i) と予測値 (f(x_i)) の絶対差の合計を最小化することです。

フォーミュラ1

L2 ノルム損失関数は、最小二乗誤差 (LSE) とも呼ばれます。これは主に、目標値(Yi)と予測値[f(xi)]の差の二乗の合計を最小化することにあります。

フォーミュラ2

エラーが大きい場合、L2 は L1 よりも大きなペナルティを与えます。さらに、L2 正則化を追加すると、モデル係数は 0 に収束しますが、完全にゼロにはなりません。一方、L1 損失関数では、一部の係数が完全にゼロになる可能性があります。

パーセンタイルを見つけるにはどうすればいいですか?

上記の質問を例に挙げてみましょう。過去 12 時間に、このショッピング モールを訪れた人は合計 1,000 人です。ショッピング モールの顧客数が全体の 30% に達したのはいつ頃でしょうか。

多項式回帰やスプライン平滑化などの手法を使用して、次の図を作成できます。

つまり、乗客数の30%は3,000人に相当します。

Y 値が 3000 の点から水平線を描きます。曲線と交差するときに垂直線を描き、水平軸上の対応する時間値を見つけます。

良い視覚化と悪い視覚化をどのように区別するのでしょうか?

この質問に対してはさまざまな答えがあるでしょう。たとえば、外れ値を適切に処理しない視覚化は、適切な視覚化とは言えません。

たとえば、一連の小さな数字の中に大きな数字が含まれる配列 ([1,2,3,4,7777,5,6,9,2,3]) がある場合、この配列を視覚化すると、次の図が表示されます。

右画像 → オリジナル画像、中央画像 → 正規化値、左画像 → 標準化値

このデータをより良く視覚化するにはどうすればよいでしょうか? 上の図に示すように、分析値を標準化または正規化しても、結果として得られる折れ線グラフではこの配列を適切に表現できません。私たちは何をすべきでしょうか? お気軽にメッセージを残してご意見をお聞かせください。

逆行列をより速く計算するにはどうすればいいでしょうか?

例えば、ガウス・ジョルダン法が考えられます。

2x2 行列であれば非常に簡単です。

逆行列は次のようになります。

ad-bc≠0

a と b を入れ替え、b と c の負数を取って、正方行列 ad-bc で割ります。

差異の定義

分散は、各データ ポイントとデータ セット全体の平均との差の二乗の合計です。言い換えれば、それはデータの変動性です。次の図は、分散が何であるかを非常によく説明しています。

まず、各犬の身長と平均身長の差を計算します。分散を計算するには、各差を二乗して合計し、平均を求めます。

最後に、この記事に登場するすべてのコードを以下に示します。

https://colab.research.google.com/drive/1DYimC5CEKeXdT15tbptifYL2v5MPkyHj

関連レポート:

https://towardsdatascience.com/my-take-on-microsoft-ai-interview-questions-with-interactive-code-part-1-c271388af633

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  畳み込みニューラル ネットワークの設計を始めたいですか?これは包括的なデザインガイドです

>>:  Scikit-learn をご存知ですか?これらの機能をご存知ですか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

オープンソースの大規模言語モデル (LLM) の概要

大規模言語モデル(LLM)は人工知能分野における重要な研究方向であり、ChatGPT以降急速な発展を...

...

ディープマインドの創業者はAIの弟子を育て、「訓練」ではなく「教育」によってAIに宝探しを教えた

最近、DeepMind は強化学習の分野で新しいことを行いました。簡単に言えば、DeepMind の...

OpenAI と Mistral AI によって人気を博した MoE の背景にあるストーリーとは?ハイブリッドアーキテクチャの導入に関する包括的なガイド

専門家の混合 (MoE) は、LLM の効率性と精度を向上させるためによく使用される手法です。このア...

クイックソートアルゴリズムの詳細な分析

[[121946]]序文以前、このブログでクイックソートアルゴリズムに関する人気のチュートリアル記事...

文化分野における人工知能の応用

近年、我が国の文化産業は人工知能などのハイテクをますます重視しており、文化と技術が深く有機的に融合す...

世界AIトップ100リストが発表、中国企業6社が選出

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

悪いことを学ぶのは簡単ですが、良いことを学ぶのは難しいです!人工知能は人間の人種や性別の偏見を継承する

編集者注: サンスティーンは『インターネット共和国』でアルゴリズムが私たちの認知世界に影響を与えると...

MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

データベース市場でMySQLの地位を揺るがすようなデータベースが登場したのは久しぶりのようです。主要...

メタバースは過大評価されてきたが、2050年までにAIによって現実のものとなる

メタバースの概念が誇張され、まるでそれが本当に存在するかのように人々が話していることは間違いありませ...

...

静的解析に機械学習を使用する方法

機械学習と人工知能は、特にマーケティング分析とサイバーセキュリティの分野で多くの分野で広く応用されて...

Amazon Translateについて

Amazon Translate は、高速、高品質、手頃な価格の言語翻訳を提供するニューラル機械翻訳...

画像認識のためのトップ 5 プログラミング言語

この間、ゴミの分別に関するミニプログラムやアプリの登場により、画像認識が再び人々の注目を集めています...