Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

ビッグデータ概要

編纂者:張南星、魏青、銭天培

マイクロソフトのような大企業は、どのような AI 人材を雇用できるのでしょうか?

AlphaGo を手書きで書ける天才になる必要があるのでしょうか? それとも、鋭い観察力を持ち、今後 20 年間の AI の発展の見通しをその場で想像できる必要があるのでしょうか?

もちろん違います!

今日、Wen Zhai Jun は Microsoft AI 面接の質問をいくつか見つけ、最も基本的な回答をしました。 (これは最も基本的な回答であることに注意してください。より良い回答を得るために、記事の最後にメッセージを残していただいても結構です。)

謎に包まれた Microsoft AI の面接の質問は、実は非常に取り組みやすいものです。一緒に答えてみましょう!

k 個のシーケンス(たとえば k=2)を結合して並べ替える

コードは上記の通りです。最も簡単な方法は、もちろんバブルソート法です。最も効率的ではありませんが、説明と実装は簡単です。

L1/L2 正則化メトリックの違いは何ですか?

L1 ノルム損失関数は、最小絶対差 (LAD) および最小絶対誤差 (LAE) とも呼ばれます。主な目的は、目標値 (y_i) と予測値 (f(x_i)) の絶対差の合計を最小化することです。

フォーミュラ1

L2 ノルム損失関数は、最小二乗誤差 (LSE) とも呼ばれます。これは主に、目標値(Yi)と予測値[f(xi)]の差の二乗の合計を最小化することにあります。

フォーミュラ2

エラーが大きい場合、L2 は L1 よりも大きなペナルティを与えます。さらに、L2 正則化を追加すると、モデル係数は 0 に収束しますが、完全にゼロにはなりません。一方、L1 損失関数では、一部の係数が完全にゼロになる可能性があります。

パーセンタイルを見つけるにはどうすればいいですか?

上記の質問を例に挙げてみましょう。過去 12 時間に、このショッピング モールを訪れた人は合計 1,000 人です。ショッピング モールの顧客数が全体の 30% に達したのはいつ頃でしょうか。

多項式回帰やスプライン平滑化などの手法を使用して、次の図を作成できます。

つまり、乗客数の30%は3,000人に相当します。

Y 値が 3000 の点から水平線を描きます。曲線と交差するときに垂直線を描き、水平軸上の対応する時間値を見つけます。

良い視覚化と悪い視覚化をどのように区別するのでしょうか?

この質問に対してはさまざまな答えがあるでしょう。たとえば、外れ値を適切に処理しない視覚化は、適切な視覚化とは言えません。

たとえば、一連の小さな数字の中に大きな数字が含まれる配列 ([1,2,3,4,7777,5,6,9,2,3]) がある場合、この配列を視覚化すると、次の図が表示されます。

右画像 → オリジナル画像、中央画像 → 正規化値、左画像 → 標準化値

このデータをより良く視覚化するにはどうすればよいでしょうか? 上の図に示すように、分析値を標準化または正規化しても、結果として得られる折れ線グラフではこの配列を適切に表現できません。私たちは何をすべきでしょうか? お気軽にメッセージを残してご意見をお聞かせください。

逆行列をより速く計算するにはどうすればいいでしょうか?

例えば、ガウス・ジョルダン法が考えられます。

2x2 行列であれば非常に簡単です。

逆行列は次のようになります。

ad-bc≠0

a と b を入れ替え、b と c の負数を取って、正方行列 ad-bc で割ります。

差異の定義

分散は、各データ ポイントとデータ セット全体の平均との差の二乗の合計です。言い換えれば、それはデータの変動性です。次の図は、分散が何であるかを非常によく説明しています。

まず、各犬の身長と平均身長の差を計算します。分散を計算するには、各差を二乗して合計し、平均を求めます。

最後に、この記事に登場するすべてのコードを以下に示します。

https://colab.research.google.com/drive/1DYimC5CEKeXdT15tbptifYL2v5MPkyHj

関連レポート:

https://towardsdatascience.com/my-take-on-microsoft-ai-interview-questions-with-interactive-code-part-1-c271388af633

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  畳み込みニューラル ネットワークの設計を始めたいですか?これは包括的なデザインガイドです

>>:  Scikit-learn をご存知ですか?これらの機能をご存知ですか?

ブログ    
ブログ    
ブログ    

推薦する

AI列車に乗ってみよう!マーケティングに人工知能を活用する3つの方法

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

ビッグニュース!人工知能における新たなブレークスルー! Google ストリートビューを使って住民の投票傾向を調べてみましょう。

研究者は、新たに開発された人工知能技術の助けを借りて、大量の画像を分析し、分類およびマイニング可能な...

私はトップ200のAIツールを調査しましたが、業界が少し飽和状態にあることがわかりました

LinkedIn では、機械学習の職種に応募する人の多くに 200 人を超える応募者がいます。 AI...

AI と ROI に関する真実: AI は本当に成果をもたらすことができるのか?

今日、企業組織はこれまで以上に人工知能 (AI) と機械学習 (ML) の可能性を信頼し、投資してい...

AI開発に最適なプログラミング言語トップ5

昨年、アルファ碁が世界中のチェスプレイヤー全員に勝利して以来、人工知能は注目を集めています。先日終了...

今年のGoogle I/Oカンファレンスは超「ハード」で、次世代のAIモデルも披露された

2022年のGoogle I/Oカンファレンスでは、参加者のほとんどがGoogleの社員であったにも...

人工知能を活用して顧客サービスを向上させる方法

顧客エンゲージメント、パーソナライゼーションなど、5 つの異なる領域で AI を使用して顧客サービス...

人工知能の力: ウェブ開発者がいまだに雇用されている理由

記事ソース| https://dzone.com/articles/the-power-of-ai-...

Transformer モデルを使用した時系列予測の Pytorch コード例

時系列予測は永続的なトピックです。自然言語処理の分野での成功に触発されて、トランスフォーマー モデル...

AIを活用した自動化はエンタープライズレベルの自動化2.0です

新たな常態に対応するために自動化プロセスを拡大多くの企業は、ニューノーマルに対処するための重要な技術...

最高人民検察院は、虚偽訴訟の監視に人工知能とビッグデータを活用することを検討している。

虚偽の訴訟は、他人の正当な権利と利益を侵害するだけでなく、社会の健全性を著しく損ない、司法の公平性、...

人工知能トレーナーという職業は魅力的ですか?

人工知能については誰もが知っていますが、人工知能トレーナーについてはどのくらい知っていますか? [[...

クルーズの自動運転意思決定・計画技術の分析

クルーズ社の自動運転意思決定計画および制御部門の責任者であるブランドン・バッソ氏は、コロンビア大学で...

データサイエンスを始めるにはどの程度のレベルの数学が必要ですか?

基礎科目として、数学はデータサイエンスと機械学習の両方において欠かせない役割を果たします。数学的な基...