「機械学習には数学は必要なく、多くのアルゴリズムがパッケージ化されており、パッケージを調整するだけでよい」という主張についてどう思いますか?

[[205087]]

あまり巧妙になりすぎずに、機械学習の学術界に触れ、すでに業界に入った人間の視点からお答えしたいと思います。

機械学習の実践者のほとんどは、数学に多くの時間と労力を費やす必要はなく、さまざまなアルゴリズムの適用シナリオに慣れ、いくつかのパラメータ調整テクニックを習得するために数学を使うべきだと私は思います。優れた数学的基礎があればモデルを簡潔かつ効率的にすることができますが、それが前提条件というわけではありません。

理由は次のとおりです。

1. ある程度の数学的基礎があっても、パラメータを調整したり最適化を実行したりする方法はまだわかりません。

これは少し自虐的に聞こえるかもしれませんが、自分自身に問いかけてみてください。精度が良くなく、損失が非常に高く、モデルが過剰適合していることに気付いたとき、数式をすばやく書き出して行列を操作することで、どこに問題があるのかを突き止めることができますか? 必ずしもそうとは限りません。確かに、より多くの統計原理を知ることは、問題がどこにあるのかを推測するのに役立ちます。損失関数を変更したり、新しい正規化子を追加したりすることはできますが、結果が必ずしも良くなるとは限りません。

機械学習の実践者にとって、数学的基礎はプログラマーにとってのデバッガーのようなものです。デバッガーは指示を与えてくれますが、問題を解決できることを保証するものではありません。では、どうすればこの問題を解決できるのでしょうか? 経験、経験、そして経験しかありません。他に方法はなく、時には直感に頼らなければならないこともあります。数学の基礎は内面的な強さの基礎として良いですが、もっと頻繁に物事を切り替えると、徐々にコツをつかむことができるので、「物事を切り替える」人を軽蔑する必要はありません。

2. 業界で適用できるモデルは非常に限られており、調整可能なパラメータも限られています。

業界では、モデルを選択する際に、説明可能性、効率性、システム全体との統合能力を非常に重視しています。たとえば、私の仕事では、回帰や決定木関連のアルゴリズム (ランダムフォレストなど) の使用にほとんどの時間を費やしています。これら 2 つのアルゴリズムが最適だからでしょうか? いいえ、これら 2 つのアルゴリズムは安定しており、効率的で、説明が簡単だからです。このようなモデルの場合、数学的なスキルが優れていても、調整できるパラメータは限られています。オンラインの例と経験に基づくと、多くのエンジニアは数学の基礎が弱くても良い結果を達成できます。

3. 数学/統計の知識は、既得権益者によって部外者に対して意図的に築かれた障壁となっている。

皆さんのうち何人が ML 研究に携わっているかはわかりません。私の個人的な観察では、成果を上げている ML 研究者の数は限られており、正式なトレーニングを受けた研究者が業界の空席を埋めるにはほど遠い状況です。したがって、転職した人に仕事を奪われるのではないかと心配する必要はなく、機械学習を行う資格を得るために行列や凸最適化などの数学的知識を理解していなければならないとわざわざ主張する必要もありません。私たちは皆、自分自身を売り込むためにここにいるので、お互いに物事を難しくする必要はありません。正直に言うと、職場の上司に「この人は使えない、私のような専門的な経歴のある人を使った方がいい」とよく言いますが、心の中では賛成できません。

Zhihu で誰かが機械学習の始め方を質問し、皆がすぐに PRML や Statistical Learning、そしてたくさんのオープンコースや数学のコースを読むことを勧めるのを見ると、私は心が痛みます。あなたの目標は皆を怖がらせることですか、それとも自分の優位性を誇示することですか?

4. 理論モデルと実際のアプリケーションはまったく別のものです。

2 番目と 3 番目のポイントに続いて、理論研究を行う者はブレークスルーに焦点を当て、新しいモデルや最適化手法を提案する必要があり、一方、応用研究を行う者はモデルをデータに適用し、商業的価値を獲得するよう努める必要があります。両者の間には利益相反はありません。理論を唱える人は正統派の雰囲気を醸し出すという利点があるため、より寛大に見えるはずです。この業界は、より多くの人々が「スイッチング」に取り組むことでのみ繁栄するでしょう。なぜなら、それは技術が実装され、実用的な価値をもたらすことができるということを証明するからです。

5. 業界の傾向としては、ツールを使いやすくすることであり、これにより車輪の再発明をせずに済みます。

Amazon、Google、Microsoft などの大手プラットフォームは、機械学習ツールを公開しています。以前は、さまざまなモデルを自分で記述する必要があり、より良いモデルは sklearn によって調整されていましたが、現在は Azure ML Studio によってコードが不要になるほど便利になっています。今年の初めに ML Studio を試してみたのですが、とても便利でした。グラフィックをドラッグしてつなげるだけでモデルが作れました。その時、私は自分が仕事を失いそうになったような気がしました。

6. もっと文学的な言い方をすれば、私たちはもっと寛容な態度を持ち、お互いを見下さないことが必要です。

ある主題について知りたい場合は、まずそれに興味を持ち、それから探求する意欲を持つ必要があります。 Hello Word を初めて見たときと同じように、この業界に新しく入った多くの人々は、機械学習が実用的な問題を解決できることを初めて見たとき、非常に興味を持つでしょう。

私が恐れているのは、機械学習を学び始める前に、行列分解の方法、トレースを使用した導関数の計算方法、最適化の方法を知っておく必要があると業界の人が言うことです。このサイクルは長すぎて、始める勇気すら出ない人も多いです。何事もまずは始めてみて、自分の欠点を見つけて、それから必要なものを補うのがいいと思います。

学問の世界は無料なので、私たちは扉を開いて、誰でも来て見学することを歓迎します。気に入らない場合は、隣に訪問していただいても結構です。しかし、家の入り口に高い階段を建てて、誰も入って来られないようにすべきではありません。時間が経てば、その場所が廃墟になるのは避けられません。

まとめると、機械学習のモデルや技術を適用するには、数学を全く知らない必要はなく、また実践者全員がさまざまな数学理論に精通する必要もないと私は考えています。モデルユーザーは常に理論に対する畏敬の念を持ち、「機械学習とはそういうものだ」と言って大々的に宣伝しようとすべきではありません。ただし、理論を扱う人は、自分が優れていて、他の人は二級市民であると感じる必要はありません。

よし、もう言葉はない、切り替えるよ（面白い）

<<: インターネットの未来のために: AI が生み出すものと破壊するもの

>>: 順序保存回帰: リソース利用を最大化するアルゴリズム