[51CTO.com からのオリジナル記事] データマイニングと機械学習は、今日の社会では長い間、古典的かつ人気のあるテクノロジーとなっています。関連技術を導入し、社会に大きな利益をもたらしている企業は数多くあります。 Scikit-Learn、Pandas、R、Spark MLLib など、多くの人気のあるデータマイニング ソフトウェアがあり、実践者の日常的な開発とデータ分析作業を大幅に促進します。 オープンソースソフトウェアが普及している今日の世界では、従来の有料ソフトウェアは見過ごされがちです。しかし、Matlab、Mathematica、Maple、Stataなどの数学およびコンピュータソフトウェアは人々に大きな利便性を提供し、オープンソースソフトウェアにはない多くの機能を備えています。今日に至るまで、それらは依然としてあらゆる分野でかけがえのない役割を果たしています。 Stata は、30 年以上の歴史を持つ優れた統計学習ソフトウェアとして、統計学習のための強力なソリューションを提供します。現在のバージョンは 16.0 にアップデートされました。この記事では、Stata の概要を紹介し、回帰分析に Stata を使用する方法を紹介します。 まず、UCLA の学校評価データセットをダウンロードします。
データセットを取得した後、回帰分析を実行する必要がある場合は、次のコマンドを実行するだけです。
新しい変数を予測する必要がある場合は、次のコマンドを実行します。
モデルの残差を表示する必要がある場合は、次のコマンドを実行します。
Stata の最も魅力的な点は、基本的な回帰分析機能に加えて、独自の最適化パラメータ選択機能を提供していることです。Lasso 回帰や Ridge 回帰を計算する場合、最適化関数にペナルティ項があることはご存じのとおりです。ペナルティ項の前の係数をどのように選択するかは、数学界を何十年も悩ませてきた難しい問題であり、数年前まで解決されていませんでした。 Stata はこの点に関して 2 つのアルゴリズムを提供します。1 つはプラグイン メソッド、もう 1 つはクロス検証メソッドです。 Lasso 回帰のプラグイン メソッドを使用する場合は、以下を呼び出すだけです。
返された結果にはパラメータ値と残差が表示されます。
Lasso 回帰のクロス検証メソッドを使用する場合は、以下を呼び出すだけです。
返される結果には次の表が含まれます。
Lasso 回帰 + プラグイン法、Lasso 回帰 + クロス検証法、従来の OLS の結果が異なることがわかります。 Stataが提供するパラメータ選択法は近年の最新の研究成果であるため、RやScikit-Learnなどの無料のオープンソースソフトウェアではまだ適用されていません。これもStataの貴重な特徴です。 Stata は、さまざまな一般的なデータ分析およびデータ マイニング機能をサポートする便利なプログラミング インターフェイスを提供します。さらに、グラフィカル ユーザー インターフェイスも提供しており、ユーザーはボタンをクリックしたり、ドロップダウン ボックスを選択したりすることで、さまざまな操作を簡単に実行できます。 Stataは経済分野の定番ソフトウェアとして、インターネット企業をはじめとするIT企業からも注目されるはずです。 著者について テクニカル ディレクター兼建築家の Wang Hao 氏は、ユタ大学で学士号/修士号を取得し、国際ビジネス経済大学で MBA を取得しています。 Baidu、Sina、NetEase、Doubanなどの企業で長年にわたり研究開発と技術管理に携わっており、機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析などの技術に長けています。彼はTVCGやASONAMなどの国際会議やジャーナルに11本の論文を発表している。国際学術会議IEEE SMI 2008およびICBDT 2020で最優秀論文賞を受賞。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: ビッグデータは古い顧客を殺しています。消費者が権利を守るのは困難です。アルゴリズムの不公平な適用をどのように規制すべきでしょうか?
>>: 上海は質の高い農業の発展を推進:科学技術設備の改善と無人農場の建設
「陸地が3つ、海が7つ」。広大な海には数え切れないほどの謎が隠されている。深海探査は工学技術分野で常...
周りを見渡せば、人工知能がいかに重要になっているかがわかるでしょう。顔認識カメラでも音声アシスタント...
フェデレーテッド ラーニングは機械学習において非常に注目されている分野であり、複数の当事者がデータを...
韓国のお笑いタレント、パク・チソンさんとその母親が自宅で死亡しているのが発見されたが、これはうつ病が...
1. はじめにインテリジェント運転とは、一般的には、自動運転や車両のインターネット(IoV)などの技...
1. 研究の動機マスクモデリング (MIM、MAE) は、非常に効果的な自己教師ありトレーニング方法...
人間の脳の神経信号も言語であると考えられるなら、機械翻訳アーキテクチャを神経信号の解釈に適用する実現...
[51CTO.com クイック翻訳] Zstandard (Zstd とも呼ばれる) は、Faceb...
ライブイベントは優れたマーケティング形式であり、ビジネスと顧客との関係を強化する優れた方法です。調査...
国際学習表現会議(ICLR 2024)は今年で12回目となり、今年は5月7日から11日までオーストリ...
1 年前、私は数人の友人と機械学習 API を構築するためのオープンソース プラットフォームである ...
シンボリック AI は、ビジネスに関する洞察を解釈し、すべての目標の達成を支援します。多くの企業が基...
ご家族の皆さん、世界中で人気の魔法のダンス「Subject Three」、まさか兵馬俑も踊り始めると...