データマイニングの基本概念と最も一般的に使用されるアルゴリズムについての簡単な説明

データマイニングの基本概念と最も一般的に使用されるアルゴリズムについての簡単な説明

現在、国民経済と生活のあらゆる分野でビッグデータの理論と応用が盛んに行われています。ビッグデータの基本的な概念や特徴については、すでに多くの人が理解しています。しかし、ビッグデータを取得、保存、検索、共有するだけでは十分ではありません。ビッグデータの中にある未知の価値ある情報や知識を、どのように見つけることができるのでしょうか。

知識発見 (KDD) は、ビッグ データから有効で、斬新で、潜在的に有用で、最終的には理解可能なパターンを識別するプロセスです。


知識発見のフローチャート

データマイニングは、ビッグデータにおける知識発見(KDD)に欠かせない部分であり、ビッグデータの理論と応用において非常に重要な部分です。データ マイニングとは、大量の不完全でノイズが多く、あいまいでランダムなデータから、暗黙的で未知だが潜在的に有用な情報や知識を抽出するプロセスです。ほとんどの人は、ケーススタディを通じてデータマイニングについて学びました。これは、ウォルマートがデータ分析を通じて、男性顧客がベビー用おむつを購入する際に自分へのご褒美としてビールを数本買うことが多いことを発見したため、ビールとおむつを組み合わせたプロモーションを開始しようとしたためです。予想外に、この動きにより、実際におむつとビールの両方の売上が大幅に増加しました。この話はおそらく嘘ですが、多くの人にデータマイニングに興味を持ってもらうきっかけとなりました。


データマイニングの基本フレームワーク

データマイニングで最も一般的に使用されるアルゴリズムは次のとおりです。

(1)予測モデリング:既存のデータとモデルを使用して未知の変数を予測する。

  • 分類は離散的なターゲット変数を予測するために使用される
  • 連続的な目標変数を予測するための回帰

(2)クラスター分析:同じクラスターに属する観測値が、異なるクラスターに属する観測値と比較して可能な限り互いに類似するように、密接に関連する観測値のグループを見つける。

(3)関連分析(関係モデルとも呼ばれる):あるものと他のものの間の相互依存性と相関関係を反映します。データ内の強く相関した特徴を表すパターンを発見するために使用されます。

(4)異常検出:他のデータとは特性が著しく異なる観測値を識別する。

データ マイニングは、分類、回帰、クラスタリング、関連分析に分けられることがあります。


データマイニングの代表的な4つのアルゴリズム

データマイニングと機械学習は異なりますが、関連もあり、今後の記事で紹介する予定です。

<<:  ついに、データ、情報、アルゴリズム、統計、確率、データマイニングをわかりやすく説明した人がいました。

>>:  信頼できる AI ソリューション プロバイダー 5 社

ブログ    

推薦する

AI、ビッグデータ、データサイエンス向けトップ10アルゴリズム

AI は私たちの職業、働き方、そして企業文化を変えています。 AIを活用することで、本当に重要なスキ...

少数ショット学習(1) — 機械学習におけるタスク最適化空間

[[401868]]今日のディープラーニングの成功には大量のデータが必要であり、これは不可欠な前提条...

あなたの声は私のパスです

最近私の声が盗まれたことで、AI がすでに社会に混乱を引き起こす能力を持っていることが私には明らかに...

マスク氏、XデータをAIの訓練に利用していると認める「マイクロソフトは使えないが、自分なら使える」

マスク氏はついに我慢できなくなり、X のデータを AI に入力し始めました。過去 2 日間で、X が...

...

GenAI が CIO にとって悪夢である理由とその解決方法

GenAI が現代の企業にとって非常に魅力的な理由は理解できます。これは、世界中のさまざまな業界で無...

DALL·Eの超進化により、写真の品質と芸術性が大幅に向上し、写真をシームレスに修正することもできるようになりました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ボストン・ダイナミクスはまたもオーナーが変わる。ロボット界のトップスターを商業化するのはなぜ難しいのか?

序文:ロボット産業の研究者および愛好家として、私は産業や生活におけるロボットの実用化について常に考え...

スタンフォード大学の10のグラフはAI開発の新たなトレンドを分析している

スタンフォード大学のAI 100のAI Indexプロジェクトは、人工知能の活動と進歩を追跡し、人工...

LRU キャッシュ アルゴリズムの Java カスタム実装

背景LinkedHashMap は HashMap を継承し、内部的に removeEldestEn...

人工ニューラルネットワークとBPアルゴリズムについての簡単な説明

[[338555]] 【51CTO.comオリジナル記事】 1 はじめに現在、機械学習技術とも呼ばれ...

CUDA と TensorRT モデルの展開の最適化: 重要な考慮事項と実践的な戦略

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ドイツメディア:EUは人工知能の乱用を制限する法律制定を計画

専門家は、人工知能も気候変動への取り組みにおいて重要な役割を果たすことができると考えている。しかし一...

Excelを使用してPIDアルゴリズムを学習する

1. PIDの紹介モーター制御この方法ではフィードバックはありません。つまり、入力数値を完全に信じて...

...