この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。 AIコンサルティングサービスを利用したい場合、コンサルティング内容を最大限に活用できるように、まずはこの6つのAI用語を理解する必要があります。
1. データラングリングデータ ラングリングとは、メタデータを取得して、それを機械学習や人工知能が理解できる形式と構造に変換するプロセスです。データ ラングリングは、クライアントが収集したデータを取得し、それを使用してソフトウェア ソリューションに必要なモデルを構築するために AI コンサルタントが実行する最初のステップの 1 つです。 このプロセスには、データの入力、データの構造化、不良データのクリーンアップ、より有効なフィールドを作成するためのデータ処理など、多くの手順が含まれます。この部分は単純に思えるかもしれませんが、おそらく最も重要な部分であり、クライアントが入力したデータを使用して、新しいコンサルタントがこのデータを整理できるようにする必要があります。 2. AIモデルのデータ補間ほとんどのデータ セットには欠損値フィールドがあり、そのためデータ セットがまばらで断片化されているように見えます。最も迅速な修正方法は、データセットからフィールドまたは属性を単純に削除することですが、コンサルタントがアクセスできるデータはそもそも貴重であるため、これは多くの場合、初歩的な解決策です。 この場合、ほとんどのAIコンサルティング会社は、データ処理技術を通じて、残ったデータに基づいて欠損値に最も妥当な数値を割り当てます。最も一般的な手法は平均補間であり、これは現場の既知のデータの平均を取り、ギャップを埋めるものです。多くのデータ サイエンス コンサルタントがこの手法を使用しており、これは現在のデータ アーキテクチャを混乱させることなくギャップを埋める優れた方法です。 3. データの分割人工知能や機械学習を使用する多くのモデルは、モデルのトレーニングとテストを目的としてデータをグループで処理します。多くの AI コンサルティング企業では、グループ化に十分なデータがあることを確認するために、提供されるデータがファイル サイズと行数に関して特定の数量要件を満たすことを要求します。 場合によっては、クライアントと協力して、確立されたデータセットに追加するテスト セットとして将来のデータを収集することもあります。 Scalr.ai では、特に将来、簡単に制御できるデータ ストリームを通じてデータを簡単に取得できるようになると、この 2 つを組み合わせるように努めます。 4. 教師あり学習多くの AI コンサルティング サービスでは、機械学習やデータ サイエンスを活用し、アルゴリズムを使用して属性 (フィールドとも呼ばれます) と既知の最終目標との間のつながりを見つけます。ほとんどの AI コンサルタントは、AI ソフトウェア ソリューションでこれらのアプローチの少なくとも 1 つを使用しています。 このアプローチの典型的な例は、家の平方フィート数、階数、ドアの数をフィールドとするモデルです。ターゲット変数は家の既知の価値であり、このモデルを使用して将来の住宅価格を予測できます。 5. 教師なし学習ご想像のとおり、このプロセスでは上記と同じ入力データセットが使用されますが、ターゲット変数は使用されないため、異なる結論が導き出されます。一般的に言えば、これはターゲット変数が不明であり、データに関する全体的な情報が不明であるが、何らかのターゲット変数の構築を開始したいために行われます。 ほとんどの AI コンサルティング企業は、これらのアルゴリズムを使用して、セキュリティ システム内の危険信号となる可能性のある範囲外のデータ ポイントなど、データ内の外れ値を見つけます。 6. モデル評価指標最後に、望ましい結果を得るために効果的なモデルとアルゴリズムを構築する人材を雇用します。 AI コンサルタントは、評価指標を使用して、行われている作業の実際の進捗状況を把握し、発生した問題に基づいてソリューションを調整する方法を決定できます。 ほとんどの場合、モデルを評価するために使用される用語は、精度、AUC、および精度ですが、ソフトウェアでモデルを評価する方法は他にもたくさんあります。 |
<<: 幾何学的機械学習: 基礎科学でどのように実現するか?
【51CTO.comオリジナル記事】近年、RPAの開発はかつてないほど注目を集めています。 Mark...
Instagramは、顔をスキャンして年齢を推定できるサードパーティ企業Yotiが開発したAIツール...
[[388162]]画像ソース: https://pixabay.com/images/id-158...
ネットワークは常に企業の神経系であり、ビジネス プロセスとトランザクションはネットワークを通じてのみ...
科学技術の継続的な進歩により、インテリジェント製品は徐々に日常生活に統合され、人工知能は現代の発展の...
類似の質問とは何ですか? また、なぜ類似の質問を書く必要があるのですか?類似質問はロボット教育を改善...
AI は時間の経過とともにさらに賢くなり、パワーを増していきます。私たちの多くにとって、人工知能 ...
ここでは、ブロックレベル ボックスのデフォルトの幅、幅のない絶対配置ボックス、幅のないフローティング...
機械が人間と同じように反応するようにすることは、AI 研究の永遠の目標でした。機械が知覚し、考える能...
何年もの間、私たちは「来年」が人工知能にとって画期的な年になるだろうという話を聞いたり読んだりしてき...
最近、同義千文がとても人気になってきました。少し前にネットユーザーの間で熱狂を巻き起こした国民的ダン...