PyGWalkerを使用して表形式のデータを視覚化および分析する

PyGWalkerを使用して表形式のデータを視覚化および分析する

導入

Jupyter Notebook に大量のデータがあり、それを分析して視覚化したいとします。 PyGWalker は、この作業を非常に簡単にする魔法のツールのようなものです。データを取得して、Tableau と同じように操作できる特別な種類のテーブルに変換します。複雑なコードに迷うことなく、データを視覚的に探索し、操作して、パターンや洞察を確認することができます。 PyGWalker はすべてを簡素化し、ユーザーが手間をかけずにデータをすばやく分析して理解できるようにします。 PyGWalker は Kanaries によって開発されました。

【公式GitHubコードリポジトリ】:

https://github.com/Kanaries/pygwalker

【コード】:

Google Colab (https://colab.research.google.com/drive/171QUQeq-uTLgSj1u-P9DQig7Md1kpXQ2?usp=sharing)

Kaggleノートブック

開発者プロフィール:

https://github.com/ObservedObserver

特定の探索

pip 経由で PyGWalker ライブラリをインストールします。

 !pip install pygwalker -q

Jupyter Notebook で PyGWalker を使い始めるには、pandas と pygwalker という 2 つの重要なライブラリをインポートする必要があります。

 import pandas as pd import pygwalker as pyg

import pandas as pd の行を使用すると、表形式のデータを操作できます。一方、import pygwalker as pyg は PyGWalker ライブラリを導入します。

インポートすると、PyGWalker を既存のワークフローにシームレスに統合できます。

たとえば、pandas を使用してデータを読み込むことができます。

 df = pd.read_csv('my_data.csv')

次に、次のようにデータ フレームを引数として渡して、「gwalker」という名前の PyGWalker インスタンスを作成します。

 gwalker = pyg.walk(df)

提供されたコマンドを実行すると、コード セルの下に新しい出力が表示されます。出力にはインタラクティブなユーザー インターフェイスが含まれます。

写真

インターフェースには、データの分析と探索のためのさまざまなドラッグ アンド ドロップ機能が用意されています。データを操作するための便利でインタラクティブな方法を提供し、データの視覚化、関係性の探索などのタスクを実行できます。

PyGWalker を使用すると、Tableau のようなユーザー インターフェイスを使用してデータを分析および視覚化できるようになります。

写真

PyGWalker はマーカーの種類を変更する柔軟性を提供し、さまざまな図を作成できます。たとえば、目的の変数と線マーカーの種類を選択するだけで、簡単に折れ線グラフに切り替えることができます。

写真

ステッチビューを作成して、さまざまな測定値を比較することもできます。複数の測定値を行または列に追加することで、簡単に並べて分析および比較できます。

写真

特定のカテゴリや特性に基づいて、データをさまざまなセクションに整理できます。これにより、データの異なるサブセットを個別に分析および比較できるようになります。

写真

PyGWalker を使用すると、データを表形式で表示し、分析タイプとセマンティック タイプをカスタマイズできます。データを構造化された方法で簡単に視覚化し、データの分析および解釈の方法を特定のニーズに合わせてカスタマイズできます。

写真

データ探索結果をローカル ファイルに保存することもできます。

要約する

PyGWalker は、さまざまな機能を提供する汎用ライブラリです。この強力なツールを活用して、データ分析と視覚化のスキルを向上させましょう。

<<: 

>>:  エッジにAIを導入する3つのメリット

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

BingチャットAIの品質に問題があるとユーザーが報告、マイクロソフトはエクスペリエンスの改善を約束

ここ数週間、ユーザーは Microsoft Edge に組み込まれている GPT-4 AI チャット...

AIが疫病と戦う:百度がマスク顔検出・分類モデルをオープンソース化

仕事に戻るにあたり、各地域はどのように流行を予防すべきでしょうか?人工知能技術は、新型コロナウイルス...

二度とアルゴリズムの罠に陥らないでください!背後にいる人物を見つけ出す

誰もがこのような経験をしたことがあると思います。道路を運転しているとき、携帯電話は位置情報と速度を送...

分類アルゴリズムの概要

[[154315]]決定木分類アルゴリズム決定木誘導は古典的な分類アルゴリズムです。これは、トップダ...

...

2024 年にビジネスを一変させる可能性のあるテクノロジーはどれでしょうか?

2023 年は、世界中の政府、公共部門、企業、さらには一般大衆の生活を大きく変えるテクノロジーの急...

ディープラーニングにおける正規化技術の包括的な概要

ディープニューラルネットワークのトレーニングは困難な作業です。 長年にわたり、研究者たちは学習プロセ...

Google Research: ゲーデル賞とクヌース賞受賞者が「脳内のテキスト表現」を分析

このオンラインセミナーで特に注目を集めた講演は、コロンビア大学のコンピューターサイエンス教授であるク...

LeCun 氏はリツイートしました: 中国がトップ AI カンファレンスのリストで首位を占め、米国が 2 位です!中国と米国が世界の数学計算分野を支配している

最近、「科学は戦略だ」というネットユーザーが、近年いくつかの海外の主要メディアや調査機関がまとめたグ...

2018 CCF BDCIコンペティションのグローバルローンチ:データ駆動型、スマートな未来

8月11日、2018年のCCFビッグデータ&Computational Intelligenceコン...

成熟したAIは独自のコードを書くべきだ。IBMは55の言語で5億行のコードデータセットを公開

[[400902]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

人工知能: キャリア開発のための3つの戦略

ビジネスに AI を導入するには、テクノロジーとスキルだけでは不十分です。いくつかの戦略を導入するこ...

フェデレーテッドラーニングも安全ではないのでしょうか? Nvidiaの研究は「プライバシーフリー」データを使用して元の画像を直接再構築します

フェデレーテッド ラーニングは、データがローカルの場所から出ないようにするプライバシー保護戦略により...

AIoTは単なる発言ではない

みなさんこんにちは。今日はAIoTについてお話します。 AIoT、つまり AI + IoT は、人工...

...