Home » Python » seabornの使い方 » seabornの全データセットの行数と列数を確認する

seabornの全データセットの行数と列数を確認する

動作検証バージョン:Windows 11 Home + Python 3.10.6 + Jupyter Notebook 6.5.3 + seaborn 0.12.2 + pandas 2.0.3

seabornに用意されているデータセットは、load_datasetメソッドで読み込んでpandasの、DataFrame.infoメソッドを使うことで、どのようなデータセットなのかの情報を出力できることをご紹介しました。

これはこれで便利なのですが、seabornに用意されているすべてのデータセットが、どれくらいの行数×列数なのかを確認したかったので簡単なスクリプトを作ってみました。

[スポンサードリンク]

seabornの全データセットの行数と列数を取得するスクリプト

以下のスクリプトを実行すると、seabornに用意されているデータセットの名前と、各データセットの行数と列数が出力されます。

import seaborn as sns

for i in sns.get_dataset_names():
    df = sns.load_dataset(i)
    print(i, df.shape)

以下のように出力されます。

anagrams (20, 5)
anscombe (44, 3)
attention (60, 5)
brain_networks (923, 63)
car_crashes (51, 8)
diamonds (53940, 10)
dots (848, 5)
dowjones (649, 2)
exercise (90, 6)
flights (144, 3)
fmri (1064, 5)
geyser (272, 3)
glue (64, 5)
healthexp (274, 4)
iris (150, 5)
mpg (398, 9)
penguins (344, 7)
planets (1035, 6)
seaice (13175, 2)
taxis (6433, 14)
tips (244, 7)
titanic (891, 15)

データセットの名前と、どれくらいのデータ量なのかが行数と列数のタプルの形で出力されます。

例えば、Python in Excelのサンプルとして使われるフィッシャーのアヤメデータであれば

iris (150, 5)

と出力されていますから、150行で5列あるということがわかります。

全データセットの行数と列数を取得するスクリプトで行っている処理

上記のスクリプトで行っている処理は、以下のとおりです。

seaborn.get_dataset_names関数で取得できる、全データセット名のリストから、for文を使って順番にデータセット名を取得して、

for i in sns.get_dataset_names():

seaborn.load_dataset関数で読み込んで変数dfに代入を行い、

    df = sns.load_dataset(i)

データセット名と、pandas.DataFrame.shapeプロパティで取得できる、タプルを出力しています。

    print(i, df.shape)

[スポンサードリンク]

Home » Python » seabornの使い方 » seabornの全データセットの行数と列数を確認する

「seabornの使い方」の記事一覧

検索


Copyright © インストラクターのネタ帳 All Rights Reserved.

.