Home » Python » seabornの使い方 » seabornデータセットの情報を取得する-pandas.DataFrame.infoメソッド

seabornデータセットの情報を取得する-pandas.DataFrame.infoメソッド

動作検証バージョン:Windows 11 Home + Python 3.10.6 + Jupyter Notebook 6.5.3 + seaborn 0.12.2 + pandas 2.0.3

Pythonの外部ライブラリ「seaborn(シーボーン)」には、サンプル用のデータセットが複数用意されています。

グラフを作成するには何らかのデータを準備しなければなりませんから、こういったデータセットが用意されているのは、とてもありがたいと感じます。

[スポンサードリンク]

seaborn.get_dataset_names関数でデータセット名を取得

seabornに用意されているデータセットの名前は、seaborn.get_dataset_names関数を使うと、Pythonのリストとして取得できます。

import seaborn as sns
get_dataset_names()

上記のコードをJupyterで実行すれば、seabornに以下のようなデータセットが用意されていることを確認できます。

['anagrams',
'anscombe',
'attention',
'brain_networks',
'car_crashes',
'diamonds',
'dots',
'dowjones',
'exercise',
'flights',
'fmri',
'geyser',
'glue',
'healthexp',
'iris',
'mpg',
'penguins',
'planets',
'seaice',
'taxis',
'tips',
'titanic']

pandasDataFrame.infoメソッドでデータセットの情報を出力

seaborn.load_dataset関数を使って、DataFrameとして読み込んでやれば、pandasのDataFrame.infoメソッドを使って、どのようなデータセットなのか詳細を知ることができます。

たとえば、別名snsでseabornがインンポートされているときに、以下のようなコードを実行すると、

df = sns.load_dataset('iris')
df.info()

フィッシャーのアヤメデータについて、以下のような出力が得られます。


RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal_length 150 non-null float64
1 sepal_width 150 non-null float64
2 petal_length 150 non-null float64
3 petal_width 150 non-null float64
4 species 150 non-null object
dtypes: float64(4), object(1)
memory usage: 6.0+ KB

[スポンサードリンク]

Home » Python » seabornの使い方 » seabornデータセットの情報を取得する-pandas.DataFrame.infoメソッド

「seabornの使い方」の記事一覧

検索


Copyright © インストラクターのネタ帳 All Rights Reserved.

.