pandasを使用する際、データのサイズを知りたい場合が出てくると思います。
ここではPandasにおけるDataFrameの要素数を抽出する方法について解説しています。
この記事の対象
sizeとは?
sizeメソッドは、pandasのデータ構造であるSeriesやDataFrameに含まれる要素の総数を返すメソッドです。これはデータの大きさや次元を取得できます。
基本的な型
Dataframe.size
「size」を用いることで要素数を容易に知ることが可能です。
使用例
import pandas as pd
f = pd.DataFrame([
[0,1,2],
[3,4,5]
])
print(f.size)
上記のプログラムにおける結果は「6」です。指定したデータ数にマッチしているのでしっかり要素数をカウントできていることが確認できます。
結果
6
sizeに関連する便利な関数
shape
shape
属性は、データの行数と列数をタプルで返します。これを使うことで、データの形状を確認できます。
import pandas as pd
# Seriesの例
s = pd.Series([1, 2, 3, 4, 5])
print(s.size)
# DataFrameの例
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(s.shape)
print(df.shape)
結果
5
(5,)
(3, 2)
count
count
メソッドは、欠損値を除いた要素の数を返します。
import pandas as pd
# Seriesの例
s = pd.Series([1, 2, 3, 4, 5])
print(s.size)
# DataFrameの例
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(s.count())
print(df.count())
結果
5
5
Name 3
Age 3
dtype: int64
len
len
関数を使用することでも、SeriesやDataFrame内の要素数を取得できます。
import pandas as pd
# Seriesの例
s = pd.Series([1, 2, 3, 4, 5])
print(s.size)
# DataFrameの例
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(len(s))
print(len(df))
結果
5
5
3