
In diesem Artikel WIRD beschrieben, wie SIE die Anzahl der Zeilen, Spalten und die Gesamtzahl der Elemente (Größe) von pandas.DataFrame und pandas.Series abrufen.
- pandas.DataFrame
- Anzahl der Zeilen, Spalten usw. anzeigen:
df.info()
- Holen Sie sich die Anzahl der Zeilen:
len(df)
- Holen Sie sich die Anzahl der Spalten:
len(df.columns)
- Holen Sie sich die Anzahl der Zeilen und Spalten:
df.shape
- Holen Sie sich die Anzahl der Elemente:
df.size
- Hinweise zur Indexangabe
- Anzahl der Zeilen, Spalten usw. anzeigen:
- pandas.Serie
- Holen Sie sich die Anzahl der Elemente:
len(s), s.size
- Holen Sie sich die Anzahl der Elemente:
Verwenden Sie als Beispiel Überlebensdaten der Titanic. Es kann von Kaggle heruntergeladen werden .
import pandas as pd
df = pd.read_csv('data/src/titanic_train.csv')
print(df.head())
# PassengerId Survived Pclass
# 0 1 0 3
# 1 2 1 1
# 2 3 1 3
# 3 4 1 1
# 4 5 0 3
#
# Name Sex Age SibSp
# 0 Braund, Mr. Owen Harris male 22.0 1
# 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1
# 2 Heikkinen, Miss. Laina female 26.0 0
# 3 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1
# 4 Allen, Mr. William Henry male 35.0 0
#
# Parch Ticket Fare Cabin Embarked
# 0 0 A/5 21171 7.2500 NaN S
# 1 0 PC 17599 71.2833 C85 C
# 2 0 STON/O2. 3101282 7.9250 NaN S
# 3 0 113803 53.1000 C123 S
# 4 0 373450 8.0500 NaN S
Rufen Sie die Anzahl der Zeilen, Spalten und Elemente von pandas.DataFrame ab
Anzahl der Zeilen, Spalten usw. anzeigen:df.info()
Die info()-Methode von pandas.DataFrame kann Informationen wie die Anzahl der Zeilen und Spalten, die Gesamtspeicherauslastung, den Datentyp jeder Spalte und die Anzahl der Nicht-NaN-Elemente anzeigen.
df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
Das Ergebnis ist eine Standardausgabe und kann nicht als Wert abgerufen werden.
Holen Sie sich die Anzahl der Zeilen:len(df)
Die Anzahl der Zeilen von pandas.DataFrame kann mit der in Python integrierten Funktion len() ermittelt werden.
Im Beispiel WIRD es mit print() angezeigt, aber len() gibt einen ganzzahligen Wert zurück, sodass es einer anderen Variablen zugewiesen oder zur Berechnung verwendet werden kann.
Holen Sie sich die Anzahl der Spalten:len(df.columns)
Die Anzahl der Spalten von pandas.DataFrame kann durch Anwenden von len() auf das Spaltenattribut ermittelt werden.
print(len(df.columns))
# 12
Holen Sie sich die Anzahl der Zeilen und Spalten:df.shape
Das Shape-Attribut von pandas.DataFrame speichert die Anzahl der Zeilen und Spalten als Tupel (Anzahl Zeilen, Anzahl Spalten).
print(df.shape)
# (891, 12)
print(df.shape[0])
# 891
print(df.shape[1])
# 12
Es ist auch möglich, sie zu entpacken und in separaten Variablen zu speichern.
row, col = df.shape
print(row)
# 891
print(col)
# 12
Holen Sie sich die Anzahl der Elemente:df.size
Die Gesamtzahl der Elemente von pandas.DataFrame wird im size-Attribut gespeichert. Dies ist gleich dem row_count * column_count.
print(df.size)
# 10692
print(df.shape[0] * df.shape[1])
# 10692
Hinweise zur Indexangabe
Wenn eine Datenspalte von der set_index()-Methode als Index angegeben WIRD, Werden diese Spalten aus dem Datenkörper (values-Attribut) entfernt, sodass sie nicht als Anzahl der Spalten gezählt werden.
df_multiindex = df.set_index(['Sex', 'Pclass', 'Embarked', 'PassengerId'])
print(len(df_multiindex))
# 891
print(len(df_multiindex.columns))
# 8
print(df_multiindex.shape)
# (891, 8)
print(df_multiindex.size)
# 7128
Siehe den folgenden Artikel für set_index().
Holen Sie sich sterben Anzahl der Elemente von pandas.Series
Wählen Sie als Beispiel für pandas.Series eine Zeile aus pandas.DataFrame aus.
s = df['PassengerId']
print(s.head())
# 0 1
# 1 2
# 2 3
# 3 4
# 4 5
# Name: PassengerId, dtype: int64
Holen Sie sich die Anzahl der Elemente:len(s), s.size
Da pandas.Series eindimensional ist, can SIE die Gesamtzahl der Elemente (Größe) entweder mit dem Attribut len() oder dem Größenattribut erhalten.
Beachten Sie, dass das Shape-Attribut ein Tupel mit einem Element ist.
print(len(s))
# 891
print(s.size)
# 891
print(s.shape)
# (891,)
Es gibt keine info()-Methode in pandas.Series.