Skip to content

Pandas: Ermittelt die Anzahl der Zeilen, Spalten und aller Elemente (Größe) eines DataFrame

Python

In diesem Artikel WIRD beschrieben, wie SIE die Anzahl der Zeilen, Spalten und die Gesamtzahl der Elemente (Größe) von pandas.DataFrame und pandas.Series abrufen.

  • pandas.DataFrame
    • Anzahl der Zeilen, Spalten usw. anzeigen:df.info()
    • Holen Sie sich die Anzahl der Zeilen:len(df)
    • Holen Sie sich die Anzahl der Spalten:len(df.columns)
    • Holen Sie sich die Anzahl der Zeilen und Spalten:df.shape
    • Holen Sie sich die Anzahl der Elemente:df.size
    • Hinweise zur Indexangabe
  • pandas.Serie
    • Holen Sie sich die Anzahl der Elemente:len(s), s.size

Verwenden Sie als Beispiel Überlebensdaten der Titanic. Es kann von Kaggle heruntergeladen werden .

import pandas as pd

df = pd.read_csv('data/src/titanic_train.csv')

print(df.head())
#    PassengerId  Survived  Pclass  
# 0            1         0       3   
# 1            2         1       1   
# 2            3         1       3   
# 3            4         1       1   
# 4            5         0       3   
# 
#                                                 Name     Sex   Age  SibSp  
# 0                            Braund, Mr. Owen Harris    male  22.0      1   
# 1  Cumings, Mrs. John Bradley (Florence Briggs Th...  female  38.0      1   
# 2                             Heikkinen, Miss. Laina  female  26.0      0   
# 3       Futrelle, Mrs. Jacques Heath (Lily May Peel)  female  35.0      1   
# 4                           Allen, Mr. William Henry    male  35.0      0   
# 
#    Parch            Ticket     Fare Cabin Embarked  
# 0      0         A/5 21171   7.2500   NaN        S  
# 1      0          PC 17599  71.2833   C85        C  
# 2      0  STON/O2. 3101282   7.9250   NaN        S  
# 3      0            113803  53.1000  C123        S  
# 4      0            373450   8.0500   NaN        S  

Rufen Sie die Anzahl der Zeilen, Spalten und Elemente von pandas.DataFrame ab

Anzahl der Zeilen, Spalten usw. anzeigen:df.info()

Die info()-Methode von pandas.DataFrame kann Informationen wie die Anzahl der Zeilen und Spalten, die Gesamtspeicherauslastung, den Datentyp jeder Spalte und die Anzahl der Nicht-NaN-Elemente anzeigen.

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB

Das Ergebnis ist eine Standardausgabe und kann nicht als Wert abgerufen werden.

Holen Sie sich die Anzahl der Zeilen:len(df)

Die Anzahl der Zeilen von pandas.DataFrame kann mit der in Python integrierten Funktion len() ermittelt werden.

Im Beispiel WIRD es mit print() angezeigt, aber len() gibt einen ganzzahligen Wert zurück, sodass es einer anderen Variablen zugewiesen oder zur Berechnung verwendet werden kann.

Holen Sie sich die Anzahl der Spalten:len(df.columns)

Die Anzahl der Spalten von pandas.DataFrame kann durch Anwenden von len() auf das Spaltenattribut ermittelt werden.

print(len(df.columns))
# 12

Holen Sie sich die Anzahl der Zeilen und Spalten:df.shape

Das Shape-Attribut von pandas.DataFrame speichert die Anzahl der Zeilen und Spalten als Tupel (Anzahl Zeilen, Anzahl Spalten).

print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12

Es ist auch möglich, sie zu entpacken und in separaten Variablen zu speichern.

row, col = df.shape
print(row)
# 891

print(col)
# 12

Holen Sie sich die Anzahl der Elemente:df.size

Die Gesamtzahl der Elemente von pandas.DataFrame wird im size-Attribut gespeichert. Dies ist gleich dem row_count * column_count.

print(df.size)
# 10692

print(df.shape[0] * df.shape[1])
# 10692

Hinweise zur Indexangabe

Wenn eine Datenspalte von der set_index()-Methode als Index angegeben WIRD, Werden diese Spalten aus dem Datenkörper (values-Attribut) entfernt, sodass sie nicht als Anzahl der Spalten gezählt werden.

df_multiindex = df.set_index(['Sex', 'Pclass', 'Embarked', 'PassengerId'])

print(len(df_multiindex))
# 891

print(len(df_multiindex.columns))
# 8

print(df_multiindex.shape)
# (891, 8)

print(df_multiindex.size)
# 7128

Siehe den folgenden Artikel für set_index().

Holen Sie sich sterben Anzahl der Elemente von pandas.Series

Wählen Sie als Beispiel für pandas.Series eine Zeile aus pandas.DataFrame aus.

s = df['PassengerId']
print(s.head())
# 0    1
# 1    2
# 2    3
# 3    4
# 4    5
# Name: PassengerId, dtype: int64

Holen Sie sich die Anzahl der Elemente:len(s), s.size

Da pandas.Series eindimensional ist, can SIE die Gesamtzahl der Elemente (Größe) entweder mit dem Attribut len() oder dem Größenattribut erhalten.

Beachten Sie, dass das Shape-Attribut ein Tupel mit einem Element ist.

print(len(s))
# 891

print(s.size)
# 891

print(s.shape)
# (891,)

Es gibt keine info()-Methode in pandas.Series.