Pandas und SymPy

  • Pandas gehört mit NumPy, SciPy und Matplotlib zur Grundausstattung für die Datenanalyse mit Python. Es stellt komfortable Funktionen für den bequemen Umgang mit tabellarischen Daten (i.d.R. zweidimensionalen) zur Verfügung. In der Anaconda-Distribution ist Pandas schon enthalten.

  • das Beispiel-Notebook aus der Vorlesung mit den Daten der deutsche Städte vom Statistischen Bundesamt

  • ein weiteres, aufwändigeres Beispiel, das auch einige Methoden des machine learning demonstriert

  • Für Pandas gibt es ein nützliches Cheat Sheet mit den wichtigsten Befehlen.

  • Pandas Dataframes sind auch die Grundlage für das Python-Paket scikit-learn mit umfangreichen Funktionen zum maschinellen Lernen. Dafür gibt es einen guten Online-Kurs vom INRIA.

  • SymPy ist eine Bibliothek zum symbolischen Rechnen in der Art eines Computer-Algebra-Systems wie Mathematica oder Maple. Die Webseite SymPyGamma erlaubt die Anwendung von SymPy-Befehlen auf online-Eingaben (ähnlich wie WolframAlpha). Es gibt auch eine einfache interaktive Shell.

    Beispiel-Notebook aus der Vorlesung (Rechtsclick und Download)

    Weiteres Beispiel aus einem Blogbeitrag (Rechtsclick und Download)

  • Wesentlich größer angelegt ist SageMath. Dieses System vereint hinter einer einheitlichen Oberfläche viele Open-Source-Programme für den Umgang mit Mathematik. Die vereinheitlichende Skriptsprache ist Python, und SymPy ist ein wesentlicher Bestandteil des Projekts.

Aufgaben bis zum nächsten Mal

Bearbeiten Sie die Bonusaufgabe „Bonus 04: Pandas und SymPy“ auf replit!