Kursdaten

Kursname: Python für Wissenschaftler und Ingenieure
Kurslänge: 3 Tage
Online: Ja
Offener Kurs: Ja
In-Haus: Ja
Kurskennung: PWD
Englischer Kurs hier

Kurstermine

Ort Datum Anmeldung
Leipzig 12. - 14. September 2022
Online 12. - 14. September 2022
Leipzig 16. - 18. Januar 2023
Online 16. - 18. Januar 2023

Python für die Daten-Analyse

Zielgruppe

Programmierer mit grundlegenden Python-Grundkenntnissen. Durch Kombination mit Grundkursen (siehe Empfohlene Modul-Kombinationen) können diese Kenntnisse erlangt werden.

Motivation

Python ist hervorgehend für die Datenanalyse geeignet. Der Einstieg ist vergleichsweise einfach. Die Sprache bietet aber viele weitergehende Möglichkeiten zum Lösen komplexerer Probleme. Zusätzlich zur Arbeit in einer eleganten, allgemeinen Programmiersprache bietet Python vile leistungsfähige Bibliotheken für die Daten-Analyse.

Kursinhalt

Überblick über wissenschaftlich/technische Bibliotheken für Python

Es gibt eine Vielzahl von Bibliotheken. Es wird ein Überblick gegeben und auf einzelne Beispielbibliotheken kurz eingegangen.

Numerische Berechnungen mit NumPy

Die Bibliothek NumPy ist der Quasi-Standard für die Arbeit mit Arrays und lineare Algebra.

Array-Konstruktion und Array-Eigenschaften

Es gibt verschiedene Arten wie Arrays mit NumPy erstellt werden können. An Hand von Beispielen wird dargelegt, welcher Weg für welchen Zweck der geeignetste ist. Die Eigenschaften von Array-Objekten werden behandelt und ihre Bedeutung erläutert.

Datentypen

Im Gegensatz zu Python-Datentypen, die dynamisch zur Laufzeit ermittelt werden, müssen bei NumPy-Arrays die Typen vor der Konstruktion eines Arrays festgelegt werden. Dies ist eine Voraussetzung für die gegenüber reinem Python mit NumPy erzielbaren Geschwindigkeitszuwächse. Es gibt wesentlich mehr Datentypen als in Python. Die Datentypen und ihre Nutzung werden erläutert.

Slicing und Broadcasting

Mit Hilfe des so genannten Slicings kann auf beliebige Teilbereiche auch mehrdimensionaler Arrays lesend und schreibend zugegriffen werden. Mit dieser Technik lassen sich oft kurze und elegante Lösungen finden, die ohne Schleifen auskommen. Erfahrungsgemäß sind die ersten Schritte mit Slicing gewöhnungsbedürftig. Deshalb werden im Kurs zahlreiche Übungen durchgeführt, die verschiedenste Möglichkeiten abdecken. Haben Arrays unterschiedliche Formen erfolgt in NumPy das so genannte Boradcasting, bei dem die fehlenden Array-Bestandteile sinnvoll ergänzt werden Ein gutes Verständnis dieses wichtigen Mechanismus ist Grundvoraussetzung für ein effektives Arbeiten mit NumPy.

Universelle Funktionen

Mit NumPy können verschiedenste Operationen auf ganze Arrays unabhängig von deren Dimensionen ausgeführt werden. Diese als universelle Funktionen bezeichneten Operationen werden an Beispielen erläutert.

Numerische Algebra

NumPy bietet grundlegende Funktionen für die Lösung von Aufgaben der numerischen Algebra. Diese werden an Beispielen erläutert und angewendet.

Interaktive Daten-Analyse mit Pandas

Pandas ist eine sehr mächtige Python-Bibliothek für die Analyse großer Datenmengen. Der Kurs stellt die grundlegenden Merkmale und Arbeitsabläufe von Pandas vor. Der Schwerpunkt liegt auf Datenstrukturen von Pandas und deren Datenanalyseoperationen.

Speichern und Verarbeiten sehr großer Datenmengen

Bei wissenschaftlich/technischen Anwendungen ist es oft nötig mit großen Datenmengen zu arbeiten. Um diese Daten dauerhaft zu speichern gibt es verschiedene Möglichkeiten. Einige davon werden im Kurs vorgestellt.

Textdateien

Die einfachste Art Daten zu speichern sind Textdateien. Es wird gezeigt wie Textdateien effizient gelesen und geschrieben werden können. Techniken für die Umwandlung spaltenbasierter Daten in Python-Datenstrukturen werden behandelt.

Excel-Dateien

Viele Daten werden in Excel-Dateien abgelegt. Python bietet mehrere Möglichkeiten Exceldateien zu lesen und zu schreiben. Zugriffe über die Microsoft COM-Schnittstelle unter Windows werden ebenso angewendet wie der direkte binäre Lese- und Schreibzugriff, der ein vom Betriebssystem unabhängiges Arbeiten ermöglicht.

NetCDF-Dateien

Für die effiziente Speicherung großer arraybasierte Daten bis in den Terabyte-Bereich wird das Datenformat NetCDF eingesetzt. Python bietet eine Schnittstelle für NetCDF. Die Handhabung wird mit Beispielen erarbeitet.

HDF-Dateien

Das HDF-Format wird für sehr ähnliche Zwecke wie das NetCDF-Format eingesetzt. Es ist geplant beide Formate in zukünftigen Versionen zu vereinigen. HDF steht für hierachical data format und bietet somit ein bessere Möglichkeit Daten zur organisieren. Mit pyTables steht eine ausgereifte und sehr komfortable Schnittstelle zu HDF zur Verfügung. Diese wird im Kurs mit Beispielen erläutert.

Datenbanken

Oft liegen Daten in Datenbanken vor. Python bietet eine einheitliche API für den Datenbankzugriff auf alle gängigen Datenbanken.

Die Arbeitsweise der API wird an Beispielen erläutert.

Pickling und Shelving

Python bietet die Möglichkeit mit den eingebauten Modulen pickle und shelve Python-Objekte persistent zu speichern. Damit lassen sich ohne Entwicklung von Dateiformaten schnell auch komplexe Datenstrukturen speichern und zu einem späteren Zeitpunkt wieder laden.

Die Anwendung, Vor- und Nachteile dieser Speichermethoden werden mit Beispielen dargestellt.

Objektorientierte Programmierung für wissenschaftlich/technische Projekte

Das objektorientierte Paradigma ist das zurzeit in der Softwareentwicklung vorherrschende. Viele Wissenschaftler und Ingenieure sind jedoch mit der prozeduralen Programmierung wesentlich besser vertraut. Im Kurs wird mit Beispielen erarbeitet, dass Objektorientierung auch für typische wissenschaftliche oder ingenieurtechnische Problemstellungen Vorteile bietet.

Grafische Darstellung wissenschaftlicher Daten

Ergebnisse wissenschaftlich/technischer Berechnungen müssen oft grafisch dargestellt werden. Obwohl viele Grafikprogramme existieren, ist die automatisierte Erstellung von Grafiken insbesondere bei vielen Grafiken oder bei sich immer wiederholenden Darstellungen von Vorteil.

matplotlib

Mit matplotlib lassen sich mit nur wenigen Zeilen Quelltext unterschiedlichste Diagramme erstellen. An Beispielen wird die Nutzung der Bibliothek geübt.

Integration von Anwendungen mit Python

Python wird oft als so genannte „glue language“ bezeichnet, da es besonders für Verbindung heterogener Anwendungen geeignet ist. Diese Eigenschaft macht es für wissenschaftlich-technische Anwendungen besonders interessant. Im Kurs werden verschiedene Möglichkeiten vorgestellt wie unterschiedlichste Anwendungen zu einem einheitlichen Programm verbunden werden können.

Offene Zeit für Problemlösungen der Teilnehmer

Die Teilnehmer werden vor dem Kurs gebeten Aufgaben zu formulieren, die sie in ihrer täglichen Praxis lösen müssen. Im Kurs werden Lösungsmöglichkeiten für diese Aufgaben aufgezeigt und wenn möglich mit Beispielen untersetzt.

Ablauf

Die Teilnehmer können alle Arbeitsschritte direkt auf ihrem Computer nachvollziehen. Am Ende jedes Themas können sie das erworbene Wissen durch praktische Übungen festigen.

Software

Wir nutzen ein eigenes Schulungssystem mit allen für den Kurs nötigen Softwarebibliotheken. Es gibt also nichts zu installieren. Ein moderner Browser und Internetzugang reichen für den Kurs.

Hardware für offene Kurse vor Ort

Bei offenen Kursen in unserem Schulungszentrum können Sie Ihren eigenen Laptop mit dem Betriebssystem Ihrer Wahl mitbringen oder einen unserer Schulungslaptops nutzen. Bei der Anmeldung bitte angeben, damit wir das Gerät bereitstellen können.

Kursmaterialien

Jeder Teilnehmer erhält ausführliche Kursunterlagen mit ausformulierten Beschreibungen der Kursinhalte und alle verwendeten Quelltexte in elektronischer Form.

Empfohlene Modul-Kombinationen

Die Module Python-Erweiterungen in anderen Sprachen und Optimierung von Pythonprogrammen stellen inhaltliche Ergänzungen zu diesem Kurs dar.

Das Modul kann mit den Kursen Python für Nichtprogrammierer oder Python für Programmierer kombiniert werden.


So erreichen Sie uns:
Python Academy & Co. KG
Zur Schule 20
04158 Leipzig / Deutschland
Tel:+49 341 260 3370
Fax:+49 341 520 4495
mail:info@python-academy.de
So erreichen Sie uns:
Python Academy & Co. KG
Zur Schule 20
04158 Leipzig / Deutschland
Tel:+49 341 260 3370
Fax:+49 341 520 4495
mail:info@python-academy.de