Data Science Specialization

Eine Serie von Onlinekursen für Data Science

Nachdem ich ISLR gelesen hatte, habe ich gedacht, wie ich R lernen sollte. Das Buch erklärt nur, wie man die Funktionen von maschinellem Lernen benutzt. Deshalb wollte ich lernen, Daten zu manipulieren und präsentieren. Weil ich noch keinen Onlinekurs besucht habe, habe ich mich entschieden, einen zu versuchen.

"Data Science Specialization" ist eine Serie von Onlinekursen. Sie besteht aus 9 Kurse und Capstone Projekt und erklärt Data Science mit R. Ich habe teilweise die Kurse gemacht. In diesem Eintrag wollte ich meine Meinung zu den Kursen äußern.

9 monatelange Kurse

Jeder Kurse dauert vier Wochen. Wer das Capstone Projekt machen wollte, muss die alle Kurse bestehen. Deshalb weiß ich gar nicht, was man für das Projekt macht. Man darf kostenlos jeden Kurs besuchen. (Suchen Sie den Namen des Kurses unter www.coursera.org.)

Wer ausführlich die Kurse wissen wollte, sollte die Notizen der Kurse lesen.

  1. The Data Scientist's Toolbox (ausgelassen). Den brauche ich überhaupt nicht.
  2. R Programming (bestanden). Die Grundlage der Programmierung mit R ohne besonderes Modul oder maschinelles Lernen wird behandelt. Der Unterricht ist ganz gut. Aber ich denke, dass die Aufgabe sinnlos ist, weil es genug ist, nur ein bisschen das gegebenes Muster zu ändern.
  3. Getting and Cleaning Data (bestanden). Data I/O, data.table, reshape2, dplyr, usw. werden behandelt. Die Themen sind gut ausgewählt, aber ich finde den Unterricht nicht gut, weil der Kursleiter nur kurz Funktionen erklärt.
  4. Exploratory Data Analysis (bestanden). Die Grundlage der Visualisierung wird erklärt. Während ggplot2 und lattice behandelt werden, geht es meistens um das Standardsystem. Unüberwachtes Lernen wird auch erklärt. Ich wollte, dass der Kursleiter mehr ausführlich gglopt2 erklärt, aber ich denke, dass der Kurs hilfreich ist.
  5. Reproducible Research (ausgelassen). Ich weiß nicht, ob es sich lohnt, den Kurs zu besuchen. Ich weiß nur, dass Rmarkdown in dem Kurs behandelt wird.
  6. Statistical Inference (ausgelassen). Den brauche ich nicht.
  7. Regression Models (ausgelassen). Den brauche ich nicht.
  8. Practical Machine Learning (bestanden). Im Kurs wird caret, ein Modul für maschinelles Lernen, behandelt. Es lohnt sich, den Kurs zu besuchen, wenn man wissen wollte, wie man effizient maschinelles Lernen mit R ausführt.
  9. Developing Data Products (ausgelassen). Shiny, rChart, ggvis, Slidify, usw. werden behandelt. Der Unterricht ist nicht ausführlich, deswegen habe ich den Kurs verlassen, nachdem ich das Kursmaterial (PDF-Dateien) heruntergeladen hatte.

Unterricht mit normaler Qualität

Ich habe viel in den Kursen gelernt, aber die Qualität von dem Unterricht ist ganz normal. Deshalb bin ich ein bisschen damit nicht zufrieden. Wer einen Kurs für R sucht, sollte den Kurs einmal versuchen.

DataCamp stellt auch viel Kurse für R kostenlos zur Verfügung. Ich habe noch keinen Unterricht von DataCamp besucht. Aber wer sich für die Serie "Data Science Specialization" interessiert, sollte auch die Kurse von DataCamp versuchen.

Share this page on        
Categories: #data-mining  #rezension