Rezension (1/2): deeplearning.ai [c r e s c e n t]

Rezension (1/2): deeplearning.ai

Published: ⏰ 2018-01-16 (Last Modified: 2018-01-16)

deeplearning.ai ist eine Serie von Kursen fÃ¼r Deep Learning. Die Serie besteht aus 5 Kurse und 4 davon stehen im Moment zur VerfÃ¼gung. Da ich drei Wochen im Urlaub hatte, habe ich die Kursen gemacht. In diesem Eintrag mÃ¶chte ich dazu Ã¤uÃŸern.

Bilderkennung

Deep Learning

Deep Learning bezeichnet normalerweise die Theorie eines neuronalen Netz, eines Modells von maschinellem Lernen. Da man mit einem neuronales Netz ein sehr kompliziertes Modell erstellen kann, wird ein neuronales Netz fÃ¼r verschiedene Erkennungssystem verwendet. Bilderkennung und Spracherkennung sind bekannte Beispiele davon.

Es gibt mehrere Online-Kurse fÃ¼r Deep Learning. Ein davon ist Neural Networks for Machine Learning. Der Unterricht ist immerhin fÃ¼r mich sehr gut, aber so akademisch, dass viele Leute den Kurs schlecht finden. Keinen anderen Kurs fÃ¼r Deep Learning kenne ich, obwohl es im Internet verschiedene Angebote gibt. Ich wollte irgendwann intensiv Deep Learning lernen wollte, aber trotzdem habe ich keinen Kurs auÃŸer dem Kurse von Prof. Hinton gemacht. Das liegt daran, dass ich die Theorie lernen wollte, so dass ich ein Modell ohne Framework schreiben kann.

Prof. Andrew Ng, der Dozent der Serie deeplearning.ai, ist Forscher von neuronalem Netz und bekannt fÃ¼r den Kurs Machine Learning. Im Kurs wird ein einfaches neuronales Netz (fully connected neural networks without regularisation) erklÃ¤rt. Der Kurs ist gleichzeitig praktisch und theoretisch. Deshalb habe ich erwartet, dass die Serie auch praktisch und theoretisch ist.

Die Serie

Wie ich geschrieben habe, besteht die Serie aus 5 Kursen und einen davon kann man noch nicht machen. Ãœber die genaue Beschreibung der Kurse kann man sich an dieser Seite informieren. Die Voraussetzung der Serie ist Kenntnisse auf Python. Idealerweise sollte man auch numpy kennen. NatÃ¼rlich muss man Kenntnisse auf Differentialrechnung und lineare Algebra haben. Kenntnisse auf Data-Mining ist nur gut zu haben.

1. Neural Networks and Deep Learning

Die EinfÃ¼hrung zum Deep Learning. Wer den Kurs "Machine Learning" von Prof. Andrew Ng gemacht hat, hat theoretisch das Inhalt schon gelernt. Also Themen sind einfach: Logistische Regression (als das einfachste neuronale Netz), Gradienten Verfahren, neuronales Netz. ReLU und tanh werden fÃ¼r eine "activation function" eingefÃ¼hrt.

Der Dozent erklÃ¤rt auch die Differentialrechnung. Aber Differentialrechnung ist "high school mathematics". Sie ist gar nicht schwer zu verstehen. Wer ein Modell mit maschinellem Lernen implementieren wollte, soll Differentialrechnung im Voraus lernen.

Was ich im Unterricht nicht mag, ist die Darstellung von "update". Also er schreibt

$$da = \frac{\partial \mathcal L}{\partial a}.$$

Das ist mir gar nicht akzeptabel. Deshalb habe ich immer $\delta a$ statt $da$ geschrieben.

Meiner Meinung nach ist der Kurs ein "touchstone" fÃ¼r andere Kurse: Wer diesen Kurs nicht leicht findet, kann anderen Kursen nicht folgen.

Das erste Bild in diesem Eintrag ist die Vorhersage des Modells, das ich fÃ¼r eine Aufgabe des Kurses gemacht habe. Die Anzahl der Units der hidden layers ist: 20, 7, 5, 2 und das Netz ist fully connected. (Also kein convolution.)

Die Katze des Fotos war in meinem Elternhaus. (Sie war irgendwohin weg.) Das Modell kann erfolgreich die Katze erkennen.

Kurs-Zertifikat

2. Improving Deep Neural Networks

Im Kurs geht es um die Optimierung (Gradienten Verfahren, Momentum, RMSprop, Adam) und regularization (weight decay, Dropout). In der letzten Woche wird Tensorflow als "deep learning framework" eingefÃ¼hrt. Die letzte Aufgabe ist die Erstellung eines neuronalen Netzes mit Tensorflow.

Die ErklÃ¤rung der Optimierung und der regularization ist richtig ausfÃ¼hrlich, wÃ¤hrend die ErklÃ¤rung von Tensorflow nur oberflÃ¤chlich ist. Aber sie ist genug fÃ¼r den Grund, warum man Tensorflow lernen soll.

Meiner Meinung nach ist ein Kriterium eines guten Kurses, dass man nach dem Kurs alles Gelerntes implementieren kann. Dieser Kurs erfÃ¼llt sicherlich das Kriterium.

Kurs-Zertifikat

3. Structured Machine Learning Projects

Dieser Kurs ist richtig Besonderes. Im Kurs geht es darum, wie man ein Projekt fÃ¼r deep learning durchfÃ¼hren kann/soll. Man lernt

wie man "training/dev/test" sets verwalten soll,
was man machen soll, wenn die Genauigkeit seines Modells schlecht ist, und
transfer learning.

Vor allem ist der erste Punkt ganz neu fÃ¼r mich und die Ã„ra von Big-Data fÃ¤llt mir ein. Normalerweise verteilt man eine Datenmenge in 3 Mengen: training set, validation set und test set. Wir nehmen an, dass die Verteilung der Daten gleich ist. Das liegt daran, dass das Ziel von statistischem Lernen ist, die Verteilung der Daten als ein mathematisches Modell darzustellen. Wir benutzen die Validation-Set, um ein gutes Modell auszuwÃ¤hlen und mit der Test-Set wird die Genauigkeit des trainierten Modell geschÃ¤tzt. (Vergessen Sie CV hier.)

--------------------------------------------------------
|        training set        | validation |    test    |
--------------------------------------------------------
             60%                   20%          20%

In einem Big-Data Projekt verteilt man die riesige Datenmenge wie das folgende Diagramm.

--------------------------------------------------------
|              training set               | dev | test |
--------------------------------------------------------
                   94%                       3%    3%

Weil die GroÃŸe der Daten wirklich riesig ist, sind 3% der Datenmenge noch groÃŸ genug. Beispielsweise entspricht 1% 10k Zeilen. Die Dev-Set entspricht der Velidation-Set in einem normalen Projekt.

Auffallend ist, dass man NICHT annimmt, dass die Training-Set und Dev-Set (Validation-Set) die gleiche Verteilung haben. Wichtig ist, dass die dev-Set und die test-Set die gleiche Verteilung haben, so dass man die Genauigkeit eines trainierten Modells mit dev-Set schÃ¤tzen kann.

Die Hauptsache, wir kÃ¶nnen das Muster der Daten mit neuronalem Netz herausfinden, wenn wir riesige Datenmenge haben. Angenommen, dass wir sehr viele (gute) Fotos von Tieren haben, die schon richtig klassifiziert wurden. (Foto von welchem Tier.) Dann kÃ¶nnen wir glauben, dass man das Muster von Katzen mit neuronalem Netz herausfinden kann. Also die Units kÃ¶nnen die Eigenschaften von Katze lernen. Das ist nur eine Annahme, aber wenn das trainierte neuronale Netz richtig Fotos in der Dev-Set klassifizieren kann, geht hervor, dass das Modell das Muster von Katzen gut erkennen kann und wir das Modell verallgemeinern kÃ¶nnen.

Das erste Bild in diesem Beitrag ist natÃ¼rlich nicht in der Training-Set, aber trotzdem kann das Modell die Katze erkennen. (Eigentlich ist die Training-Set sehr klein.)

Der dritte Punkt, transfer learning, ist eine verallgemeinerte Version der Nutzung eines trainierten Modells. Diese Idee ist nicht neu (e.g autoencoder). Aber die Idee von transfer learning schlÃ¤gt vor, proaktiv ein trainierte Modell in einem anderen Modell zu benutzen.

Man unterscheidet manchmal Deep Learning von maschinellem/statistischem Lernen. Vielleicht liegt das daran, was man in diesem Kurs lernen kann.

Kurs-Zertifikat

4. Convolutional Neural Networks

Convolutional Neural Network (CNN) ist ein typisches neuronales Netz, das oft fÃ¼r Bilderkennung verwendet wird. Meiner Meinung nach gibt es relativ viel praktische Themen im Kurs: Data Augmentation, transfer learning, konkrete Beispiele von CNN, usw. Vor allem finde ich, dass Face Recognition ein interessantes Thema ist, weil die Frage anders als eine normale Frage in maschinellem Lernen ist.

Ãœbrigens, "Adversarial examples" werden nicht im Kurs erwÃ¤hnt. (Kurze ErklÃ¤rung von adversarial examples.) Ich finde dieses Thema sehr wichtig, weil solche Beispiele hervorgehen, dass ein neuronales Netz eigentlich das Muster (oder die Gestalt) einer Objekt nicht gut erkennen kann. Also ein neuronales Netz kann anfÃ¤llig sein.

Neben einem CNN wird endlich Keras eingefÃ¼hrt. Keras ist ein "wapper class" von einem Deep Learning Framework, wie TensorFlor und Theano. Also mithilfe von Keras kann man ein neuronales Netz einfach erstellen. Es gibt drei Optionen fÃ¼r das Backend von Keras. Aber gerade unterstÃ¼tzt Google offiziell Keras. (cf. tf.keras)

In den Aufgaben erstellt man mehrere neuronale Netze und benutze trainierte Modelle auch. Das finde ich gut, aber die QualitÃ¤t des Python-Codes ist eigentlich nicht gut. (Es geht um die Definition einer Funktion.)

Kurs-Zertifikat

5. Sequence Models (coming soon)

Diesen Teil erzÃ¤hle ich, nachdem ich dem Kurs gemacht habe. Da er am 29.01. verÃ¶ffentlicht wird, schreibe ich Februar darÃ¼ber.

Share this page on

Categories: #rezension #data-mining