Real Data - April 2016 (5-6/6) [c r e s c e n t]

Real Data - April 2016 (5-6/6)

Published: ⏰ 2016-04-24 (Last Modified: 2017-06-18)

5) Image Upsampling

Die Aufgabe ist, ein kleines verkleinertes Bild zu vergrÃ¶ÃŸern. DafÃ¼r gibt es viele bekannte Methode. Ich habe das einfachste Algorithmus "Nearest-neighbor interpolation" implementiert. Ich wusste, dass ich eine hÃ¶here Note bekommen kÃ¶nnte, wenn ich ein kompliziertes Algorithmus wie "Bilinear interpolation" implementieren wÃ¼rde. Aber der Unterschied zwischen der hÃ¶chsten Note und meiner Note war weniger als 1. Deshalb habe ich nur das einfachste Algorithmus benutzt. (Aber falls ich ein kompliziertes Algorithmus benutzen wÃ¼rde, wÃ¤re ich unter den Top zehn...)

6) The Super Captcha Cracker

Die Aufgabe war am schwersten: Die Erfolgsrate war 0%. Die fÃ¼nf Buchstaben in einem "Captcha" sind abzulesen. Ein Beispiel von Captcha folgt.

Die richtige LÃ¶sung ist "QOSCG". Die allen vorhergesagten Buchstaben mÃ¼ssen richtig, damit ich die Note bekomme. 150 Muster sind gegeben.

Wenn man maschinelles Lernen fÃ¼r die Aufgabe verwendet, stehen wir vor einem groÃŸen Problem: Man kann keine Training-Daten auf dem Server benutzen. Deshalb muss man trainierte Parameter in den Quelltext einbetten, dessen GrÃ¶ÃŸe begrenzt ist.

Ich habe logistische Regression verwendet, weil es einfach ist, die trainierte Parameter einzubetten und zu benutzen. Meine Fortschritten sind:

Alle Muster monochrom und klein machen.
Alle Muster in fÃ¼nf Bilder teilen. Die geteilten Bilder sind die Training-Daten.
Ein Vorhersagemodell mit logistischem Regression machen.
Die trainierten Parameter ablesen und damit ein Vorhersagemodell implementieren.

Mein Vorhersagemodell hatte "overfitted". Das Modell kann die richtigen Buchstaben der Training-Daten finden, aber die Genauigkeit fÃ¼r die CV-Daten war ungefÃ¤hr 1%. Der "penalty parameter" spielte leider keine Rolle.

Der Teilnehmer auf Platz 1 hat ein kÃ¼nstliches neuronales Netz (475,80,26) verwendet. Ich hatte die gleiche Idee, aber ich habe keins verwendet, weil ich dachte, dass die trainierten Parameter sich in den Quelltext nicht einbetten lassen. Ich machte nÃ¤mlich vor Training ein Muster klein, weil die Liste von Parametern zu groÃŸ war. Der Top-Teilnehmer hat das Problem dadurch gelÃ¶st, den Parameter durch zlib zu verdichten.

Das Ergebnis dieses Wettbewerbs

Die Einstufung endet noch nicht, trotzdem ist die Rangliste fest. (Editorial ist noch nicht verÃ¶ffentlicht und das ist wahrscheinlich der Grund dafÃ¼r, dass die Einstufung noch nicht endet.) Wie Sie unter meiner Seite finden kÃ¶nnen, war ich auf Platz 12. Deshalb habe ich schon eine Nachricht von HackerRank bekommen, die mir den Gewinn mitteilt. Ich hÃ¤tte den Wettbewerb frÃ¼her beginnen sollen, so dass ich genug Zeit, ein kompliziertes Algorithmus zur VergrÃ¶ÃŸerung eines Bild zu implementieren.

Share this page on

Categories: #data-mining