Hide

Problem A
Chongmetrisk katastrof

Languages en sv

Det har skett en jordbävning i den avancerade staden Chongmetry, som är helt uppbyggd av matematiska formler. Alla broar har förstörts, och du har blivit anlitad för att reparera dem.

Du har fått x- och y-koordinater från de delar av broarna som fortfarande står kvar. Du har också fått x-positionerna för de trasiga delarna av broarna, där nya pelare ska byggas. Ditt jobb är att bestämma höjden på dessa pelare så att bron återfår sin ursprungliga form. \includegraphics[width=0.50\textwidth ]{./broken_bridge.png}

För den här uppgiften är träningsdata givet och det är inte tillåtet att hitta egen träningsdata på internet.

Indata

Ladda ner filen med tränings- och testdata. Dessa finns längst ner under “attachments”. Du kommer att få en zip-fil som innehåller:

  • train.csv - data som beskriver de hela delarna av broarna med x- och y-positioner.

  • test.csv - data som beskriver positioner där pelare ska byggas för varje bro.

Filen train.csv innehåller:

  • x - Öst-Väst-position i meter.

  • y - Nord-Syd-position i meter.

  • function_id - Det unika id-numret för en specifik bro.

Filen test.csv innehåller:

  • x - Öst-Väst-positionen i meter.

  • function_id - Det unika id-numret för en specifik bro.

Utdata

För varje rad i test.csv ska du skriva ut den förutsagda y-koordinaten för brons höjd på den positionen.

Exempel

Indata (test.csv)

x, bridge_id
0.0230414009098678,0
0.2002533893994107,0
0.2434611332892733,0
0.2465272413496277,0

Utdata

-0.8987764984440185
-0.8976034961618553
-0.8970351768669409
-0.8969906419752334

Poängsättning

Om $D$ är medelvärdet av alla skillnader mellan din förutsagda y-koordinat och den sanna y-koordinaten, begränsat till 0.5. Med andra ord, $D = \frac{1}{n} \sum _{i=1}^{n} \min (0.5, |y_i - y_i'|)$.

Den slutliga poängen beräknas genom att jämföra din lösnings genomsnittliga fel, $D$, med två referensvärden: ett idealpoäng, $B_\text {best} = 0.1$, och ett baslinjepoäng, $B_\text {baseline} = 0.5$. Lägre fel ger högre poäng.

Specifikt är formeln:

\[ \text{Poäng} = \max \left(0, \min \left(100, \frac{B_\text {baseline} - D}{B_\text {baseline} - B_\text {best}} \times 100 \right)\right) \]

Vid slutet av tävlingen testas alla lösningar om på resterande 70% av datan. Din poäng i slutet av tävlingen är alltså endast poängen på de resterande 70% av datan, de 30% som du testats på hittills har ingen påverkan. Det är garanterat att de 30% som testas under tävlingen har valts uniformt slumpmässigt och är helt disjunkta från de 70% som du testas på i slutet. Därmed borde resultaten på de 30% som du testas på under tävlingen ses som en stark indikator på hur bra din lösning är. Samtidigt är det dåligt överanpassa (overfitta) din lösning till testdatan.

Please log in to submit a solution to this problem

Log in