Problem A
Chongmetrisk katastrof
Languages
en
sv
Det har skett en jordbävning i den avancerade staden Chongmetry, som är helt uppbyggd av matematiska formler. Alla broar har förstörts, och du har blivit anlitad för att reparera dem.
Du har fått x- och y-koordinater från de delar av broarna
som fortfarande står kvar. Du har också fått x-positionerna för
de trasiga delarna av broarna, där nya pelare ska byggas. Ditt
jobb är att bestämma höjden på dessa pelare så att bron återfår
sin ursprungliga form. ![\includegraphics[width=0.50\textwidth ]{./broken_bridge.png}](/problems/chongmetry/file/statement/sv/img-0001.png)
För den här uppgiften är träningsdata givet och det är inte tillåtet att hitta egen träningsdata på internet.
Indata
Ladda ner filen med tränings- och testdata. Dessa finns längst ner under “attachments”. Du kommer att få en zip-fil som innehåller:
-
train.csv - data som beskriver de hela delarna av broarna med x- och y-positioner.
-
test.csv - data som beskriver positioner där pelare ska byggas för varje bro.
Filen train.csv innehåller:
-
x - Öst-Väst-position i meter.
-
y - Nord-Syd-position i meter.
-
function_id - Det unika id-numret för en specifik bro.
Filen test.csv innehåller:
-
x - Öst-Väst-positionen i meter.
-
function_id - Det unika id-numret för en specifik bro.
Utdata
För varje rad i test.csv ska du skriva ut den förutsagda y-koordinaten för brons höjd på den positionen.
Exempel
Indata (test.csv)
x, bridge_id 0.0230414009098678,0 0.2002533893994107,0 0.2434611332892733,0 0.2465272413496277,0
Utdata
-0.8987764984440185 -0.8976034961618553 -0.8970351768669409 -0.8969906419752334
Poängsättning
Om $D$ är medelvärdet av alla skillnader mellan din förutsagda y-koordinat och den sanna y-koordinaten, begränsat till 0.5. Med andra ord, $D = \frac{1}{n} \sum _{i=1}^{n} \min (0.5, |y_i - y_i'|)$.
Den slutliga poängen beräknas genom att jämföra din lösnings genomsnittliga fel, $D$, med två referensvärden: ett idealpoäng, $B_\text {best} = 0.1$, och ett baslinjepoäng, $B_\text {baseline} = 0.5$. Lägre fel ger högre poäng.
Specifikt är formeln:
\[ \text{Poäng} = \max \left(0, \min \left(100, \frac{B_\text {baseline} - D}{B_\text {baseline} - B_\text {best}} \times 100 \right)\right) \]Vid slutet av tävlingen testas alla lösningar om på resterande 70% av datan. Din poäng i slutet av tävlingen är alltså endast poängen på de resterande 70% av datan, de 30% som du testats på hittills har ingen påverkan. Det är garanterat att de 30% som testas under tävlingen har valts uniformt slumpmässigt och är helt disjunkta från de 70% som du testas på i slutet. Därmed borde resultaten på de 30% som du testas på under tävlingen ses som en stark indikator på hur bra din lösning är. Samtidigt är det dåligt överanpassa (overfitta) din lösning till testdatan.
