Vorig schreef ik: 4 jaar aan data van GFS DMO's en hun correcties
Zodat het geen verrassing kan zijn dat we nu op een termijn van 5 jaar zitten
Als bron voor dienen de GFS00z en 12z runs die 2x per dag worden uitgelezen en verwerkt in een Excel sheet.
Dit start op het moment dat een dag nog 7 dagen in de toekomst ligt en eindigt op de daadwerkelijke dag zelf.
Dat levert voor de Tn een reeks van 16 DMO* waarden op (zie afbeelding 1), waar dit voor de Tx een reeks van 15 DMO* waarden is (zie afbeelding 2).
*DMO = Direct Model Output (ofwel, de ruwe modeluitvoer van de Opers van GFS00z en 12z)
Afbeelding 1:
Afbeelding 2:
Voor het bepalen van de DMO, maak ik gebruik van de T2m kaarten, waarop de temperatuur wordt uitgedrukt in stappen van 3 graden.
Om te bepalen welke temperatuurcategorie er voor De Bilt staat ingetekend, wordt de kleur van de pixel (waar De Bilt ligt) uitgelezen en vervolgens door de software omgezet naar de juiste categorie.
Per run levert dat een hele reeks aan data op, waarbij per dag de laagste (Tn) en hoogste (Tx) temperatuur worden gefilterd om te worden toegevoegd in het Excel sheet.
Een deel van zo'n reeks ziet er als volgt uit:
Bron: https://www.wetterzentrale.de
Run: 00z
Uitlezing: OP
Datum: 02-12-22
Plaats: De Bilt (578 / 394)
Uren vooruit | Datum | Tijdstip | Min. cat. | Max. cat.:
+0 | 02-12-22 | 00z | 3 | 6
+3 | 02-12-22 | 03z | 3 | 6
+6 | 02-12-22 | 06z | 3 | 6
+9 | 02-12-22 | 09z | 0 | 3
+12 | 02-12-22 | 12z | 3 | 6
+15 | 02-12-22 | 15z | 0 | 3
+18 | 02-12-22 | 18z | 0 | 3
+21 | 02-12-22 | 21z | 0 | 3 || 02-12-22 - Tn: 0 | 3 , Tx: 3 | 6
Voor 2 december 2022 zou op basis van bovenstaande uitvoer voor de Tn 0-3°C worden ingevoerd in Excel, terwijl dit voor de TX 3-6°C zal zijn.
Aan het eind wordt per kolom een gemiddelde van de hele reeks genomen en die waarden zijn zichtbaar bij "Tact G"
Beide waarden van Tact G worden vervolgens bij elkaar geteld en gedeeld door 2, om tot een gemiddelde van alle DMO te komen en die waarden zijn zichtbaar bij "Tact V"
Wanneer een dag voorbij is, vul ik de daadwerkelijke Tn en Tx van De Bilt in (zichtbaar bij "Tact W") en zie je als laatste de opgetreden afwijking (verschil tussen "Tact V" en "Tact W") voor die dag.
Al die data gaat in een groot totaal overzicht, maar wordt tevens gerangschikt per maand.
In onderstaande overzichten (afbeelding 3 en 4) staan alle afwijkingen van de aflopen 5 jaar.
Afbeelding 3:
Afbeelding 4:
Onderaan bovenstaand overzicht zijn de gemiddelde afwijkingen te zien over de gehele dataset.
Voor de Tn is dat:
- een gemiddelde positieve afwijking van 2,3°C
- een gemiddelde negatieve afwijking van -1,1°C
- een gemiddelde afwijking van 1,2°C
Voor de Tx is dat:
- een gemiddelde positieve afwijking van 1,1°C
- een gemiddelde negatieve afwijking van -1,6°C
- een gemiddelde afwijking van -0,9°C
Samengevat geeft dat aan dat GFS gemiddeld de Tn 1,2°C te hoog inschat en de Tx 0,9°C te laat inschat.
Omdat GFS bij stralingscondities (weinig/geen wind (of wind die weg valt) en geen bewolking of opklaringen die ontstaan) de plank qua Tn behoorlijk mis slaat, heb ik daar een stralingscorrectie voor bedacht.
Alle afwijkingen van de daadwerkelijke Tn ten opzichten van de gemiddelde DMO die meer dan 4°C zijn, tellen mee voor deze stralingscorrectie.
Op een totale dataset van 1826 dagen, is dit 197x gebeurd, wat neerkomt op een percentage van 10,79
De gemiddelde afwijking gedurende die 197x bedraagt 5°C zoals in onderstaand overzicht te zien is:
Tot op heden corrigeer ik de gemiddelde DMO met de gevonden gemiddelde afwijkingen, maar uiteindelijk is het mijn doel om correcties per seizoen of misschien zelfs per maand te gaan gebruiken.
Om inzichtelijk te krijgen of dat een meerwaarde zou hebben, heb ik de afwijkingen per seizoen én per maand gerangschikt.
Voor de Tn ziet dat er als volgt uit (zie afbeelding 5 en 6):
Afbeelding 5:
Afbeelding 6:
Dit levert een interessant beeld op.
Als we nog even in gedachten nemen dat de gemiddelde afwijking voor de Tn 1,2°C bedraagt en je dit dan vergelijkt met allereerst de seizoenen, dan zie je dat de lente (1,3°C) en zomer (1,2°C) hier heel dicht in de buurt zitten of zelfs exact gelijk zijn.
Voor die seizoenen zou het vooralsnog geen toegevoegde waarde hebben om een andere correctie te gaan gebruiken dan de gemiddelde afwijking over de hele dataset.
Kijk je echter naar de winter (0,8°C) en herfst (1,5°C) dan zou dit weldegelijk een toegevoegde waarden hebben.
Bekijk je vervolgens binnen een seizoen naar de afwijkingen per maand dan valt in de lente op dat april een afwijking heeft van 1,7°C , waardoor voor die maand een maandcorrectie een toegevoegde waarde zou zijn.
Waar de zomer als geheel niet gecorrigeerd hoeft te worden, zie je bij de individuele maanden wel grote verschillen (jun: 0,6°C , jul: 1,3°C , aug: 1,7°C)
In de winter zijn de verschillen tussen de verschillende maanden klein, maar in de herfst zie je dat september er met een afwijking van 1,9°C duidelijk uit springt.
Ook voor de Tx is een opsplitsing per seizoen en per maand gemaakt, zoals te zien is in afbeelding 7 en 8:
Afbeelding 7:
Afbeelding 8:
Met een gemiddelde afwijking voor de Tx van -0,9°C valt op dat de winter en herfst hierop geen afwijkingen laten zien.
In de lente (-1,4° en zomer (-0,6°C) zou een correctie per seizoen dan weer wel een meerwaarde kunnen hebben.
Kijk je echter naar de afzonderlijke maanden binnen de seizoenen, dan zijn daar wel maanden te vinden waarbij een maandcorrectie een meerwaarde zou kunnen hebben.
Al met al ontstaat er ieder jaar een beter beeld van waar en hoeveel GFS-uitvoer gecorrigeerd moet worden om tot een betrouwbare verwachting voor Tn en Tx te komen (op één cijfer achter de komma).
Het behoeft waarschijnlijk geen toelichting dat alles in beginsel valt of staat met wat GFS als uitvoer geeft.
Als de Opers voor een bepaalde dag er run na run helemaal naast zitten (afgelopen zomer was hier het meest schrijnende voorbeeld van) dan kan ook een rekenmodel zoals hierboven toegelicht, de meubels niet meer redden.
Op naar volgend jaar december, wanneer ik een toelichting kan geven op 6 jaar aan data.