Een computer laten leren zonder dat je die expliciet hoeft te programmeren – dat klinkt als science fiction, maar is realiteit. Er bestaan algoritmen die kunnen leren van data. Daardoor kunnen ze voorspellingen doen die de menselijke logica te boven gaan. OrtaX werkt al met een statistisch zeer geavanceerd en goed presterend waarderingsmodel, preciezer gezegd een Hiërarchisch Trendmodel (HTM)[1]. In dit model worden op basis van de kenmerken van objecten zogeheten vaste coëfficiënten bepaald, die worden aangevuld met verschillende tijdafhankelijke trends per gebied en woningcategorie. Zo is het model altijd in staat een robuuste modelwaarde te genereren die de marktbewegingen volgt. De techniek van het modelleren gaat echter steeds verder. Met OrtaX willen we voorop blijven lopen in de markt. Zou machine learning kunnen leiden tot betere modellen?

Onder leiding van Marc Francke hebben we bij Ortec Finance onderzocht of machine learning in de toekomst een rol kan spelen bij het modelleren van de huizenprijzen in Nederland. ‘Velen kennen de prijs, slechts enkelen de waarde’ is een veelgebruikt spreekwoord in de vastgoedwereld. Hoe beter je de waarde kunt voorspellen, hoe beter de kwaliteit van de taxaties wordt. Dit geldt zeker voor de jaarlijkse WOZ-waarderingen. Daarom hebben we het huidige HTM-model van OrtaX vergeleken met de modellen op basis van machine learning. We hebben de uitkomsten van drie verschillende modellen met elkaar vergeleken.

  • Het Hiërarchisch Trendmodel (HTM)
  • Modellen op basis van machine learning
  • Hybride varianten van beide modellen

Verkooptransacties

Het onderzoek is opgezet met verkooptransacties in Nederland van 2009 tot en met 2015. Hiermee zijn de verschillende modellen geschat. Het berekende model werd vervolgens gebruikt om de transacties uit 2016 van een geprognosticeerde waarde te voorzien. Deze prijzen waren immers bekend. Hoe beter het model aansluit op deze gerealiseerde transacties, hoe groter de kwaliteit. Het is hierbij erg belangrijk dat het model getoetst wordt aan data die niet bij het modelleren betrokken zijn. Dat geeft een indicatie van de robuustheid van het model en is een objectieve maatstaf. Het voorspellen van de toekomstige waardes is cruciaal voor een model dat jaar op jaar constant presteert.

“Tot onze verrassing bleek dat de hybride variant, waarin de traditionele econometrische uitgangspunten gecombineerd worden met moderne machine learning-technieken, het nauwkeurigst is.”

Transparant

Het Hiërarchisch Trendmodel is een transparant model. De coëfficiënten zijn verbonden aan kenmerken van woningen. Hierdoor is het altijd mogelijk de WOZ-waarde te verklaren aan de hand van de overeenkomsten en verschillen tussen het getaxeerde object en de gehanteerde onderbouwingen. Dit is cruciaal voor WOZ-waarderingen, aangezien die altijd verklaard moeten kunnen worden aan de burger die ermee geconfronteerd wordt. Algoritmen die gegenereerd worden door machine learning kunnen nauwkeuriger resultaten opleveren dan traditionele modellen, maar ze hebben bij WOZ-waarderingen een belangrijk nadeel. De berekeningen zijn namelijk dermate complex dat er geen relatie meer te leggen is tussen de input en de output. Dat betekent dat het model op basis van machine learning in dit geval een ‘black box’ is. Een hybride variant van beide modellen, waarbij de modellering van de vaste coëfficiënten wordt vervangen door machine learning, levert wellicht de beste oplossing op. Hiermee wordt de nauwkeurigheid van machine learning benut, terwijl het model inzichtelijk blijft en WOZ-waarderingen dus verklaard kunnen worden. De trends blijven hierbij intact.

Resultaten

De resultaten van het onderzoek zijn als volgt samen te vatten. Zoals verwacht presteren de modellen op basis van machine learning beter dan het meer traditionele econometrische HTM-model. Tot onze verrassing bleek echter dat de hybride variant, waarin de traditionele econometrische uitgangspunten gecombineerd worden met moderne machine learning-technieken, het nauwkeurigst is. De gemiddelde absolute fout is ruim 2% lager!

Het machine learning-model dat het best presteerde was het model dat gebaseerd is op neurale netwerken. Hiermee is duidelijk geworden dat er meer onderzoek nodig is naar de toepassing van deze hybride modellen. Wij houden je uiteraard op de hoogte van de ontwikkelingen. Houd hiervoor onze Insights-pagina in de gaten.

Meer informatie?

Meer weten over machine learning? Neem dan contact op met Maarten-Jan Evers.

[1] Marc Francke. The hierarchical trend model. Mass Appraisal Methods. An International Perspective for Property Valuers, pagina’s 164-180, 2008.