## R Ue6.4 hprice1 Preisbildung bei Einfamilienhäusern USA ## Ist die Bewertung der Haeuser durch den Makler unverzerrt? ## price ... Verkaufspreis ## assess ... Schaetzwert ## lotsize ... Grundstuecksflaeche ## sqrft ... m2 (Quadrat-Fuss) ## bdrms ... Anzahl der Schlafzimmer #setwd("C:/MH/WU/LV/OEKONOMETRIE_BA/Oe1_WS23/Chp6/EXERCISES/") setwd("C:/Users/hoersaal/Downloads/") source("BasicStatistics_R.txt") # Daten einlesen dat <- read.table("hprice1.csv", sep=";", dec=",", header=TRUE, na.strings = "#NV", fill = TRUE, comment.char="") ## Daten anschauen #head(dat) #tail(dat) #dim(dat) names(dat) # Namen der Variablen #hist(dat$price) # Historgramm von price #basic_stats(dat$price) #hist(log(dat$price)) # Histogramm von log(price), log-Transformation im Modell #require(RcmdrMisc) # diskrete Haeufigkeitsvtlg #discretePlot(dat$bdrms) # soll die Variable bdrms in logs oder ohne log verwendet werden? ## Es sollen 4 verschiedene Modelle unten durchprobiert und verglichen werden n_mod <- 4 mod_ICs <- rep(NA,n_mod*2); dim(mod_ICs) <- c(n_mod,2) ## Modell 1 vorgegeben (Modell nur mit Konstanter) # log(price) = a0 + u mod_1 <- lm(log(price) ~ 1, data=dat) summary(mod_1) mod_ICs[1,1] <- AIC(mod_1); mod_ICs[1,2] <- BIC(mod_1); cat("Modell 1: ","AIC= ", AIC(mod_1), "BIC= ", BIC(mod_1), "\n") ## ... Probieren sie 2 weitere Modellspezifikationen ## Modell 2 # log(price) = a0 + ... + u ## HIER IHRE MODELLSPEZIFIKATION mod_2 <- lm(log(price) ~ ... + 1, data=dat) ## HIER IHRE MODELLSPEZIFIKATION summary(mod_2) mod_ICs[2,1] <- AIC(mod_2); mod_ICs[2,2] <- BIC(mod_2); cat("Modell 2: ","AIC= ", AIC(mod_2), "BIC= ", BIC(mod_2), "\n") ## Modell 3 # log(price) = a0 + ... + u ## HIER IHRE MODELLSPEZIFIKATION mod_3 <- lm(log(price) ~ ... + 1, data=dat) ## HIER IHRE MODELLSPEZIFIKATION summary(mod_3) mod_ICs[3,1] <- AIC(mod_3); mod_ICs[3,2] <- BIC(mod_3); cat("Modell 3: ","AIC= ", AIC(mod_3), "BIC= ", BIC(mod_3), "\n") ## ## Modell 4 vorgegeben (Modell mit allen Variablen) # log(price) = a0 + a1 log(assess) + a2 log(lotsize) + a3 log(sqrft) + a4 bdrms + u mod_4 <- lm(log(price) ~ log(assess) + log(lotsize) + log(sqrft) + bdrms + 1, data=dat) summary(mod_4) mod_ICs[4,1] <- AIC(mod_4); mod_ICs[4,2] <- BIC(mod_4); cat("Modell 4: ","AIC= ", AIC(mod_4), "BIC= ", BIC(mod_4), "\n") ## Welche Modellspezifikation scheint die geeignetste zu sein? cat(" AIC BIC","\n") mod_ICs