## R Ue4T2.2 hprice1 Preisbildung bei Einfamilienhäusern USA ## Ist die Bewertung der Haeuser durch den Makler unverzerrt? ## price ... Verkaufspreis ## assess ... Schaetzwert ## lotsize ... Grundstuecksflaeche ## sqrft ... m2 (Quadrat-Fuss) ## bdrms ... Anzahl der Schlafzimmer #setwd("C:/MH/WU/LV/OEKONOMETRIE_BA/Oe1_WS23/Chp4/EXERCISES/") setwd("C:/Users/hoersaal/Downloads/") source("BasicStatistics_R.txt") # Daten einlesen dat <- read.table("hprice1.csv", sep=";", dec=",", header=TRUE, na.strings = "#NV", fill = TRUE, comment.char="") ## Daten anschauen head(dat) tail(dat) dim(dat) # Zeitreihen n=47 k=9 (Variablen) names(dat) # Namen der Variablen hist(dat$price) # Historgramm von price basic_stats(dat$price) hist(log(dat$price)) # Histogramm von log(price), log-Transformation im Modell require(RcmdrMisc) # diskrete Haeufigkeitsvtlg discretePlot(dat$bdrms) # soll die Variable bdrms in logs oder ohne log verwendet werden? ## unrestringiertes Modell # log(price) = a0 + a1 log(assess) + a2 log(lotsize) + a3 log(sqrft) + a4 bdrms + u mod_UR <- lm(log(price) ~ log(assess) + log(lotsize) + log(sqrft) + bdrms + 1, data=dat) summary(mod_UR) ## Was sagt die F-Statistik? # Wir berechnen RSS: res' x res RSS_UR <- t(mod_UR$residuals) %*% mod_UR$residuals # t(...) ... transponiert # %*% ... Matrixmultiplikation ## restringiertes Modell # log(price) = b0 + 1*log(assess) + 0*log(lotsize) + 0*log(sqrft) + 0*bdrms + v # [log(price) - log(assess)] = b0 + v mod_R <- lm( (log(price) - log(assess)) ~ 1, data=dat) summary(mod_R) ## Was sagt die F-Statistik? # Wir berechnen RSS: res' x res RSS_R <- t(mod_R$residuals) %*% mod_R$residuals cat("RSS_UR unrestricted:", RSS_UR, " RSS_R restricted:", RSS_R, "\n") cat("Welcher Wert ist groesser? Und wieso?","\n") # n <- length(dat$price) F <- ... ## siehe Folie 20 in Kap 4 Teil 2 ## ... p-Wert zur F-Vtlg mit (1,n-2-1) FGen zur Realistaion F # hier ueber das rechte Ende der Vtlg berechnet (!= auf den Folien) pf(F,1,(n-2-1), lower.tail=F) # pf(...) Flaeche unter F-Vtlg standardmaessig # links! - Hier aber rechts (lower.tail=FALSE)! ## Krtischer Wert zur F(1, n-2-1) mit rechts 5% qf(0.05, 1, (n-2-1), lower.tail=F) ## Was ist die Nullhypothese H0, was die Alternative H1 ? ## Plot der Test-Vtlg, F(1,85) x <- seq(0,5, length=100) yd <- df(x,1,(n-2-1)) plot(x,yd, type="l") # Dichte d F-Vtlg yq <- pf(x,1,(n-2-1)) plot(x,yq, type="l") # Vtlgs-Funktion d F-Vtlg ## b) ...