Beispiel 1 Es fanden drei Wettkämpfe in drei unterschiedlichen Ländern statt. Folgende Wertungen erhielt Österreich: Land 1: 12.1,11.6,10.2,13.4,11.2 Land 2: 14.7,17.9,16.8,14.2,15.7 Land 3: 13.2,9.4,15.1,14.0,14.5,10.2 Es wird angenommen, dass die Wertungen in jedem Land identisch und normalverteilte Zufallsvariablen sind. Fragestellung: Gibt es signifikante Unterschiede (zum Niveau 1%) in den Ländern in Bezug auf die Wertungen? Lösung in Sage: L1 = r.c(12.1,11.6,10.2,13.4,11.2) L2 = r.c(14.7,17.9,16.8,14.2,15.7) L3 = r.c(13.2,9.4,15.1,14.0,14.5,10.2) X = r.c(L1,L2,L3) print X Y = r.factor(len(L1)*[1]+len(L2)*[2]+len(L3)*[3]) print Y Z = r.data_frame(X,Y) print Z V = r.aov(X.tilde(Y), Z) print r.summary(V) Vkrit = r.qf(0.99,2,13) print Vkrit Antwort: Die Nullhypothese wird verworfen. Beispiel 2 Ein Blumengeschäft hat folgende durchschnittliche Verkaufszahlen von Rosen für die Wochentage Mo-So verzeichnet: Mo: 41 Di: 43 Mi: 55 Do: 38 Fr: 69 Sa: 70 So: 48 Fragestellung: Kann man annehmen, dass der Wochentag keinen Einfluss auf die Verkaufszahlen hat? (Signifikanzniveau = 5%) Lösung in Sage: x = r.c(41,43,55,38,69,70,48) print sum(x)/7 Chi = r.chisq_test(x) print Chi Chikrit = r.qchisq(0.95,6) print Chikrit Antwort: Die Nullhypothese wird verworfen. Beispiel 3 Die Torstatistik eines Landes sah in der letzten Spielsaison folgendermaßen aus: O Tore : 1 Mal 1 Tor : 50 Mal 2 Tore : 64 Mal 3 Tore : 53 Mal 4 Tore : 38 Mal 5 Tore : 10 Mal 6 Tore : 5 Mal 7<= Tore : 2 Mal Fragestellung: Kann man behaupten, dass die Anzahl der geschossenen Tore in einem Match einer Poissonverteilung unterliegen? (Signifikanzniveau = 5%) Lösung in Sage: x = r.c(28,50,64,53,38,10,5,2) print 'len(x)=', len(x) k = len(x) print x y = [(i-1)*x[i] for i in range(1,k)] print 'y=', y n = sum(x) print n print sum(y) lamda = sum(y)/n print 'lamda=', lamda Pois = [r.dpois(i,lamda) for i in range(0,k-1)] Pois.append(1-sum(E)) print 'Poisson=', Pois print [Pois[i]*n for i in range(0,k)] chi =r.chisq_test(x,p=Pois) print chi chikrit = r.qchisq(0.95,k-1) print 'chikrit=', chikrit Antwort: Die Nullhypothese wird behalten. Beispiel 4 Bei Studenten soll untersucht werden, ob die Studiendauer auf die Note bei der Statistikprüfung einen Einfluss hat. (Signifikanzniveau = 5%) <=3 Jahre: 13 Einser, 20 Zweier, 24 Dreier, 18 Vierer, 32 Fünfer 4-6 Jahre: 15 Einser, 30 Zweier, 20 Dreier, 33 Vierer, 32 Fünfer 7<= Jahre: 5 Einser, 15 Zweier, 9 Dreier, 20 Vierer, 8 Fünfer x = r.c(13,20,24,18,32,15,30,20,33,32,5,15,9,20,8) X = r.matrix(x, nrow=3, byrow='TRUE') print X cS = r.colSums(X) print 'cS=', cS rS = r.rowSums(X) print 'rS=', rS print sum(X) relH = r.colSums(X)/sum(X) print relH erwZ = [ rS[i]*relH for i in range(1,4)] Z = (r.matrix(erwZ, nrow=3, byrow='TRUE')) print Z C = r.chisq_test(X) print C Ckrit = r.qchisq(0.95,8) print Ckrit Antwort: Die Nullhypothese wird behalten. Beispiel 5 Eine Stichprobe von 15 Sachertorten ergab folgende Preise: 4.5, 3.6, 3.7, 4.0, 5.1, 5.0, 3.8, 4.8, 4.0, 3.9, 4.8, 3.5, 4.2, 4.1, 3.8 Fragestellung: Überprüfe, ob die Preise zum Signifikanzniveau 0.1 durch eine a)normalverteilte, b)uniformverteilte Zufallsvariable beschrieben werden können. x = r.c(4.5,3.6,3.7,4.0,5.1,5.0,3.8,4.8,4.0,3.9,4.8,3.5,4.2,4.1,3.8) print x mu = mean(x) s = sqrt(variance(x)) K = r.ks_test(x, 'pnorm', mu, s) K1 = r.ks_test(x, 'punif', min(x), max(x)) print K print K1 Antwort: a)Die Nullhypothese wird verworfen. b)Die Nullhypothese wird behalten.