lab 9_reg logit
lab 9_ LOGIT.txt
—
Plain Text,
1 kB (1672 bytes)
Contenuto del file
logit model
statistica multivariata
2019/2020
MINI VALENTINA
########################
getwd()
#change directory --> passito
pass=read.csv2("passito.csv",header=T)
attach(pass)
str(pass)
summary(pass) # per vedere i valori tendenziali delle variabili
#1.creaiamo la variabile dicotomica LIKE_PASSITO
# interveniamo sul dataset: se 7 o 6 --> 0 (referenza) se 0;5 --> 1 (non mi piace)
#2. creiamo la variabile dicotomica SEX: 0 femmine; 1 mashio
#3. creiamo anche la variabile dicotomica LIKE_WINE
#4. creiamo la variabile politomica AGE_RANK:
da 17 e 19: 0 (giovanissimi)
da 20 a 25: 1 (molto giovani)
da 26 a 36: 2 (giovani)
da 37 a 47: 3 adulti
da 48 a 58: 4 maturi
da 59 a 69: 5 pensione
da 70 a 79: 6 anziani
# PRIMA DOMANDA DI RICERCA: la possibilit� di amare il passito � legata al genere?
xtabs(~LIKE_PAS+SEX,data=pass) # tavola di contingenza
# modello :
#P(Y)=exp(b0+b1x1)/eexp(b0+b1x1)+1 --> la probabilit� di Y di essere "vera" basata su alcuni parametri
#risposta: si, la probabilit� di amare il passito � legata al genere: infatti gli uomini hanno meno probabilit� di amare il passito (-0.7402)
# il modello non � buono (differenza tra null deviance eresidual deviance molto bassa)
# ma il genere pu� essere una variabile di "contesto"
# aggiungiamo alcuni predittori e consideriamo il genere come variabile di controllo
RISPONDETE ALLE SEGUENTI DOMANDE DI RICERCA
# seconda domanda di ricerca:
# la possibilit� di amare il passito � legata all'et�?
# terza domanda di ricerca:
# la possibilit� di amare il passito � legata alla preferenza per il vino in genere?