• Nem Talált Eredményt

Regressione lineare: Per salvare nuove variabili

Figura 16-4

Finestra di dialogo Regressione lineare: Salva

È possibile salvare valori attesi, residui e altre statistiche utili per la diagnostica. Ogni selezione aggiunge una o più nuove variabili alfile dati attivo.

Valori attesi. I valori previsti dal modello di regressione per ogni caso.

„ Non standardizzati.I valori risultanti dal modello per la variabile dipendente e per ciascun caso.

„ Standardizzati.Una trasformazione di ciascun valore atteso nella sua forma standardizzata.

ovvero il valore atteso medio viene sottratto dal valore atteso e la differenza viene divisa per la deviazione standard dei valori attesi. I valori attesi standardizzati hanno media 0 e deviazione standard 1.

Regressione lineare

„ Corretti.Il valore atteso per un caso quando quel caso è escluso dal calcolo dei coefficienti di regressione.

„ Errore standard dei valori stimati.L’errore standard della media per i valori stimati. Una stima della deviazione standard del valore medio della variabile dipendente per i casi che hanno gli stessi valori delle variabili indipendenti.

Distanze.Misure per l’identificazione dei casi con combinazioni di valori insolite per le variabili indipendenti e dei casi che possono avere un notevole peso sul modello di regressione.

„ Di Mahalanobis.Una misura della distanza di un caso dalla media di tutti i casi per le variabili indipendenti. Un’elevata distanza di Mahalanobis indica che un caso include valori estremi per una o più variabili indipendenti.

„ Di Cook.Una misura di quanto cambierebbero i residui di tutti i casi se un particolare caso fosse escluso dal calcolo dei coefficienti di regressione. Valori alti indicano che l’esclusione di un caso dal calcolo dei coefficienti di regressione ne modificherebbe sostanzialmente il valore.

„ Valori di influenza.Una misura dell’influenza di un dato sull’adattamento della regressione.

L’influenza centrata varia da 0 (nessuna influenza sull’adattamento) a (N-1)/N.

Intervalli di previsione.I limiti superiore ed inferiore per gli intervalli di previsione singoli e medi.

„ Media. Limiti inferiore e superiore (due variabili) per l’intervallo di stima della risposta media prevista.

„ Singolo caso.Limiti inferiore e superiore (due variabili) per l’intervallo di stima della variabile dipendente per un singolo caso.

„ Intervallo di confidenza.Immettere un valore compreso fra 1 e 99,99 per specificare l’intervallo di confidenza per i due intervalli di stima. Per disporre di questa opzione è necessario aver selezionato Media o Individuale. I valori tipici dell’intervallo di confidenza sono 90, 95 e 99.

Residui. Il valore effettivo della variabile dipendente meno il valore atteso dall’equazione di regressione.

„ Non standardizzati.La differenza tra un valore osservato e il valore stimato dal modello.

„ Standardizzati. Il residuo diviso per una stima della deviazione standard. Il residuo

standardizzato, conosciuto anche come residuo di Pearson, ha media 0 e deviazione standard 1.

„ Studentizzati.Il residuo diviso per una stima della sua deviazione standard che varia da caso a caso, a seconda della distanza tra i valori assunti per questo caso dalle variabili indipendenti e le medie delle variabili indipendenti.

„ Per cancellazione. Il residuo per un caso se quel caso venisse escluso dal calcolo dei coefficienti di regressione. È la differenza tra il valore della variabile dipendente e il valore stimato corretto.

„ Per cancellazione studentizzati.Il residuo cancellato per un caso diviso per il suo errore standard. La differenza tra un residuo cancellato studentizzato e il suo corrispondente residuo studentizzato indica quanta differenza produca l’eliminazione di un caso sulla stima del medesimo.

Statistiche di influenza. La modifica nei coefficienti di regressione (DiffBeta) e nei valori attesi (DiffAdatt) che risultano dall’esclusione di un particolare caso. I valori DiffBeta e DiffAdatt standardizzati sono anche disponibili con il rapporto di covarianza.

108 Capitolo 16

„ Differenza in beta.Variazione del coefficiente di regressione quando un caso particolare viene eliminato dall’analisi. Viene calcolato un valore per ogni termine del modello, incluso il termine costante.

„ DiffBeta standardizzate.La differenza standardizzata nel valore beta. La variazione di un coefficiente di regressione quando un caso viene rimosso dall’analisi. Possono essere esaminati i casi con valore assoluto superiore a 2 diviso per la radice quadrata di N, dove N è il numero dei casi. Viene calcolato un valore per ogni termine del modello, incluso il termine costante.

„ DiffAdatt.La differenza nel valore adattato è il cambiamento del valore previsto quando un caso viene escluso dall’analisi.

„ DiffAdatt standardizzata.La differenza standardizzata nel valore adattato. La variazione del valore stimato quando un caso viene rimosso dall’analisi. Si possono esaminare valori standardizzati maggiori in valore assoluto a 2 per la radice quadrata di p/N, dove p è il numero di parametri del modello e N è il numero di casi.

„ Rapporto di covarianza.Rapporto fra il determinante della matrice di covarianza con un caso escluso dal calcolo dei coefficienti di regressione ed il determinante con tutti i casi inclusi. Se il rapporto è vicino a 1, il caso non altera significativamente la matrice di covarianza.

Statistiche dei coefficienti.Salva i coefficienti di regressione in unfile di dati. Ifile di dati possono anche essere riutilizzati nella stessa sessione, ma non vengono salvati comefile a meno che siano stati salvati come tali allafine della sessione. I nomi degli insiemi di dati devono essere conformi alle regole dei nomi delle variabili.

Esporta informazioni modello in file XML.Le stime dei parametri e, se si desidera, le relative covarianze vengono esportati nelfile specificato in formato XML (PMML). È possibile utilizzare questofile di modello per applicare le informazioni del modello ad altrifile di dati per il calcolo del punteggio.