Un altro approccio per identificare la multicollinearità è tramite il Variance Inflation Factor. Il VIF indica la percentuale della varianza gonfiata per il coefficiente di ogni variabile. Partendo da un valore di 1 (nessuna collinearità), un VIF tra 1-5 indica una collinearità moderata, mentre valori superiori a 5 indicano un’alta collinearità. Alcuni casi in cui un VIF elevato sarebbe accettabile includono l’uso di termini di interazione, termini polinomiali, o variabili dummy (variabili nominali con tre o più categorie). Le matrici di correlazione permettono di identificare la correlazione tra le coppie di variabili mentre il VIF permette la valutazione complessiva della multicollinearità. La matrice di correlazione per la maggior parte delle variabili continue è presentata di seguito per evidenziare le varie coppie di variabili collineari. Il VIF può essere calcolato utilizzando il pacchetto statsmodels; il blocco di codice sottostante presenta i valori VIF con le variabili collineari incluse (a sinistra) e rimosse (a destra).