Les mod?les logit et probit sont appropriés lorsque vous tentez de modéliser une variable dépendante dichotomeuse, par exemple oui/non, d`accord/désaccord, like/aversion, etc. Les probl?mes liés ? l`utilisation de la ligne de régression linéaire famili?re sont plus facilement compris visuellement. Par exemple, disons que nous voulons modéliser si quelqu`un fait ou n`a pas la fi?vre Bieber par la quantité de bi?re qu`ils ont consommé. Nous recueillons des données d`une maison de fraternité collégiale et essayons de modéliser la relation avec la régression linéaire (OLS). Les mod?les logit et probit résolvent chacun de ces probl?mes en ajustant une fonction non linéaire aux données qui ressemblent ? ce qui suit: logit et probit diff?rent dans la façon dont ils définissent f (*). Le mod?le logit utilise quelque chose appelé la fonction de distribution cumulative de la distribution logistique. Le mod?le probit utilise quelque chose appelé la fonction de distribution cumulative de la distribution normale standard pour définir f (*). Les deux fonctions prendront n`importe quel nombre et la redimensionner pour tomber entre 0 et 1. Par conséquent, quel que soit ? + ?x égal, il peut ?tre transformé par la fonction pour donner une probabilité prédite. Toute fonction qui renverra une valeur entre zéro et un ferait l`affaire, mais il y a un mod?le théorique plus profond sous-tendant logit et probit qui exige que la fonction soit basée sur une distribution de probabilité. La logistique et standard CDFS normaux s`avérer commode mathématiquement et sont programmés dans ? peu pr?s n`importe quel paquet statistique ? usage général. Le post précédent: mai 2015 Webinar des membres: transformations et effets non linéaires dans les mod?les linéaires est-ce mieux que le probit, ou vice versa? Les deux méthodes donneront des inférences similaires (quoique non identiques). Logit ? également connu sous le nom de régression logistique ? est plus populaire dans les sciences de la santé comme l`épidémiologie en partie parce que les coefficients peuvent ?tre interprétés en termes de ratios de cotes.

Les mod?les probit peuvent ?tre généralisés pour tenir compte des écarts d`erreur non constants dans les param?tres économétriques plus avancés (connus sous le nom de mod?les hétérokedastic probit) et sont donc utilisés dans certains contextes par les économistes et les politologues. Si ces applications plus avancées ne sont pas pertinentes, qu`il n`importe pas quelle méthode vous choisissez d`aller avec. La régression logistique a été développée par le statisticien David Cox en 1958. 1 [2] le mod?le de régression logistique binaire a des extensions ? plus de deux niveaux de la variable dépendante: les sorties catégorielles avec plus de deux valeurs sont modélisées par la régression logistique multinomiale, et si les catégories multiples sont ordonnées, par ordinale régression logistique, par exemple le mod?le logistique ordinale de cotes proportionnelles. [1] le mod?le lui-m?me modélise simplement la probabilité de sortie en termes d`entrée, et n`effectue pas de classification statistique (ce n`est pas un classifieur), bien qu`il puisse ?tre utilisé pour faire un classifieur, par exemple en choisissant une valeur de coupure et en classant les entrées avec probabilité supérieure ? la coupure comme une classe, en dessous de la coupure comme l`autre; C`est une façon courante de faire un classifieur binaire.