Monday 13 February 2017

Wie Zu Berechnen Neigung Score In Stata Forex

Häufigkeits-Score Matching in Stata mit teffects Seit vielen Jahren ist das Standard-Tool für die Neigung, die in Stata übereinstimmt, der psmatch2-Befehl, geschrieben von Edwin Leuven und Barbara Sianesi. Allerdings hat Stata 13 eine neue Teffects-Befehl für die Schätzung Behandlungen Effekte in einer Vielzahl von Möglichkeiten, einschließlich der Neigung Matching Matching. Der Befehl teffects psmatch hat einen sehr wichtigen Vorteil gegenüber psmatch2. Es berücksichtigt die Tatsache, dass die Neigungswerte bei der Berechnung von Standardfehlern geschätzt und nicht bekannt sind. Dies stellt sich oft heraus, um einen signifikanten Unterschied zu machen, und manchmal auf überraschende Weise. Wir empfehlen dringend, von psmatch2 auf teffects psmatch umzuschalten. Und dieser Artikel wird Ihnen helfen, den Übergang. Ein Beispiel für die Übereinstimmung der Trefferzahlen Führen Sie den folgenden Befehl in Stata aus, um einen Beispieldatensatz zu laden: Er besteht aus vier Variablen: einem Behandlungsindikator t. Kovariiert x1 und x2. Und ein Ergebnis y. Dies sind konstruierte Daten, und der Effekt der Behandlung ist tatsächlich eine Einheitszunahme in y. Allerdings ist die Wahrscheinlichkeit der Behandlung positiv korreliert mit x1 und x2. Und sowohl x1 als auch x2 sind positiv mit y korreliert. Ein einfacher Vergleich des Mittelwerts von y für die behandelten und unbehandelten Gruppen überschätzt die Wirkung der Behandlung stark: (Regressing y auf t. X1 und x2 geben Ihnen ein ziemlich gutes Bild von der Situation.) Der Befehl psmatch2 gibt Ihnen einen Viel besser Schätzung der Behandlung Wirkung: psmatch2 t x1 x2, out (y) Die teffects Befehl Sie können die gleiche Abschätzung mit Teffects durchführen. Die grundlegende Syntax des Befehls teffects lautet: teffects psmatch (Ergebnis) (Behandlungskovariaten) In diesem Fall wäre der Grundbefehl: teffects psmatch (y) (t x1 x2) Das Standardverhalten von teffects Ist nicht das gleiche wie psmatch2 so gut müssen einige Optionen verwenden, um die gleichen Ergebnisse zu erhalten. Zuerst berichtet psmatch2 standardmäßig über den durchschnittlichen Behandlungseffekt auf die behandelten (was er als ATT bezeichnet). Der Befehl teffects berichtet den durchschnittlichen Behandlungseffekt (ATE), berechnet aber die durchschnittliche Behandlungswirkung auf die behandelten (die er als ATET bezeichnet), wenn die atet-Option gegeben ist. Zweitens verwendet psmatch2 standardmäßig ein probit-Modell für die Wahrscheinlichkeit der Behandlung. Der Befehl teffects verwendet standardmäßig ein Logit-Modell, verwendet jedoch probit, wenn die probit-Option auf die Behandlungsgleichung angewandt wird. Also, um das gleiche Modell mit Teffects-Typ laufen: teffects psmatch (y) (t x1 x2, probit), atet Die durchschnittliche Behandlung Wirkung auf die behandelten identisch ist, anders als gerundet an einem anderen Ort. Aber beachten Sie, dass teffects einen sehr unterschiedlichen Standardfehler (gut diskutieren, warum das in Kürze ist), plus ein Z-Statistik, p-Wert und 95 Konfidenzintervall und nicht nur eine T-Statistik. Das Ausführen von teffects mit den Standardoptionen gibt folgendes an: teffects psmatch (y) (t x1 x2) Dies ist äquivalent zu: psmatch2 t x1 x2, out (y) logit ate Die ATE von diesem Modell ist dem ATTATET des vorherigen sehr ähnlich Modell. Aber beachten Sie, dass psmatch2 berichtet eine etwas andere ATT in diesem Modell. Der Befehl teffects berichtet denselben ATET, wenn er gefragt wird: teffects psmatch (y) (t x1 x2), atet Standardfehler Die Ausgabe von psmatch2 enthält die folgende Einschränkung: Anmerkung: S. E. Nicht berücksichtigt, dass der Neigungswert geschätzt wird. Eine aktuelle Studie von Abadie und Imbens (2012. Matching auf die geschätzte Neigung Punktzahl Harvard University und National Bureau of Economic Research) festgestellt, wie zu berücksichtigen, dass Neigung Schätzungen geschätzt werden, und teffects psmatch stützt sich auf ihre Arbeit. Interessanterweise ist die Anpassung für ATE immer negativ, was zu kleineren Standardfehlern führt: Die Übereinstimmung auf der Grundlage der geschätzten Neigungscharaktere erweist sich als effizienter als die Übereinstimmung, basierend auf wahren Neigungswerten. Jedoch kann für ATET die Einstellung positiv oder negativ sein, so dass die Standardfehler, die von psmatch2 berichtet werden, zu groß oder zu klein sein können. Handhabung Krawatten So weit weve psmatch2 und teffects psmatch, um einfache Nachbar-Nachbar-Matching mit einem Nachbar (und kein Bremssattel) zu tun. Dies wirft jedoch die Frage auf, was zu tun ist, wenn zwei Beobachtungen die gleiche Neigung haben und somit für den untergeordneten Nachbarn gebunden sind. Gleichungen sind gemeinsam, wenn die Kovarianten im Behandlungsmodell kategorial oder sogar ganzzahlig sind. Der Befehl psmatch2 stimmt mit einer der gebundenen Beobachtungen überein, aber mit der Bindungsoption stimmt er mit allen gebundenen Beobachtungen überein. Der Befehl teffects psmatch stimmt immer mit allen Verbindungen überein. Wenn Ihr Datensatz mehrere Beobachtungen mit dem gleichen Neigungswert hat, erhalten Sie nicht genau die gleichen Ergebnisse von teffects psmatch, wie Sie von psmatch2 erhalten wurden, es sei denn, Sie gehen zurück und fügen Sie die Krawatten-Option zu Ihrem psmatch2 Befehle. (Zu diesem Zeitpunkt sind wir uns keiner klaren Anleitung bewusst, ob es besser ist, mit Bindungen übereinzustimmen oder nicht.) Matching mit mehreren Nachbarn Durch Standard-Teffects psmatch entspricht jede Beobachtung mit einer anderen Beobachtung. Sie können dies mit der Option nneighbor () (oder nur mit nn ()) ändern. Zum Beispiel könnten Sie jede Beobachtung mit den drei nächsten Nachbarn vergleichen: teffects psmatch (y) (t x1 x2), nn (3) Poststimulation psmatch fügt dem Datensatz standardmäßig keine neuen Variablen hinzu. Es gibt jedoch eine Vielzahl von nützlichen Variablen, die mit Optionen und Nachschätzvorhersage-Befehlen erstellt werden können. In der folgenden Tabelle sind die ersten und die 467. Beobachtungen des Beispieldatensatzes aufgeführt, nachdem einige dieser Variablen erstellt wurden. Nun zu verweisen, wie wir erklären, die Befehle, die die neuen Variablen erstellt. Überprüfen dieser Variablen ist auch ein guter Weg, um sicherzustellen, dass Sie genau verstehen, wie die Neigung passt zusammenpasst. Beginnen Sie mit einem sauberen Schiefer, indem Sie Folgendes eingeben: use ssc. wisc. edussccpubsfilespsm, replace Die gen () Option tekt teffects psmatch, um eine neue Variable (oder Variablen) zu erstellen. Für jede Beobachtung wird diese neue Variable die Nummer der Beobachtung enthalten, mit der die Beobachtung abgestimmt wurde. Wenn es Bindungen gibt oder Sie teffects psmatch angegeben haben, um mehrere Nachbarn zu verwenden, dann muss gen () mehrere Variablen erstellen. So liefern Sie den Stamm des Variablennamens, und teffects psmatch fügt nach Bedarf Suffixe hinzu. Teffects psmatch (y) (t x1 x2), gen (match) In diesem Fall wird jede Beobachtung nur aufeinander abgestimmt, also erzeugt gen (match) nur match1. Unter Bezugnahme auf die Beispielausgabe ist die Übereinstimmung von Beobachtung 1 Beobachtung 467 (weshalb diese beiden aufgelistet sind). Beachten Sie, dass diese Beobachtungsnummern nur in der aktuellen Sortierreihenfolge gültig sind. Stellen Sie daher sicher, dass Sie diese Reihenfolge bei Bedarf neu erstellen können. Führen Sie ggf. aus, um die aktuelle Sortierreihenfolge wiederherzustellen. Der Vorhersagebefehl mit der Option ps erzeugt zwei Variablen, die die Neigungswerte oder die beobachtete Wahrscheinlichkeit des Seins in der Kontrollgruppe oder der behandelten Gruppe enthalten: Voraussage ps0 ps1, ps Hier ist ps0 die vorhergesagte Wahrscheinlichkeit, in der Kontrollgruppe zu sein ( T0) und ps1 die vorhergesagte Wahrscheinlichkeit, in der behandelten Gruppe (t1) zu sein. Die Beobachtungen 1 und 467 wurden abgestimmt, da ihre Neigungswerte sehr ähnlich sind. Die po-Option erzeugt Variablen, die die potentiellen Ergebnisse für jede Beobachtung enthalten: Vorhersage y0 y1, po Weil Beobachtung 1 in der Kontrollgruppe ist, enthält y0 seinen beobachteten Wert von y. Y & sub1; ist der beobachtete Wert von y für die Beobachtungs-1s-Übereinstimmung, Beobachtung 467. Der Neigungswert-Übereinstimmungs-Schätzer nimmt an, daß, wenn Beobachtung 1 in der behandelten Gruppe gewesen wäre, der Wert von y derjenige der Beobachtung in der behandelten Gruppe wäre, (Wobei quotsimilarityquot durch die Differenz in ihren Neigungsgraden gemessen wird). Beobachtung 467 ist in der behandelten Gruppe, also ist ihr Wert für y1 ihr beobachteter Wert von y, während ihr Wert für y0 der beobachtete Wert von y für ihre Übereinstimmung ist, Beobachtung 781. Das Ausführen des Vorhersagebefehls ohne Optionen gibt die Behandlungseffekt selbst: Der Behandlungseffekt ist einfach der Unterschied zwischen y1 und y0. Sie könnten die ATE selbst berechnen (aber nachdrücklich nicht ihren Standardfehler) mit: und dem ATET mit: Regression auf dem quotierten Samplequot Eine andere Möglichkeit, eine Neigung zu identifizieren, ist die Auswahl eines Beispiels aus der Kontrollgruppe, das die Behandlung durchführt Gruppe. Irgendwelche Unterschiede zwischen der Behandlung und den angepaßten Kontrollgruppen werden dann als ein Ergebnis der Behandlung angenommen. Beachten Sie, dass dies die durchschnittliche Behandlung Wirkung auf die behandelten8212 zu berechnen die ATE youd erstellen Sie ein Muster der behandelten Gruppe, die die Kontrollen entspricht. Mathematisch ist dies alles gleichbedeutend mit der Anpassung, um zu schätzen, was ein Beobachtungsergebnis wäre, wenn es in der anderen Gruppe gewesen wäre, wie oben beschrieben. Manchmal wollen Forscher Regressionen auf der quotierten Stichprobe durchführen, definiert als die Beobachtungen in der behandelten Gruppe plus die Beobachtungen in der Kontrollgruppe, die auf sie abgestimmt wurden. Das Problem bei diesem Ansatz besteht darin, dass das Matched-Sample auf unbekannten Schätzwerten beruht. Somit ist das passende Schema auch eine Schätzung. Das Ausführen von Regressionen nach dem Matching ist im Wesentlichen ein zweistufiges Regressionsmodell, und die Standardfehler von der zweiten Stufe müssen die erste Stufe berücksichtigen, was normale Regressionsbefehle nicht tun. Dies ist ein Bereich der laufenden Forschung. Wir werden diskutieren, wie Regressionen auf einem Matched-Probe ausgeführt werden, weil es eine beliebte Technik bleibt, aber wir können es nicht empfehlen. Psmatch2 macht es einfach, indem Sie eine Gewichtsvariable automatisch erstellen. Für Beobachtungen in der behandelten Gruppe ist das Gewicht 1. Für Beobachtungen in der Kontrollgruppe ist es die Anzahl der Beobachtungen aus der behandelten Gruppe, für die die Beobachtung ein Spiel ist. Wenn die Beobachtung keine Übereinstimmung ist, fehlt das Gewicht. Gewicht fungiert somit als Frequenzgewicht (fweight) und kann mit Statas-Standard-Gewichtungs-Syntax verwendet werden. Zum Beispiel (mit einer sauberen Weste beginnen wieder): Verwenden Sie ssc. wisc. edussccpubsfilespsm, psmatch2 t x1 x2, aus (y) Logit reg y x1 x2 t fweightweight Beobachtungen mit einem fehlenden Wert für die Gewichts aus der Regression weggelassen ersetzen, so dass es Wird automatisch auf die abgestimmte Stichprobe beschränkt. Auch hier ist zu beachten, dass die Standard-Fehler, die durch den Befehl reg gegeben werden, falsch sind, weil sie nicht die passende Stufe berücksichtigen. Teffects psmatch erzeugt keine Gewichtsvariable, aber es ist möglich, basierend auf der Variable match1 eine Variable zu erstellen. Hier ist Beispiel-Code, mit Kommentaren: Genobn speichern die Beobachtungsnummern für zukünftige Verwendung speichern fulldata, ersetzen speichern Sie den kompletten Datensatz halten, wenn t halten nur die behandelten Gruppe halten match1 halten nur die match1 Variable (die Beobachtung Zahlen ihrer Spiele) bysort Match1: gen weightN Zählimpuls, wieviele Male jede Steuerbeobachtung eine Übereinstimmung durch match1 ist: halten, wenn n1 halten gerade eine Reihe pro Steuerbeobachtung ren match1 ob Umbenennung für Verschmelzungszwecke verschmelzen 1: m ob using fulldata fusionieren zurück in die volle Daten ersetzen Gewicht1 wenn T gesetztes Gewicht auf 1 für bearbeitete Beobachtungen Die resultierende Gewichtsvariable ist identisch mit der von psmatch2 erzeugten Gewichtsgröße. Wie kann mit verifiziert werden: Es wird in der gleichen Weise verwendet und geben genau die gleichen Ergebnisse: reg y x1 x2 t fweightweight Offensichtlich ist dies ein gutes bisschen mehr Arbeit als mit psmatch2. Wenn Ihr Neigungs-Matching-Modell mit den beiden Teffects psmatch und psmatch2 durchgeführt werden kann. Können Sie teffects psmatch laufen lassen, um den korrekten Standardfehler und dann psmatch2 zu erhalten, wenn Sie eine Gewichtungsvariable benötigen. Diese Regression hat eine N von 666, 333 von der behandelten Gruppe und 333 von der Kontrollgruppe. Allerdings verwendet es nur 189 verschiedene Beobachtungen aus der Kontrollgruppe. Etwa 13 von ihnen sind die Streichhölzer für mehr als eine Beobachtung aus der behandelten Gruppe und werden somit in der Regression dupliziert (führen Sie Tab Gewicht, wenn t für Details). Forscher verwenden manchmal die norepl (kein Ersatz) - Option in psmatch2, um sicherzustellen, dass jede Beobachtung wird nur einmal verwendet, obwohl dies in der Regel macht das passende schlimmer. Nach unserem besten Wissen gibt es kein Äquivalent zu teffects psmatch. Die Ergebnisse dieser Regression lassen etwas zu wünschen übrig: Bei der Konstruktion sollten alle Koeffizienten 1 sein. Die Regression unter Verwendung aller Beobachtungen (reg y x1 x2 t statt reg x x x x tt) ist in diesem Fall besser: Andere Methoden der Schätzung die Behandlung von Effekten während des Propensity Score Matching die am häufigsten verwendete Methode zur Abschätzung Behandlungseffekte bei der SSCC ist, teffects implementiert auch Regressionsanpassung (teffects ra), Inverse Probability Gewichtung (teffects IPW), Augmented Inverse Probability Gewichtung (teffects aipw), Inverse Wahrscheinlichkeit gewichtete Regression Anpassung (teffects ipwra) und Nearest Neighbor Matching (teffects nnmatch). Die Syntax ist ähnlich, obwohl sie variiert, ob Sie Variablen für das Ergebnismodell, das Behandlungsmodell oder beides angeben müssen: teffects ra (y x1 x2) (t) teffects ipw (y) (t x1 x2) teffects aipw (y (T x1 x2) teffects ipwra (y x1 x2) (t x1 x2) teffects nnmatch (y x1 x2) (t) Vollständiger Beispielcode Der folgende Code ist der vollständige Code für die Beispiele in diesem Artikel. Löschen des gesamten TTEST y Verwendung ssc. wisc. edussccpubsfilespsm, durch (t) x1 x2 t psmatch2 t x1 x2 reg y, aus (y) teffects psmatch (y) (t x1 x2, Probit), atet teffects psmatch (y) (t x1 x2) psmatch2 t x1 x2, aus (y) Logit aß teffects psmatch (y) (t x1 x2), atet Verwendung ssc. wisc. edussccpubsfilespsm, ersetzen teffects psmatch (y) (t x1 x2), gen (Match) vorhersagen ps0 ps1, ps y0 y1 vorhersagen, po te l vorhersagen, ob n1 n467 Gebrauch ssc. wisc. edussccpubsfilespsm, psmatch2 t x1 x2 ersetzen, aus (y) Logit reg y x1 x2 t fweightweight gen OBN Entfaltung vonDaten speichern, ersetzen teffects psmatch (y) (T x1 x2), gen (match) halten, wenn t keep1 bysort match1: gen weightN durch match1: halten, wenn n1 ren match1 ob merge 1: m ob mit fulldata ersetzen weight1 wenn t reg y x1 x2 t fgewichtgewicht reg y x1 x2 t teffects ra (y x1 x2) (t) teffects IPW (y) (t x1 x2) teffects aipw (y x1 x2) (t x1 x2) teffects ipwra (y x1 x2) (t x1 x2) teffects nnmatch (y x1 X2) (t) Letztes Revised: 2162015ARCHIVED: In Stata, wie ich die Performance-Score Matching Stata nicht über einen eingebauten Befehl für die Neigung Matching Matching, eine nicht-experimentelle Methode der Stichproben, die eine Kontrollgruppe, deren Verteilung der Kovariaten produziert Ist ähnlich der der behandelten Gruppe. Es gibt jedoch mehrere benutzerdefinierte Module für diese Methode. Die folgenden Module gehören zu den beliebtesten: psmatch2.ado wurde von Leuven und Sianesi (2003) und pscore. ado von Becker und Ichino (2002) entwickelt. Vor kurzem haben Abadie, Drukker, Herr und Imbens (2004) nnmatch. ado eingeführt. Alle drei Module unterstützen sowohl die Paarbildung als auch die Unterklassifizierung. Diese Module finden Sie mit dem Befehl. net wie folgt: Sie können diese Module mit dem Befehl. ssc oder. net wie folgt installieren: Nach der Installation lesen Sie die Hilfedateien, um die korrekte Verwendung zu finden, zB: Wenn Sie Fragen haben Über die Verwendung von statistischer und mathematischer Software an der Indiana University, wenden Sie sich an Research Analytics. Research Analytics befindet sich auf der IU Bloomington Campus in Woodburn Hall 200 Mitarbeiter sind für die Beratung Montag bis Freitag 9.00 Uhr und nach Vereinbarung. Dies ist das Dokument avll in der Knowledge Base. Zuletzt geändert am 2015-06-30 00:00:00.


No comments:

Post a Comment