Monday 20 March 2017

Egen Gruppe In Stata Forex

Im mit Stata, und ich versuche, den durchschnittlichen Preis der Unternehmen Rivalen in einem Markt zu berechnen. Ich habe Daten, die wie folgt aussehen: Und Im versuche, den durchschnittlichen Preis von jedem Unternehmen Rivalen zu berechnen, so möchte ich ein neues Feld, das die Durchschnittswerte der anderen Unternehmen in einem Markt zu generieren. Es würde aussehen wie: Um den Durchschnitt nach Gruppe, könnte ich den egen Befehl verwenden: Aber das würde nicht ausschließen, die Unternehmen eigenen Preis im Durchschnitt, und nach meinem besten Wissen, mit dem wenn Qualifier würde nur die Beobachtungen, die es betrieben ändern Mitgliedes und nicht die von TripAdvisor LLC. Gibt es eine einfache Möglichkeit, dies zu tun, oder brauche ich, um Loops zu erstellen und generieren jeden Durchschnitt manuell gefragt Mar 6 12 at 4:16 Dies ist ein alter Thread immer noch von Interesse, so Materialien und Techniken übersehen ersten Mal noch gelten. Die allgemeinere Technik ist, mit Summen zu arbeiten. An seiner einfachsten, insgesamt der Summe aller - dieser Wert. In einem egen-Framework, das aussehen wird Die Total () - Funktion von egen ignoriert fehlende Werte in seinem Argument. Wenn es fehlende Werte gibt, möchten wir sie nicht in die Zählung aufnehmen, aber wir können missing () verwenden, das 1 ergibt, wenn es nicht fehlt und 0 wenn fehlt. Egen s count () ist ein anderer Weg, dies zu tun. Der vorangegangene Code gibt die falsche Antwort, wenn Fehlstellen vorhanden sind, da sie in der Zählung N enthalten sind. Selbst wenn ein Wert fehlt, ist der Mittelwert der anderen Werte immer noch sinnvoll. Wenn kein Wert fehlt, vereinfacht sich die letzte Zeile bis So weit, dies sieht möglicherweise nicht mehr als eine kleine Variante auf dem vorherigen Code, aber es erweitert sich leicht auf Gewichte. Vermutlich wollen wir einen gewichteten Durchschnitt der anderen Preise mit etwas Gewicht. Wir können die Tatsache ausnutzen, dass total () auf Ausdrücken wirkt, die komplizierter sein können als nur Variablennamen. In der Tat der Code oben hat das schon, aber es wird oft übersehen. Wie vorher, wenn Preis oder Gewicht jemals fehlen, benötigen Sie komplizierter Code, oder nur um sicherzustellen, dass Sie solche Beobachtungen aus den Berechnungen auszuschließen. Siehe auch die Stata FAQ Wie erstelle ich Variablen zusammenfassen für jede einzelne Eigenschaften der anderen Mitglieder einer Gruppe für eine breitere Diskussion. (Wenn die Zahlen groß werden, arbeiten mit doppelter s.) HINWEIS: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Class Notes Zählen von n bis N Einführung Stata hat zwei eingebaute Variablen namens n und N. N ist die Stata-Notation für die aktuelle Beobachtungsnummer. N in der ersten Beobachtung 1, 2 im zweiten, 3 im dritten und so weiter. N ist die Stata-Notation für die Gesamtzahl der Beobachtungen. Wir sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Zählen mit mit n und N in Verbindung mit dem Befehl kann einige sehr nützliche Ergebnisse liefern. Natürlich müssen wir, um den by-Befehl zu verwenden, zuerst unsere Daten auf der by-Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie Folgendes: Um die höchste Punktzahl für jede Gruppe zu verwenden, verwenden Sie Folgendes: Eine weitere Verwendung von n Verwenden Sie n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Die Beobachtungen 6 und 7 haben die gleichen Identifikationsnummern und unterschiedliche Werte. Duplikate finden Mit Hilfe von N können Sie doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und set set n gleich der Gesamtzahl der identischen Beobachtungen. Schließlich listen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es lange dauern, um sie alle zweimal eingeben. Wir können die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiter in den neuesten Versionen von Stata können wir kombinieren Art und durch in eine einzige Aussage. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergibt. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.


No comments:

Post a Comment