Wie man einen T-Test in Excel durchführt

Inhaltsverzeichnis:

Wie man einen T-Test in Excel durchführt
Wie man einen T-Test in Excel durchführt
Anonim

Ein T-Test ist eine Möglichkeit zu entscheiden, ob es statistisch signifikante Unterschiede zwischen Datensätzen gibt, indem die t-Verteilung eines Schülers verwendet wird. Der T-Test in Excel ist ein T-Test mit zwei Stichproben, der die Mittelwerte von zwei Stichproben vergleicht. Dieser Artikel erklärt, was statistische Signifikanz bedeutet und zeigt, wie man einen T-Test in Excel durchführt.

Anweisungen in diesem Artikel gelten für Excel 2019, 2016, 2013, 2010, 2007; Excel für Microsoft 365 und Excel Online.

Image
Image

Was ist statistische Signifikanz?

Stellen Sie sich vor, Sie möchten wissen, welcher der beiden Würfel die bessere Punktzahl ergibt. Du wirfst den ersten Würfel und bekommst eine 2; du wirfst den zweiten Würfel und bekommst eine 6. Sagt Ihnen das, dass der zweite Würfel normalerweise höhere Punktzahlen bringt? Wenn Sie mit „Natürlich nicht“geantwortet haben, haben Sie bereits ein gewisses Verständnis von statistischer Signifikanz. Sie verstehen, dass der Unterschied auf die zufällige Änderung der Punktzahl zurückzuführen ist, jedes Mal, wenn ein Würfel geworfen wird. Da die Probe sehr klein war (nur eine Rolle), zeigte sie nichts Signifikantes.

Stell dir nun vor, du wirfst jeden Würfel 6 Mal:

  • Der erste Würfel würfelt 3, 6, 6, 4, 3, 3; Durchschnitt=4,17
  • Der zweite Würfel würfelt 5, 6, 2, 5, 2, 4; Durchschnitt=4,00

Beweist das jetzt, dass der erste Würfel mehr Punkte bringt als der zweite? Wahrscheinlich nicht. Eine kleine Stichprobe mit einer relativ kleinen Differenz zwischen den Mittelwerten macht es wahrscheinlich, dass die Differenz immer noch auf zufällige Variationen zurückzuführen ist. Wenn wir die Anzahl der Würfelwürfe erhöhen, wird es schwierig, eine vernünftige Antwort auf die Frage zu geben – ist der Unterschied zwischen den Ergebnissen das Ergebnis einer zufälligen Variation oder gibt einer tatsächlich eher höhere Ergebnisse als der andere?

Signifikanz ist die Wahrscheinlichkeit, dass ein beobachteter Unterschied zwischen Proben auf zufällige Variationen zurückzuführen ist. Signifikanz wird oft als Alpha-Niveau oder einfach als „α“bezeichnet. Das Konfidenzniveau oder einfach „c“ist die Wahrscheinlichkeit, dass der Unterschied zwischen den Stichproben nicht auf zufällige Schwankungen zurückzuführen ist; mit anderen Worten, dass es einen Unterschied zwischen den zugrunde liegenden Populationen gibt. Also: c=1 – α

Wir können 'α' auf ein beliebiges Niveau setzen, um sicher zu sein, dass wir unsere Bedeutung bewiesen haben. Sehr oft wird α=5 % verwendet (95 % Konfidenz), aber wenn wir wirklich sicher sein wollen, dass Unterschiede nicht durch zufällige Variationen verursacht werden, können wir ein höheres Konfidenzniveau anwenden, indem wir α=1 % oder sogar α=0,1 verwenden %.

Verschiedene statistische Tests werden verwendet, um die Signifikanz in verschiedenen Situationen zu berechnen. T-Tests werden verwendet, um zu bestimmen, ob die Mittelwerte zweier Grundgesamtheiten unterschiedlich sind, und F-Tests werden verwendet, um zu bestimmen, ob die Varianzen unterschiedlich sind.

Warum auf statistische Signifikanz testen?

Wenn wir verschiedene Dinge vergleichen, müssen wir Signifikanztests verwenden, um festzustellen, ob eines besser ist als das andere. Dies gilt für viele Felder, zum Beispiel:

  • Im Geschäftsleben müssen Menschen verschiedene Produkte und Marketingmethoden vergleichen.
  • Im Sport müssen Menschen verschiedene Geräte, Techniken und Konkurrenten vergleichen.
  • In der Technik müssen Menschen verschiedene Designs und Parametereinstellungen vergleichen.

Wenn Sie testen möchten, ob etwas in irgendeinem Bereich besser abschneidet als etwas anderes, müssen Sie auf statistische Signifikanz testen.

Was ist die T-Verteilung eines Schülers?

Die t-Verteilung eines Schülers ähnelt einer normalen (oder Gaußschen) Verteilung. Dies sind beide glockenförmige Verteilungen mit den meisten Ergebnissen nahe am Mittelwert, aber einige seltene Ereignisse sind in beiden Richtungen ziemlich weit vom Mittelwert entfernt, die als Enden der Verteilung bezeichnet werden.

Die genaue Form der Student-t-Verteilung hängt von der Stichprobengröße ab. Bei Stichproben von mehr als 30 ist sie der Normalverteilung sehr ähnlich. Wenn die Stichprobengröße reduziert wird, werden die Schwänze größer, was die erhöhte Unsicherheit darstellt, die sich ergibt, wenn man auf der Grundlage einer kleinen Stichprobe Schlussfolgerungen zieht.

So führen Sie einen T-Test in Excel durch

Bevor Sie einen T-Test anwenden können, um festzustellen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten zweier Stichproben gibt, müssen Sie zuerst einen F-Test durchführen. Dies liegt daran, dass für den T-Test unterschiedliche Berechnungen durchgeführt werden, je nachdem, ob es einen signifikanten Unterschied zwischen den Varianzen gibt.

Sie müssen das Add-In Analysis Toolpak aktivieren, um diese Analyse durchzuführen.

Überprüfen und Laden des Analyse-Toolpak-Add-Ins

Um das Analysis Toolpak zu überprüfen und zu aktivieren, folgen Sie diesen Schritten:

  1. Wählen Sie die Registerkarte DATEI >wählen Sie Optionen.
  2. Wählen Sie im Dialogfeld "Optionen" Add-Ins aus den Registerkarten auf der linken Seite.
  3. Wählen Sie unten im Fenster das Dropdown-Menü Verw alten und dann Excel-Add-ins aus. Wählen Sie Los.

    Image
    Image
  4. Stellen Sie sicher, dass das Kontrollkästchen neben Analysis Toolpak aktiviert ist, und wählen Sie dann OK.
  5. Das Analysis Toolpak ist jetzt aktiv und Sie können F-Tests und T-Tests anwenden.

Durchführen eines F-Tests und eines T-Tests in Excel

  1. Geben Sie zwei Datensätze in eine Tabelle ein. In diesem Fall betrachten wir den Verkauf von zwei Produkten während einer Woche. Der durchschnittliche tägliche Verkaufswert für jedes Produkt wird ebenfalls berechnet, zusammen mit seiner Standardabweichung.

    Image
    Image
  2. Wählen Sie die Registerkarte Daten > Datenanalyse

    Image
    Image
  3. Wählen Sie F-Test Two-Sample for Variances aus der Liste und wählen Sie dann OK.

    Image
    Image

    Der F-Test reagiert sehr empfindlich auf Nicht-Normalität. Es kann daher sicherer sein, einen Welch-Test zu verwenden, aber dies ist in Excel schwieriger.

  4. Wählen Sie den Bereich von Variable 1 und den Bereich von Variable 2; Stellen Sie das Alpha ein (0,05 ergibt 95 % Vertrauen); Wählen Sie eine Zelle für die obere linke Ecke der Ausgabe aus, da dies 3 Sp alten und 10 Zeilen füllen wird. Wählen Sie OK.

    Image
    Image

    Für den Bereich für Variable 1 muss die Stichprobe mit der größten Standardabweichung (oder Varianz) ausgewählt werden.

  5. Sehen Sie sich die F-Test-Ergebnisse an, um festzustellen, ob es einen signifikanten Unterschied zwischen den Varianzen gibt. Die Ergebnisse liefern drei wichtige Werte:

    • F: Das Verhältnis zwischen den Varianzen.
    • P(F<=f) einseitig: Die Wahrscheinlichkeit, dass Variable 1 tatsächlich keine größere Varianz als Variable 2 hat. Wenn diese größer als alpha ist, welche im Allgemeinen 0,05 ist, dann gibt es keinen signifikanten Unterschied zwischen den Varianzen.
    • F Kritischer One-Tail: Der Wert von F, der erforderlich wäre, um P(F<=f)=α zu ergeben. Wenn dieser Wert größer als F ist, bedeutet dies auch, dass es keinen signifikanten Unterschied zwischen den Varianzen gibt.

    P(F<=f) kann auch unter Verwendung der FDIST-Funktion mit F und den Freiheitsgraden für jede Probe als Eingabe berechnet werden. Freiheitsgrade sind einfach die Anzahl der Beobachtungen in einer Stichprobe minus eins.

  6. Da Sie nun wissen, ob es einen Unterschied zwischen den Varianzen gibt, können Sie den passenden T-Test auswählen. Wählen Sie die Registerkarte Daten > Datenanalyse und wählen Sie dann entweder t-Test: Zwei-Stichproben unter Annahme gleicher Varianzenoder t-Test: Zwei-Stichproben unter Annahme ungleicher Varianzen

    Image
    Image
  7. Unabhängig davon, welche Option Sie im vorherigen Schritt gewählt haben, wird Ihnen dasselbe Dialogfeld zur Eingabe der Details der Analyse angezeigt. Wählen Sie zunächst die Bereiche mit den Proben für Variable 1 Range und Variable 2 Range.

    Image
    Image
  8. Angenommen, Sie möchten auf keinen Unterschied zwischen den Mittelwerten testen, setzen Sie die Hypothesierte mittlere Differenz auf Null.
  9. Stellen Sie das Signifikanzniveau Alpha ein (0,05 ergibt 95 % Vertrauen) und wählen Sie eine Zelle für die obere linke Ecke der Ausgabe aus, wobei Sie bedenken, dass dies 3 Sp alten und 14 Zeilen füllen wird. Wählen Sie OK.
  10. Prüfen Sie die Ergebnisse, um zu entscheiden, ob es einen signifikanten Unterschied zwischen den Mittelwerten gibt.

    Genau wie beim F-Test gibt es keinen signifikanten Unterschied, wenn der p-Wert, in diesem Fall P(T<=t), größer als Alpha ist. In diesem Fall sind jedoch zwei p-Werte angegeben, einer für einen einseitigen Test und der andere für einen zweiseitigen Test. Verwenden Sie in diesem Fall den zweiseitigen Wert, da beide Variablen mit einem größeren Mittelwert einen signifikanten Unterschied darstellen würden.

Empfohlen: