Com fer una prova T a Excel

👤 Autora Abigail Brown 📧 [email protected].
⏱ Public 2023-12-17 06:42.
🖍 Última modificació 2025-06-01 07:16.

Una prova T és una manera de decidir si hi ha diferències estadísticament significatives entre els conjunts de dades, utilitzant la distribució t d'un Student. La prova T a Excel és una prova T de dues mostres que compara les mitjanes de dues mostres. Aquest article explica què significa la significació estadística i mostra com fer una prova T a Excel.

Les instruccions d'aquest article s'apliquen a Excel 2019, 2016, 2013, 2010, 2007; Excel per a Microsoft 365 i Excel Online.

Quina és la importància estadística?

Imagina que vols saber quin dels dos daus donarà millor puntuació. Tireu el primer dau i obteniu un 2; tires el segon dau i aconsegueixes un 6. Això us diu que el segon dau acostuma a donar puntuacions més altes? Si vau respondre: "Per descomptat que no", aleshores ja teniu una mica de comprensió de la significació estadística. Enteneu que la diferència es va deure al canvi aleatori de la puntuació, cada vegada que es llança un dau. Com que la mostra era molt petita (només un rotllo), no va mostrar res significatiu.

Ara imagina que tires cada dau 6 vegades:

El primer dau tira 3, 6, 6, 4, 3, 3; Mitjana=4,17
El segon dau tira 5, 6, 2, 5, 2, 4; Mitjana=4,00

Això demostra ara que el primer dau dóna puntuacions més altes que el segon? Probablement no. Una mostra petita amb una diferència relativament petita entre les mitjanes fa que sigui probable que la diferència encara sigui deguda a variacions aleatòries. A mesura que augmentem el nombre de tirades de daus, es fa difícil donar una resposta de sentit comú a la pregunta: la diferència entre les puntuacions és el resultat d'una variació aleatòria o és més probable que un doni puntuacions més altes que l' altre?

La importància és la probabilitat que una diferència observada entre mostres sigui deguda a variacions aleatòries. La significació sovint s'anomena nivell alfa o simplement "α". El nivell de confiança, o simplement 'c', és la probabilitat que la diferència entre les mostres no sigui deguda a una variació aleatòria; en altres paraules, que hi ha una diferència entre les poblacions subjacents. Per tant: c=1 - α

Podem establir "α" al nivell que vulguem, per sentir-nos segurs que hem demostrat la importància. Molt sovint s'utilitza α=5% (confiança del 95%), però si volem estar realment segurs que les diferències no són causades per variacions aleatòries, podríem aplicar un nivell de confiança més alt, utilitzant α=1% o fins i tot α=0,1 %.

S'utilitzen diverses proves estadístiques per calcular la importància en diferents situacions. Les proves T s'utilitzen per determinar si les mitjanes de dues poblacions són diferents i les proves F per determinar si les variàncies són diferents.

Per què provar la significació estadística?

Quan comparem coses diferents, hem de fer servir proves de significació per determinar si una és millor que l' altra. Això s'aplica a molts camps, per exemple:

En els negocis, la gent ha de comparar diferents productes i mètodes de màrqueting.
En els esports, la gent ha de comparar diferents equips, tècniques i competidors.
En enginyeria, la gent ha de comparar diferents dissenys i configuracions de paràmetres.

Si voleu provar si alguna cosa funciona millor que una altra, en qualsevol camp, heu de provar la significació estadística.

Què és la distribució T d'un estudiant?

La distribució t de Student és similar a una distribució normal (o gaussiana). Aquestes dues distribucions són en forma de campana amb la majoria de resultats propers a la mitjana, però alguns esdeveniments rars estan força allunyats de la mitjana en ambdues direccions, anomenades cues de la distribució.

La forma exacta de la distribució t de Student depèn de la mida de la mostra. Per a mostres de més de 30, és molt semblant a la distribució normal. A mesura que es redueix la mida de la mostra, les cues es fan més grans, la qual cosa representa l'augment de la incertesa que es deriva de fer inferències basades en una mostra petita.

Com fer una prova T a Excel

Abans de poder aplicar una prova T per determinar si hi ha una diferència estadísticament significativa entre les mitjanes de dues mostres, primer heu de realitzar una prova F. Això es deu al fet que es realitzen diferents càlculs per a la prova T en funció de si hi ha una diferència significativa entre les variàncies.

Necessitareu el complement Analysis Toolpak activat per dur a terme aquesta anàlisi.

Comprovació i càrrega del complement del paquet d'eines d'anàlisi

Per comprovar i activar el paquet d'eines d'anàlisi, seguiu aquests passos:

Seleccioneu la pestanya FILE >seleccioneu Opcions.
Al quadre de diàleg Opcions, seleccioneu Complements a les pestanyes del costat esquerre.
A la part inferior de la finestra, seleccioneu el menú desplegable Gestiona i, a continuació, seleccioneu Complements d'Excel. Seleccioneu Vés.

Image
Assegureu-vos que la casella de selecció al costat de Paquet d'eines d'anàlisi estigui marcada i, a continuació, seleccioneu D'acord.
El paquet d'eines d'anàlisi ja està actiu i ja esteu preparat per aplicar proves F i proves T.

Realització d'una prova F i una prova T a Excel

Introduïu dos conjunts de dades en un full de càlcul. En aquest cas, estem considerant la venda de dos productes durant una setmana. També es calcula el valor mitjà de les vendes diàries de cada producte, juntament amb la seva desviació estàndard.

Image
Seleccioneu la pestanya Dades > Anàlisi de dades

Image
Seleccioneu F-Test Two-Sample per a les variacions de la llista i, a continuació, seleccioneu D'acord.

Image

La prova F és molt sensible a la no normalitat. Per tant, pot ser més segur utilitzar una prova de Welch, però això és més difícil a Excel.
Seleccioneu l'interval de la variable 1 i l'interval de la variable 2; configurar l'Alfa (0,05 dóna un 95% de confiança); seleccioneu una cel·la per a la cantonada superior esquerra de la sortida, tenint en compte que això omplirà 3 columnes i 10 files. Seleccioneu D'acord.

Image

Per a l'interval de la variable 1, s'ha de seleccionar la mostra amb la desviació estàndard (o variància) més gran.
Consulteu els resultats de la prova F per determinar si hi ha una diferència significativa entre les variàncies. Els resultats donen tres valors importants:
- F: la proporció entre les variàncies.
- P(F<=f) una cua: la probabilitat que la variable 1 en realitat no tingui una variància més gran que la variable 2. Si aquesta és més gran que alfa, quina generalment és 0,05, aleshores no hi ha cap diferència significativa entre les variàncies.
- F Una cua crítica: el valor de F que caldria per donar P(F<=f)=α. Si aquest valor és més gran que F, això també indica que no hi ha cap diferència significativa entre les variàncies.
P(F<=f) també es pot calcular mitjançant la funció FDIST amb F i els graus de llibertat de cada mostra com a entrades. Els graus de llibertat són simplement el nombre d'observacions d'una mostra menys una.
Ara que ja sabeu si hi ha una diferència entre les variacions, podeu seleccionar la prova T adequada. Seleccioneu la pestanya Data > Anàlisi de dades i, a continuació, seleccioneu Prova t: dues mostres assumint variacions igualso prova t: dues mostres assumint variàncies desiguals

Image
Independentment de l'opció que trieu al pas anterior, se us presentarà el mateix quadre de diàleg per introduir els detalls de l'anàlisi. Per començar, seleccioneu els intervals que contenen les mostres per a Interval de la variable 1 i Interval de la variable 2.

Image
Suposant que no voleu provar cap diferència entre les mitjanes, establiu la Diferència mitjana hipotetitzada a zero.
Definiu el nivell de significació Alfa (0,05 dóna un 95% de confiança) i seleccioneu una cel·la a l'extrem superior esquerre de la sortida, tenint en compte que això omplirà 3 columnes i 14 files. Seleccioneu D'acord.
Reviseu els resultats per decidir si hi ha una diferència significativa entre les mitjanes.

De la mateixa manera que amb la prova F, si el valor p, en aquest cas P(T<=t), és més gran que alfa, no hi ha cap diferència significativa. Tanmateix, en aquest cas es donen dos valors p, un per a una prova d'una cua i l' altre per a una prova de dues cues. En aquest cas, utilitzeu el valor de dues cues, ja que qualsevol de les variables amb una mitjana més gran seria una diferència significativa.