De Tukey-test is een methode die tot doel heeft individuele gemiddelden te vergelijken op basis van een variantieanalyse van verschillende monsters die aan verschillende behandelingen zijn onderworpen.
De test, gepresenteerd in 1949 door John.W. Tukey, stelt ons in staat om te onderscheiden of de verkregen resultaten significant verschillen of niet. Het is ook bekend als Tukey's eerlijk significante verschil-test (Tukey's HSD-test).

Figuur 1. Met de Tukey-test kunnen we onderscheiden of de verschillen in resultaten tussen drie of meer verschillende behandelingen toegepast op drie of meer groepen met dezelfde kenmerken significant en eerlijk verschillende gemiddelde waarden hebben.
Bij experimenten waarbij drie of meer verschillende behandelingen toegepast op hetzelfde aantal monsters worden vergeleken, is het nodig om te onderscheiden of de resultaten significant verschillen of niet.
Van een experiment wordt gezegd dat het evenwichtig is als de grootte van alle statistische steekproeven voor elke behandeling hetzelfde is. Als de grootte van de monsters voor elke behandeling anders is, is er een onevenwichtig experiment.
Soms is het met een variantieanalyse (ANOVA) niet voldoende om te weten of bij het vergelijken van verschillende behandelingen (of experimenten) toegepast op verschillende steekproeven ze voldoen aan de nulhypothese (Ho: “alle behandelingen zijn gelijk”) of, integendeel, voldoet aan de alternatieve hypothese (Ha: "tenminste een van de behandelingen is anders").
De test van Tukey is niet uniek, er zijn veel meer tests om steekproefgemiddelden te vergelijken, maar dit is een van de bekendste en meest toegepaste.
Tukey-vergelijker en tafel
Bij de toepassing van deze test wordt een waarde, genaamd de Tukey-comparator, berekend waarvan de definitie als volgt is:
w = q √ (MSE / r)
Waarbij de factor q wordt verkregen uit een tabel (Tukey's Table), die bestaat uit rijen q-waarden voor een verschillend aantal behandelingen of experimenten. De kolommen geven de waarde van factor q aan voor verschillende vrijheidsgraden. Gewoonlijk hebben de beschikbare tabellen een relatieve significantie van 0,05 en 0,01.

In deze formule verschijnt binnen de vierkantswortel de factor MSE (Mean Square of Error) gedeeld door r, die het aantal herhalingen aangeeft. De MSE is een getal dat normaal wordt verkregen uit een variantiesanalyse (ANOVA).

Als het verschil tussen twee gemiddelde waarden de waarde w (Tukey-comparator) overschrijdt, wordt geconcludeerd dat het verschillende gemiddelden zijn, maar als het verschil kleiner is dan het Tukey-getal, zijn het twee monsters met een statistisch identieke gemiddelde waarde .
Het nummer w is ook bekend als het HSD-nummer (Honestly Significant Difference).
Dit enkele vergelijkende aantal kan worden toegepast als het aantal monsters dat voor de test van elke behandeling wordt gebruikt, in elk ervan hetzelfde is.
Onevenwichtige experimenten
Als om de een of andere reden de grootte van de monsters bij elke te vergelijken behandeling anders is, dan verschilt de hierboven beschreven procedure enigszins en staat bekend als de Tukey-Kramer-test.
Nu wordt een vergelijkingsgetal w verkregen voor elk paar behandelingen i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
In deze formule wordt de factor q verkregen uit de tabel van Tukey. Deze factor q is afhankelijk van het aantal behandelingen en de vrijheidsgraden van de fout. r i is het aantal herhalingen in behandeling i, terwijl r j het aantal herhalingen in behandeling j is.
Voorbeeldgeval
Een konijnenfokker wil een betrouwbare statistische studie doen die hem vertelt welke van de vier merken vetmestvoeder voor konijnen het meest effectief is. Voor het onderzoek vormde hij vier groepen met zes konijnen van anderhalve maand oud die tot dan toe dezelfde voedingsomstandigheden hadden.

De redenen waren dat in de groepen A1 en A4 sterfgevallen plaatsvonden door oorzaken die niet aan voedsel te wijten waren, aangezien een van de konijnen door een insect was gebeten en in het andere geval de dood zeker de oorzaak was van een aangeboren afwijking. De groepen zijn dus uit balans en dan is het nodig om de Tukey-Kramer-test toe te passen.
Oefening opgelost
Om de berekeningen niet te lang te verlengen, wordt een gebalanceerde experimentcase als een opgeloste oefening beschouwd. Het volgende wordt als data beschouwd:

In dit geval zijn er vier groepen die overeenkomen met vier verschillende behandelingen. We merken echter dat alle groepen evenveel gegevens hebben, dus het is dan een evenwichtig geval.
Om de ANOVA-analyse uit te voeren, is de tool gebruikt die is opgenomen in de Libreoffice-spreadsheet. Andere spreadsheets zoals Excel hebben deze tool ingebouwd voor data-analyse. Hieronder staat een samenvattende tabel die is ontstaan nadat de variantieanalyse (ANOVA) is uitgevoerd:

Uit de variantieanalyse hebben we ook de P-waarde, die voor het voorbeeld 2,24E-6 is, ruim onder het 0,05 significantieniveau, wat direct leidt tot het verwerpen van de nulhypothese: alle behandelingen zijn gelijk.
Dat wil zeggen, van de behandelingen hebben sommige verschillende gemiddelde waarden, maar het is noodzakelijk om te weten welke statistisch significant en eerlijk verschillend zijn (HSD) met behulp van de Tukey-test.
Om het nummer wo te vinden, zoals het HSD-nummer ook bekend is, moeten we het gemiddelde kwadraat van de fout MSE vinden. Uit de ANOVA-analyse blijkt dat de som van de kwadraten binnen de groepen SS = 0,2 is; en het aantal vrijheidsgraden binnen de groepen is df = 16 met deze gegevens kunnen we MSE vinden:
MSE = SS / df = 0,2 / 16 = 0,0125
Het is ook nodig om de factor q van Tukey te vinden met behulp van de tabel. Kolom 4, die overeenkomt met de 4 groepen of behandelingen die moeten worden vergeleken, en rij 16 worden doorzocht, aangezien de ANOVA-analyse 16 vrijheidsgraden binnen de groepen opleverde. Dit leidt ons tot een waarde van q gelijk aan: q = 4,33 overeenkomend met 0,05 significantie of 95% betrouwbaarheid. Ten slotte wordt de waarde voor het "eerlijk significante verschil" gevonden:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Om te weten welke de eerlijk verschillende groepen of behandelingen zijn, moet u de gemiddelde waarden van elke behandeling kennen:

Het is ook noodzakelijk om de verschillen te kennen tussen de gemiddelde waarden van paren behandelingen, die in de volgende tabel worden weergegeven:

Geconcludeerd wordt dat de beste behandelingen, in termen van het maximaliseren van het resultaat, T1 of T3 zijn, die statistisch gezien onverschillig zijn. Om te kiezen tussen T1 en T3, zou men moeten zoeken naar andere factoren buiten de hier gepresenteerde analyse. Bijvoorbeeld prijs, beschikbaarheid, etc.
Referenties
- Cochran William en Cox Gertrude. 1974. Experimentele ontwerpen. Dorsen. Mexico. Derde herdruk. 661p.
- Snedecor, GW en Cochran, WG 1980. Statistische methoden. Zevende Ed. Iowa, The Iowa State University Press. 507p.
- Steel, RGD en Torrie, JH 1980. Principes en procedures van de statistiek: een biometrische benadering (2e ed.). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Individuele gemiddelden vergelijken in de variantieanalyse. Biometrie, 5: 99-114.
- Wikipedia. Tukey's test. Hersteld van: en.wikipedia.com
