Basisgegevensanalyse uitvoeren in Excel

Basisgegevensanalyse uitvoeren in Excel

Wanneer u statistieken uitvoert, wilt u meestal statistische software gebruiken. Deze tools zijn gebouwd om berekeningen uit te voeren zoals: t -toetsen, chikwadraattoetsen, correlaties, enzovoort. Excel is niet bedoeld voor gegevensanalyse. Maar dat betekent niet dat je het niet kunt.





Helaas zijn de statistische functies van Excel niet altijd intuïtief. En ze geven je meestal esoterische resultaten. Dus in plaats van statistische functies te gebruiken, gaan we de go-to Excel-statistieken-invoegtoepassing gebruiken: de Gegevensanalyse Gereedschapspak.





De Toolpak bevat, ondanks zijn nogal ongelukkige spelling, een breed scala aan nuttige statistische functionaliteit. Laten we eens kijken wat we kunnen doen met Excel-statistieken.





Het Excel Data Analysis Toolpak toevoegen

Terwijl jij kan doe statistieken zonder de Data Analysis Toolpak, het is er veel gemakkelijker mee. Om de Toolpak in Excel 2016 te installeren, gaat u naar Bestand > Opties > Invoegtoepassingen .

Klik Gaan naast 'Beheren: Excel-invoegtoepassingen'.



Vink in het resulterende venster het vakje aan naast Analyse Toolpak en klik vervolgens op Oke .

Als u de Data Analysis Toolpak correct hebt toegevoegd aan Excel, ziet u een: Gegevensanalyse knop in de Gegevens tabblad, gegroepeerd in de Analyse sectie:





Als je nog meer kracht wilt, bekijk dan zeker de andere invoegtoepassingen van Excel.

Beschrijvende statistieken in Excel

Welke statistische test u ook uitvoert, u wilt waarschijnlijk eerst de beschrijvende statistieken van Excel hebben. Dit geeft u informatie over gemiddelden, medianen, variantie, standaarddeviatie en -fout, kurtosis, scheefheid en een verscheidenheid aan andere cijfers.





Het uitvoeren van beschrijvende statistieken in Excel is eenvoudig. Klik Gegevensanalyse op het tabblad Gegevens, selecteer Beschrijvende statistieken, en selecteer uw invoerbereik. Klik op de pijl naast het invoerbereikveld, klik en sleep om uw gegevens te selecteren en druk op Binnenkomen (of klik op de corresponderende pijl-omlaag), zoals in de onderstaande GIF.

Zorg er daarna voor dat u Excel vertelt of uw gegevens labels hebben, of u de uitvoer in een nieuw blad of op hetzelfde blad wilt, en of u overzichtsstatistieken en andere opties wilt.

Druk daarna op Oke , en u krijgt uw beschrijvende statistieken:

Student's t-test in Excel

De t -test is een van de meest elementaire statistische tests, en het is gemakkelijk te berekenen in Excel met de Toolpak. Klik op de Gegevensanalyse en scroll naar beneden totdat je de ziet t - testmogelijkheden.

Je hebt drie keuzes:

  • t-Test: Gepaarde twee monsters voor gemiddelden moet worden gebruikt wanneer uw metingen of waarnemingen zijn gekoppeld. Gebruik deze als u twee metingen heeft gedaan bij dezelfde proefpersonen, zoals het meten van de bloeddruk voor en na een ingreep.
  • t-Test: twee steekproeven uitgaande van gelijke varianties moet worden gebruikt wanneer uw metingen onafhankelijk zijn (wat meestal betekent dat ze op twee verschillende onderzoeksgroepen zijn gedaan). We zullen het gedeelte 'gelijke varianties' zo bespreken.
  • t-Test: twee steekproeven uitgaande van ongelijke varianties is ook voor onafhankelijke metingen, maar wordt gebruikt wanneer uw varianties ongelijk zijn.

Om te testen of de varianties van uw twee steekproeven gelijk zijn, moet u een F-test uitvoeren. Vind F-Test Two-Sample voor varianties in de lijst Analysehulpmiddelen, selecteer het en klik op Oke .

Voer uw twee datasets in de invoerbereikvakken in. Laat de alfawaarde op 0,05 staan, tenzij u een reden hebt om deze te wijzigen. Als u niet weet wat dat betekent, laat u het gewoon. Klik ten slotte op Oke .

Excel geeft u de resultaten in een nieuw blad (tenzij u hebt geselecteerd Uitgangsbereik: en een cel in uw huidige blad):

Je kijkt hier naar de P-waarde. Als het minder dan 0,05 is, heb je ongelijke varianties . Dus om de . uit te voeren t -test, moet u de optie ongelijke varianties gebruiken.

om te rennen t -test, selecteert u de juiste test in het venster Analysehulpmiddelen en selecteert u beide sets van uw gegevens op dezelfde manier als voor de F-test. Laat de alfawaarde op 0,05 staan ​​en druk op Oke .

De resultaten bevatten alles wat u moet rapporteren voor een t -toets: de gemiddelden, vrijheidsgraden (df), t-statistiek en de P-waarden voor zowel eenzijdige als tweezijdige toetsen. Als de P-waarde kleiner is dan 0,05, zijn de twee steekproeven significant verschillend.

Als u niet zeker weet of u een een- of tweezijdige t -test, check out deze uitleg van UCLA .

ANOVA in Excel

De Excel Data Analysis Toolpak biedt drie soorten variantieanalyse (ANOVA). Helaas geeft het je niet de mogelijkheid om de nodige vervolgtests zoals Tukey of Bonferroni uit te voeren. Maar je kunt zien of er een verband is tussen een paar verschillende variabelen.

Dit zijn de drie ANOVA-tests in Excel:

  • ANOVA: enkele factor analyseert variantie met één afhankelijke variabele en één onafhankelijke variabele. Het heeft de voorkeur boven het gebruik van meerdere t -tests als je meer dan twee groepen hebt.
  • ANOVA: twee-factoren met replicatie is vergelijkbaar met de gepaarde t -toets; het gaat om meerdere metingen op afzonderlijke onderwerpen. Het 'twee-factor'-gedeelte van deze test geeft aan dat er twee onafhankelijke variabelen zijn.
  • ANOVA: twee factoren zonder replicatie omvat twee onafhankelijke variabelen, maar geen replicatie in de meting.

We zullen de single-factor-analyse hier bespreken. In ons voorbeeld kijken we naar drie reeksen getallen, genaamd 'Interventie 1,' 'Interventie 2' en 'Interventie 3'. Om een ​​ANOVA uit te voeren, klikt u op Gegevensanalyse en selecteer vervolgens ANOVA: enkele factor .

Selecteer het invoerbereik en zorg ervoor dat u Excel vertelt of uw groepen in kolommen of rijen staan. Ik heb hier ook 'Labels in eerste rij' geselecteerd, zodat de groepsnamen in de resultaten worden weergegeven.

Na het raken Oke , krijgen we de volgende resultaten:

Merk op dat de P-waarde kleiner is dan 0,05, dus we hebben een significant resultaat. Dat betekent dat er een significant verschil is tussen ten minste twee van de groepen in de test. Maar omdat Excel geen tests biedt om te bepalen die groepen verschillen, kunt u het beste kijken naar de gemiddelden die in het overzicht worden weergegeven. In ons voorbeeld ziet Interventie 3 eruit alsof het is waarschijnlijk degene die verschilt.

Dit is statistisch niet correct. Maar als je gewoon wilt zien of er een verschil is en welke groep het waarschijnlijk veroorzaakt, dan zal het werken.

Tweefactor-ANOVA is ingewikkelder. Als u meer wilt weten over wanneer u de tweefactormethode moet gebruiken, zie: deze video van Sophia.org en de ' zonder replicatie ' en ' met replicatie ' voorbeelden uit Real Statistics.

Correlatie in Excel

Correlatie berekenen in Excel is veel eenvoudiger dan de t -test of een ANOVA. Gebruik de Gegevensanalyse om het venster Analysehulpmiddelen te openen en selecteer Correlatie .

Selecteer uw invoerbereik, identificeer uw groepen als kolommen of rijen en vertel Excel of u labels heeft. Druk daarna op Oke .

Je krijgt geen maten van betekenis, maar je kunt zien hoe elke groep gecorreleerd is met de andere. Een waarde van één is een absolute correlatie, wat aangeeft dat de waarden exact hetzelfde zijn. Hoe dichter bij één de correlatiewaarde, hoe sterker de correlatie.

Regressie in Excel

Regressie is een van de meest gebruikte statistische tests in de industrie en Excel heeft verrassend veel kracht voor deze berekening. We zullen hier een snelle meervoudige regressie in Excel uitvoeren. Als je niet bekend bent met regressie, kijk dan op HBR's gids voor het gebruik van regressie voor bedrijven .

Laten we zeggen dat onze afhankelijke variabele bloeddruk is, en onze twee onafhankelijke variabelen zijn gewicht en zoutinname. We willen zien wat een betere voorspeller is van de bloeddruk (of dat ze allebei goed zijn).

Klik Gegevensanalyse en selecteer regressie . U moet deze keer voorzichtig zijn bij het invullen van de invoerbereikvakken. De Invoer Y-bereik box moet uw enkele afhankelijke variabele bevatten. De Invoer X-bereik box kan meerdere onafhankelijke variabelen bevatten. Voor een eenvoudige regressie hoeft u zich geen zorgen te maken over de rest (maar vergeet niet Excel te vertellen als u labels hebt geselecteerd).

Zo ziet onze berekening eruit:

Na het raken Oke , krijgt u een grote lijst met resultaten. Ik heb hier de P-waarde gemarkeerd voor zowel gewicht als zoutinname:

Zoals je kunt zien, is de P-waarde voor gewicht groter dan 0,05, dus daar is geen significant verband. De P-waarde voor zout is echter lager dan 0,05, wat aangeeft dat het een goede voorspeller is van de bloeddruk.

Als u van plan bent uw regressiegegevens te presenteren, onthoud dan dat u een regressielijn kunt toevoegen aan een spreidingsdiagram in Excel. Het is een geweldige visuele hulp voor deze analyse.

Excel-statistieken: verrassend capabel

Hoewel Excel niet bekend staat om zijn statistische kracht, bevat het een aantal echt nuttige functies, zoals: de PowerQuery-tool , wat handig is voor taken zoals het combineren van datasets . (Leer hoe u uw eerste Microsoft Power Query-script genereert.) Er is ook de Data Analysis Toolpak-invoegtoepassing voor statistieken, die echt enkele van de beste functies van Excel naar voren brengt. Ik hoop dat je hebt geleerd hoe je de Toolpak moet gebruiken en dat je nu zelf kunt spelen om erachter te komen hoe je meer van zijn functies kunt gebruiken.

oude sms-berichten bekijken

Met dit nu onder uw riem, kunt u uw Excel-vaardigheden naar een hoger niveau tillen met onze artikelen over de functie Doel zoeken van Excel gebruiken voor meer gegevensverwerking en zoeken naar waarden met vlookup . Op een gegeven moment wil je misschien ook leren hoe je Excel-gegevens in Python kunt importeren.

Deel Deel Tweeten E-mail Verwijder deze Windows-bestanden en -mappen om schijfruimte vrij te maken

Wilt u schijfruimte op uw Windows-computer vrijmaken? Hier zijn de Windows-bestanden en -mappen die veilig kunnen worden verwijderd om schijfruimte vrij te maken.

Lees volgende
Gerelateerde onderwerpen
  • productiviteit
  • Spreadsheet
  • Microsoft Excel
Over de auteur Dan Albright(506 artikelen gepubliceerd)

Dann is een contentstrategie- en marketingconsultant die bedrijven helpt bij het genereren van vraag en leads. Hij blogt ook over strategie en contentmarketing op dannalbright.com.

Meer van Dann Albright

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Klik hier om je te abonneren