MAINĪBA - Excel un Google izklājlapas

Šī apmācība parāda, kā lietot Funkcija Excel VARIANCE programmā Excel, lai novērtētu dispersiju, pamatojoties uz doto paraugu.

VARIANCE funkciju pārskats

Funkcija VARIANCE Aprēķina aplēses dispersiju, pamatojoties uz doto paraugu.

Lai izmantotu VARIANCE Excel darblapas funkciju, atlasiet šūnu un ierakstiet:

(Ievērojiet, kā parādās formulas ievades)

Funkcija VARIANCE Sintakse un ievades:

1 = VAR (skaitlis1, [skaitlis2],…)

numurus- Vērtības, lai iegūtu dispersiju

Kā aprēķināt dispersiju programmā Excel

Dispersija norāda, cik lielas ir datu kopas vērtības no vidējā. Matemātiski runājot, dispersija ir katra rādītāja kvadrātiskās starpības vidējais rādītājs no vidējā (bet mēs pie tā nonāksim drīz).

Programma Excel sniedz vairākas funkcijas dispersijas aprēķināšanai - VAR.S, VAR.P, VARA, VARPA un divas vecākas funkcijas - VAR un VARP.

Pirms iedziļināties šajās funkcijās un iemācīties tās izmantot, parunāsim par dispersiju un to, kā tā tiek aprēķināta.

Kas ir dispersija?

Analizējot datus, pirmais solis ir vidējā aprēķināšana. Šī, protams, ir noderīga statistika aprēķināšanai, taču tā nesniedz pilnīgu priekšstatu par to, kas notiek ar jūsu datiem.

Ņemiet šādu datu kopu, kas varētu būt testa rezultātu grupa no 100:

1 48,49,50,51,52

Šī diapazona vidējais rādītājs ir 50 (summējiet skaitļus un daliet ar n, kur n ir vērtību skaits).

Pēc tam ņemiet šādu testu rezultātu kopu:

1 10,25,50,75,90

Šī diapazona vidējais ir arī 50 - bet acīmredzot šeit mums ir divi ļoti atšķirīgi datu diapazoni.

Pats par sevi vidējais nevar jums neko pateikt par rezultātu sadalījumu. Tas nenosaka, vai visas vērtības ir apvienotas, piemēram, pirmajos piemēros, vai plašas, piemēram, otrās. Dispersija var palīdzēt jums to iemācīties.

Dispersiju izmanto arī kā bāzes punktu vairākām sarežģītākām statistikas procedūrām.

Kā tiek aprēķināta dispersija

Izpētīsim pamata piemēru un ar rokām aprēķināsim dispersiju. Tādā veidā jūs zināt, kas notiek aizkulisēs, kad faktiski sākat īstenot Excel variantu funkcijas.

Pieņemsim, ka mums ir datu kopa, kas attēlo trīs spēļu kārtis, 4, 6 un 8.

Lai aprēķinātu dispersiju, veiciet tālāk norādītās darbības.

1) Aprēķiniet vidējo

Pirmkārt, mēs aprēķinām vidējo. Mēs zinām, ka mūsu datu diapazons ir 4, 6, 8, tāpēc vidējais būs:

1 (6 + 4 + 8) / 3 = 6

Es to apstiprināju, izmantojot Excel AVERAGE funkciju <>:

1 = VIDĒJĀ (C4: C6)

2) Atņemiet vidējo vērtību no katras datu kopas vērtības

Tālāk no katras vērtības atņemam vidējo.

Es to izdarīju ar šādu formulu:

1 = C4- $ H $ 4

Vidējais rādītājs tiek saglabāts H4, tāpēc es to atņemu no katras tabulas vērtības. Dolāra zīmes šeit vienkārši “bloķē” šo šūnu atsauci uz H4, lai, nokopējot to slejā, tā paliktu nemainīga.

Rezultāti:

Mums ir:

123 4 - 6 = -26 - 6 = 08 - 6 = 2

Mums ir jāiegūst šo atšķirību vidējais no vidējā, bet šo trīs vērtību vidējais ir nulle! Tāpēc mums ir jāuzsver atšķirības, kuras mēs darām, tās kvadrātā.

3) Atzīmējiet atšķirības

Pievienosim jaunu kolonnu un kvadrātā ievietosim skaitļus kolonnā D:

1 = D4*D4

Labi, tas ir labāk. Tagad, kad atšķirības nav vidēji līdz nullei, mēs varam aprēķināt dispersiju.

4) Aprēķiniet kvadrātu atšķirību vidējo lielumu

Šeit mēs satiekam ceļa dakšiņu. Ir divi veidi, kā aprēķināt dispersiju, un tas, ko izmantojat, ir atkarīgs no jūsu datu veida.

  • Ja lietojat iedzīvotāju dati, jūs vienkārši uztverat vidējo kā parasti (summējiet vērtības un daliet ar n)
  • Ja lietojat datu paraugi, jūs summējat vērtības un dalāt ar n-1

Iedzīvotāju dati nozīmē, ka jums ir visu nepieciešamo datu kopums, piemēram, ja vēlaties noteikt vidējo skolotāju vecumu konkrētā skolā un jums ir dati par katru skolotāju šajā skolā, jums ir dati par iedzīvotāju skaitu.

Datu paraugi nozīmē, ka jums nav visu datu, tikai paraugs, kas ņemts no lielākas populācijas. Tātad, ja vēlaties skolotāju vidējo vecumu visā valstī un jums ir dati par skolotājiem tikai vienā skolā, jums ir datu paraugi.

Mūsu piemērā mums ir dati par iedzīvotāju skaitu. Mūs interesē tikai mūsu trīs kartes - tā ir populācija, un mēs neesam no tām paņēmuši paraugu. Tātad mēs varam vienkārši ņemt vidējo kvadrātisko atšķirību normālā veidā:

1 = VIDĒJĀ (E4: E8)

Tātad mūsu iedzīvotāju dispersija ir 2,666.

Ja šis bija datu paraugi (iespējams, mēs būtu izvilkuši šīs trīs kartes no lielāka komplekta), mēs aprēķinātu vidējo šādi:

1 Parauga dispersija = (4 + 0 + 4) / (3 - 1)

Vai:

1 Parauga dispersija = 8 /2 = 4

Kāpēc dalīt ar n-1, izmantojot parauga datus, nevis tikai n?

Īsā atbilde uz šo jautājumu ir “Jo tā sniedz pareizo atbildi”. Bet es domāju, ka jūs vēlēsities nedaudz vairāk! Šī ir sarežģīta tēma, tāpēc es šeit sniegšu tikai īsu pārskatu.

Padomājiet par to šādi: ja ņemat datu paraugu no populācijas, šīs vērtības parasti ir tuvākas vidējam paraugs nekā tie ir populācija.

Tas nozīmē, ka, ja jūs vienkārši dalīsit ar n, jūs nedaudz nenovērtēsit iedzīvotāju atšķirības. Sadalīšana ar n-1 to nedaudz izlabo.

Ar mūsu trīs kāršu komplektu mēs esam labā vietā, lai pārbaudītu šo teoriju. Tā kā ir tikai trīs kārtis, mēs varam ņemt nelielu skaitu paraugu.

Paņemsim divu karšu paraugus. Mēs izvēlēsimies vienu karti, noliksim to atpakaļ, sajauksim un pēc tam izvēlēsimies citu karti. Tas nozīmē, ka mēs varam izvēlēties deviņas divu karšu kombinācijas.

Izmantojot tikai deviņus iespējamos paraugus, mēs varam aprēķināt visas iespējamās izlases dispersijas, izmantojot abas metodes (dalīt ar n un dalīt ar n-1), ņemt vidējo no tām un redzēt, kura no tām dod mums pareizo atbildi.

Zemāk esošajā tabulā es visu izklāstīju. Katra tabulas rinda ir atšķirīgs paraugs, un B un C kolonnā ir redzamas divas kārtis, kas tika atlasītas katrā paraugā. Pēc tam esmu pievienojis vēl divas slejas: vienu, kurā aprēķināju divu karšu parauga dispersiju, dalot ar n, un otru, kur es dalīju ar n - 1.

Paskaties:

Tabulas labajā pusē esmu parādījis D un E slejas vidējos rādītājus.

D kolonnas vidējais lielums, dalot ar n, dod mums dispersiju 1,333.

E kolonnas vidējais lielums, dalot ar n-1, dod mums dispersiju 2,666.

No mūsu iepriekšējā piemēra mēs jau zinām, ka populācijas dispersija ir 2,666. Tātad, dalot ar n-1, izmantojot izlases datus, mēs iegūstam precīzākus aprēķinus.

Excel funkcijas dispersijas aprēķināšanai

Tagad, kad esat redzējis dispersijas aprēķināšanas piemēru, pāriesim pie Excel funkcijām.

Šeit jums ir vairākas iespējas:

  • Lpp atgriež populācijas datu dispersiju (izmantojot dalīšanas metodi ar n)
  • S atgriež izlases datu dispersiju (dalās ar n-1)
  • VAR ir vecāka funkcija, kas darbojas tieši tāpat kā VAR.S
  • VARA ir tāds pats kā VAR.S, izņemot to, ka tajā ir iekļautas teksta šūnas un Būla vērtības
  • VARPA ir tāds pats kā VAR.P, izņemot to, ka tajā ir iekļautas teksta šūnas un Būla vērtības

Iziesim šos pa vienam.

Funkcija Excel VAR.P

VAR.P aprēķina populācijas datu dispersiju (izmantojot dalīšanas ar n metodi). Izmantojiet to šādi:

1 = VAR.P (C4: C6)

VAR.P definējat tikai vienu argumentu: datu diapazonu, kuram vēlaties aprēķināt dispersiju. Mūsu gadījumā šeit ir kartes vērtības C4: C6.

Kā redzat iepriekš, mūsu trīs karšu komplektam VAR.P atgriež 2.666. Šī ir tā pati vērtība, ko mēs iepriekš ar rokām aprēķinājām.

Ņemiet vērā, ka VAR.P pilnībā ignorē šūnas, kas satur tekstu vai Būla (TRUE/FALSE) vērtības. Ja jums tie jāiekļauj, tā vietā izmantojiet VARPA.

Funkcija Excel VAR.S

VAR.S aprēķina izlases datu dispersiju (dalot ar n-1). Jūs to izmantojat šādi:

1 = VAR.S (C4: C6)

Atkal ir tikai viens arguments - jūsu datu diapazons.

Šajā gadījumā VAR.S atgriež 4. Mēs saņēmām to pašu skaitli 4. solī, kad veicām manuālo aprēķinu iepriekš.

VAR.S pilnībā ignorē šūnas, kas satur tekstu vai Būla (TRUE/FALSE) vērtības. Ja jums tie jāiekļauj, izmantojiet VARA.

Excel VAR funkcija

VAR ir pilnīgi līdzvērtīgs VAR.S: tas aprēķina datu paraugu dispersijas (izmantojot n-1 metodi). Lūk, kā to izmantot:

1 = VAR (C4: C6)

VAR ir “saderības funkcija”. Tas nozīmē, ka Microsoft pašlaik noņem šo funkciju no programmas Excel. Pašlaik tas joprojām ir pieejams lietošanai, taču tā vietā izmantojiet VAR.S, lai izklājlapas paliktu saderīgas ar turpmākajām Excel versijām.

Funkcija Excel VARA

VARA arī atgriež izlases datu dispersiju, taču tai ir dažas būtiskas atšķirības no VAR un VAR.S. Proti, tā aprēķinos ietver Būla un teksta vērtības:

  • Patiesas vērtības tiek skaitītas kā 1
  • FALSE vērtības tiek skaitītas kā 0
  • Teksta virknes tiek skaitītas kā 0

Lūk, kā jūs to izmantojat:

1 = VARA (C4: C11)

Mēs esam pievienojuši tabulai vēl piecas rindas: J, Q, K, TRUE un FALSE. D slejā parādīts, kā VARA interpretē šīs vērtības.

Tā kā mūsu tabulā ir jauna zemu vērtību partija, dispersija ir palielinājusies līdz 10,268.

Excel VARPA funkcija

VARPA aprēķina iedzīvotāju datu dispersiju. Tas ir līdzīgs VAR.P, izņemot to, ka aprēķinā iekļautas arī Būla vērtības un teksta virknes:

  • Patiesas vērtības tiek skaitītas kā 1
  • FALSE vērtības tiek skaitītas kā 0
  • Teksta virknes tiek skaitītas kā 0

Jūs to izmantojat šādi:

1 = VARPA (C4: C12)

Mēs esam pievienojuši tabulai vēl piecas rindas: J, Q, K, TRUE un FALSE. D slejā parādīts, kā VARPA interpretē šīs vērtības.

Tā kā datiem tika pievienota šī zemāko vērtību grupa, dispersija ir palielinājusies līdz 8,984.

VARIANCE funkcija Google izklājlapās

Funkcija CORREL Google izklājlapās darbojas tieši tāpat kā programmā Excel:

Jums palīdzēs attīstību vietā, daloties lapu ar draugiem

wave wave wave wave wave