KITIMAS - „Excel“ ir „Google“ skaičiuoklės

Ši pamoka parodo, kaip naudotis „Excel VARIANCE“ funkcija „Excel“, kad įvertintų dispersiją pagal pateiktą pavyzdį.

VARIANCE funkcijų apžvalga

Funkcija VARIANCE apskaičiuoja įvertinimo dispersiją pagal tam tikrą pavyzdį.

Jei norite naudoti „VARIANCE Excel“ darbalapio funkciją, pasirinkite langelį ir įveskite:

(Atkreipkite dėmesį, kaip atrodo formulės įvestys)

Funkcija VARIANCE Sintaksė ir įvestys:

1 = VAR (skaičius1, [skaičius2],…)

skaičių- Vertės gauti dispersiją

Kaip apskaičiuoti „Excel“ dispersiją

Dispersija nurodo, kaip duomenų rinkinio vertės yra paskirstytos nuo vidurkio. Matematiškai kalbant, dispersija yra kiekvieno balo kvadrato skirtumo nuo vidurkio vidurkis (bet mes netrukus prie to pateksime).

„Excel“ suteikia daugybę funkcijų dispersijai apskaičiuoti - VAR.S, VAR.P, VARA, VARPA ir dvi senesnes funkcijas - VAR ir VARP.

Prieš įsigilindami į šias funkcijas ir išmokdami jomis naudotis, pakalbėkime apie dispersiją ir kaip ji apskaičiuojama.

Kas yra dispersija?

Analizuojant duomenis, pirmas bendras žingsnis yra apskaičiuoti vidurkį. Žinoma, tai yra naudinga statistika, kurią reikia apskaičiuoti, tačiau ji nesuteikia jums išsamaus vaizdo apie tai, kas vyksta su jūsų duomenimis.

Paimkite šį duomenų rinkinį, kuris gali būti bandymų rezultatų grupė, surinkta iš 100:

1 48,49,50,51,52

Šio diapazono vidurkis yra 50 (sudėkite skaičius ir padalinkite iš n, kur n yra reikšmių skaičius).

Tada paimkite šį bandymų rezultatų rinkinį:

1 10,25,50,75,90

Šio diapazono vidurkis yra taip pat 50 - bet akivaizdu, kad čia turime du labai skirtingus duomenų diapazonus.

Pati savaime vidurkis negali nieko pasakyti apie tai, kaip balai yra pasiskirstę. Tai nesako, ar visos vertės yra susietos, kaip pirmose pavyzdžiuose, ar plačiai išdėstytos, kaip antrasis. Skirtumas gali padėti jums to išmokti.

Dispersija taip pat naudojama kaip bazinis taškas atliekant sudėtingesnes statistines procedūras.

Kaip apskaičiuojamas dispersija

Panagrinėkime pagrindinį pavyzdį ir apskaičiuokime dispersiją ranka. Tokiu būdu jūs žinosite, kas vyksta užkulisiuose, kai iš tikrųjų pradėsite taikyti „Excel“ dispersijos funkcijas.

Tarkime, kad turime duomenų rinkinį, vaizduojantį tris žaidimo korteles: 4, 6 ir 8.

Norėdami apskaičiuoti dispersiją, atlikite šį procesą:

1) Apskaičiuokite vidurkį

Pirma, mes apskaičiuojame vidurkį. Mes žinome, kad mūsų duomenų diapazonas yra 4, 6, 8, todėl vidurkis bus toks:

1 (6 + 4 + 8) / 3 = 6

Aš tai patvirtinau toliau naudodami „Excel AVERAGE“ funkciją <>:

1 = VIDUTINIS (C4: C6)

2) Atimkite vidurkį iš kiekvienos duomenų rinkinio vertės

Toliau iš kiekvienos savo vertybės atimame vidurkį.

Aš tai padariau pagal šią formulę:

1 = C4- $ H $ 4

Vidurkis saugomas H4, todėl aš tiesiog atimu tai iš kiekvienos lentelės vertės. Dolerio ženklai čia tiesiog „užrakina“ tą langelio nuorodą į H4, kad nukopijavus jį į stulpelį jis liktų toks pat.

Rezultatai:

Mes turime:

123 4 - 6 = -26 - 6 = 08 - 6 = 2

Turime gauti šių skirtumų vidurkį nuo vidurkio, tačiau šių trijų verčių vidurkis yra nulis! Taigi turime pabrėžti skirtumus, kuriuos darome kvadratais.

3) Apskaičiuokite skirtumus

Pridėkime naują stulpelį ir kvadratą D stulpelyje suformuokime skaičius:

1 = D4*D4

Gerai, tai geriau. Dabar, kai skirtumai nėra vidutiniai iki nulio, galime apskaičiuoti dispersiją.

4) Apskaičiuokite kvadratinių skirtumų vidurkį

Čia sutinkame kelio atšaką. Yra du būdai, kaip apskaičiuoti dispersiją, o tas, kurį naudojate, priklauso nuo turimų duomenų tipo.

  • Jei naudojate gyventojų duomenys, jūs tiesiog priimate vidurkį kaip normalų (susumuokite vertes ir padalinkite iš n)
  • Jei naudojate duomenų pavyzdžiai, susumuojate reikšmes ir padalijate iš n-1

Gyventojų duomenys reiškia, kad turite visus reikalingus duomenis, pavyzdžiui, jei norite vidutinio mokytojų amžiaus konkrečioje mokykloje ir turite kiekvieno tos mokyklos mokytojo amžiaus duomenis, turite gyventojų duomenis.

Pavyzdiniai duomenys reiškia, kad neturite visų savo duomenų, tik pavyzdį, paimtą iš didesnės populiacijos. Taigi, jei norite vidutinio mokytojų amžiaus visoje šalyje ir turite tik vienos mokyklos mokytojų duomenis, turite duomenų pavyzdžius.

Mūsų pavyzdyje turime gyventojų duomenis. Mus domina tik mūsų trys kortelės - tai yra populiacija, ir mes iš jų nepaėmėme pavyzdžio. Taigi mes galime tiesiog paimti kvadratinių skirtumų vidurkį įprastu būdu:

1 = VIDUTINIS (E4: E8)

Taigi mūsų gyventojų dispersija yra 2,666.

Jei tai buvo duomenų pavyzdžius (galbūt ištraukėme šias tris korteles iš didesnio rinkinio), apskaičiuosime vidurkį taip:

1 Pavyzdžio dispersija = (4 + 0 + 4) / (3 - 1)

Arba:

1 Mėginio dispersija = 8 /2 = 4

Kodėl dalinti iš n-1 naudojant pavyzdinius duomenis, o ne tik n?

Trumpas atsakymas į šį klausimą yra „Nes jis suteikia teisingą atsakymą“. Bet aš įsivaizduoju, kad norėsite šiek tiek daugiau! Tai sudėtinga tema, todėl čia trumpai apžvelgsiu.

Pagalvokite apie tai taip: jei paimsite populiacijos duomenų pavyzdį, šios vertės bus arčiau vidurkio pavyzdys nei jie yra vidutiniškai gyventojų.

Tai reiškia, kad jei tik padalinsite iš n, šiek tiek neįvertinsite gyventojų dispersijos. Padalijimas iš n-1 tai šiek tiek pataiso.

Turėdami trijų kortelių rinkinį, mes esame tinkamoje vietoje išbandyti šią teoriją. Kadangi yra tik trys kortelės, mes galime paimti nedidelį skaičių pavyzdžių.

Imkime dviejų kortelių pavyzdžius. Mes pasirinksime vieną kortelę, padėsime ją atgal, maišysime ir tada pasirinksime kitą kortelę. Tai reiškia, kad galime pasirinkti devynias dviejų kortelių kombinacijas.

Turėdami tik devynis galimus pavyzdžius, galime apskaičiuoti kiekvieną įmanomą imties dispersiją, naudodamiesi abiem metodais (padalyti iš n ir padalyti iš n-1), paimti jų vidurkį ir pamatyti, kuris iš jų duoda mums teisingą atsakymą.

Žemiau esančioje lentelėje aš viską išdėstiau. Kiekviena lentelės eilutė yra skirtingas pavyzdys, o B ir C stulpeliuose rodomos dvi kortelės, kurios buvo paimtos kiekviename pavyzdyje. Tada pridėjau dar du stulpelius: vieną, kuriame apskaičiavau to dviejų kortelių pavyzdžio dispersiją, padalydamas iš n, ir kitą, kur padalinau iš n - 1.

Pažiūrėk:

Lentelės dešinėje parodiau D ir E stulpelių vidurkius.

D stulpelio vidurkis, dalijant iš n, suteikia mums dispersiją 1,333.

E stulpelio vidurkis, dalijant iš n-1, suteikia mums 2,666 dispersiją.

Iš ankstesnio pavyzdžio jau žinome, kad populiacijos dispersija yra 2,666. Taigi dalijant iš n-1 naudojant imties duomenis, gaunami tikslesni įvertinimai.

„Excel“ funkcijos dispersijai apskaičiuoti

Dabar, kai matėte dispersijos skaičiavimo pavyzdį, pereikime prie „Excel“ funkcijų.

Čia yra keletas variantų:

  • P grąžina populiacijos duomenų dispersiją (naudojant padalijimo pagal n metodą)
  • S grąžina imties duomenų dispersiją (padalijama iš n-1)
  • VAR yra senesnė funkcija, kuri veikia lygiai taip pat kaip ir VAR.S
  • VARA yra tas pats kaip VAR.S, išskyrus tai, kad jame yra teksto langelių ir loginės vertės
  • VARPA yra tas pats kaip VAR.P, išskyrus tai, kad jame yra teksto langelių ir loginės vertės

Eikime per šiuos po vieną.

„Excel“ VAR.P funkcija

VAR.P apskaičiuoja populiacijos duomenų dispersiją (naudojant dalijimo pagal n metodą). Naudokite taip:

1 = VAR.P (C4: C6)

VAR.P galite apibrėžti tik vieną argumentą: duomenų diapazoną, kurio dispersiją norite apskaičiuoti. Mūsų atveju čia yra kortelės vertės C4: C6.

Kaip matote aukščiau, VAR.P grąžina 2,666 už mūsų trijų kortelių rinkinį. Tai ta pati vertė, kurią anksčiau apskaičiavome ranka.

Atminkite, kad VAR.P visiškai ignoruoja langelius, kuriuose yra teksto arba loginės (TRUE/FALSE) reikšmių. Jei norite juos įtraukti, naudokite VARPA.

„Excel“ VAR.S funkcija

VAR.S apskaičiuoja imties duomenų dispersiją (dalijant iš n-1). Jūs jį naudojate taip:

1 = VAR.S (C4: C6)

Vėlgi, yra tik vienas argumentas - jūsų duomenų diapazonas.

Šiuo atveju VAR.S grąžina 4. Tą patį skaičių gavome atlikdami 4 veiksmą, kai aukščiau atlikome rankinį skaičiavimą.

VAR.S visiškai ignoruoja langelius, kuriuose yra teksto arba loginės (TRUE/FALSE) reikšmių. Jei norite juos įtraukti, naudokite VARA.

„Excel“ VAR funkcija

VAR yra visiškai lygiavertis VAR.S: jis apskaičiuoja imties duomenų dispersijas (naudojant n-1 metodą). Štai kaip jį naudoti:

1 = VAR (C4: C6)

VAR yra „suderinamumo funkcija“. Tai reiškia, kad „Microsoft“ pašalina šią funkciją iš „Excel“. Šiuo metu ją vis dar galima naudoti, tačiau turėtumėte naudoti VAR.S, kad jūsų skaičiuoklės liktų suderinamos su būsimomis „Excel“ versijomis.

„Excel“ VARA funkcija

VARA taip pat pateikia pavyzdinių duomenų dispersiją, tačiau ji turi keletą esminių skirtumų nuo VAR ir VAR.S. Būtent į skaičiavimą įtraukiamos loginės ir teksto vertės:

  • TRUE reikšmės skaičiuojamos kaip 1
  • FALSE reikšmės skaičiuojamos kaip 0
  • Teksto eilutės skaičiuojamos kaip 0

Štai kaip jūs jį naudojate:

1 = VARA (C4: C11)

Į lentelę įtraukėme dar penkias eilutes: J, Q, K, TRUE ir FALSE. D stulpelyje parodyta, kaip VARA interpretuoja šias vertes.

Kadangi mūsų lentelėje yra nauja mažų verčių partija, dispersija padidėjo iki 10,268.

„Excel“ VARPA funkcija

VARPA apskaičiuoja gyventojų duomenų dispersiją. Tai panašu į VAR.P, išskyrus tai, kad į skaičiavimą taip pat įtraukiamos loginės vertės ir teksto eilutės:

  • TRUE reikšmės skaičiuojamos kaip 1
  • FALSE reikšmės skaičiuojamos kaip 0
  • Teksto eilutės skaičiuojamos kaip 0

Jūs jį naudojate taip:

1 = VARPA (C4: C12)

Į lentelę įtraukėme dar penkias eilutes: J, Q, K, TRUE ir FALSE. D stulpelyje parodyta, kaip VARPA interpretuoja šias vertes.

Pridėjus prie duomenų šią mažesnių verčių grupę, dispersija padidėjo iki 8,984.

„VARIANCE“ funkcija „Google“ skaičiuoklėse

Funkcija CORREL „Google“ skaičiuoklėse veikia taip pat, kaip ir „Excel“:

Padėsite svetainės plėtrą, dalintis puslapį su draugais

wave wave wave wave wave