Proračun korelacionih zavisnosti u Microsoft Excel-u. Korelacijske zavisnosti Pitanja i zadaci

Cilj rada: dobijanje ideje o korelacionoj zavisnosti veličina; savladavanje metode izračunavanja koeficijenta korelacije pomoću KOPPEL funkcije.
Korišteni softver: procesor tabela Microsoft Office Excel.

Vježba 1

Potrebno je izvršiti proračune korelacije između učinka učenika i troškova poslovanja škole, opisanih u § 38 udžbenika.
1. Popunite tabelu sa sljedećim podacima:

2. Konstruirajte dijagram raspršenosti zavisnosti veličina.

3. Izvršiti statističku funkciju KOPEL, specificirajući raspon vrijednosti u dijaloškom okviru: B2:B21 i C2:C21.
4. Zapišite vrijednost koeficijenta korelacije.

Zadatak 2

Izvršite korelacione proračune uspješnosti učenika na obezbjeđenju udžbenika i na nabavci računara, prikazane u sljedećoj tabeli.

Zadatak za samostalan rad na temu “Korelacione zavisnosti”

Dođite do tablice uparenih mjerenja vrijednosti nekih veličina između kojih postoji hipotetička korelacija. Analizirajte ovu zavisnost na postojanje linearne korelacije.

      Primjeri relevantnih povezanih količina uključuju:
      nivo obrazovanja (mjeren, na primjer, u ukupnom broju godina školovanja) i nivo mjesečnih primanja;
      nivo obrazovanja i nivo pozicije (za ovo drugo osmislite konvencionalnu skalu);
      broj računara u školi po učeniku i prosječan rezultat testa za nivo poznavanja standardnih tehnologija obrade informacija;
      broj sati koje srednjoškolci potroše na domaći zadatak i prosječnu ocjenu;
      količina gnojiva unesenog na tlo i prinos određene kulture.

U ovom slučaju možete ići na dva načina. Prvi, ozbiljniji i praktično korisniji: ne dolazite samo do hipotetičke korelacije, već i pronalazite stvarne podatke o tome u literaturi. Drugi način je lakši: tretirate ga kao igru ​​kako biste razumjeli što je korelacija i razvili tehničke vještine za analizu i došli do odgovarajućih podataka, pokušavajući to učiniti na najvjerovatniji način.

>>Informatika: Računarska radionica: Rad 15. Proračun korelacijskih zavisnosti u MS Excel-u

Računarska radionica

Rad 15. Proračun korelacionih zavisnosti u MS Excel-u

Ciljevi rada:

Dobivanje ideje o korelacionoj zavisnosti veličina;

Ovladavanje metodom izračunavanja koeficijenta korelacije pomoću funkcije CORREL.

Koristi se softver sadržaji: procesor tabela MS Excel.

Vježba 1

U nastavku sto sadrži podatke o uparenim mjerenjima dvije veličine izvršenim u određenoj školi; temperatura vazduha u odeljenju x i udeo učenika sa prehladom y:

Ovisnost je statističke prirode, jer je nemoguće pouzdano reći, na primjer, da je na temperaturi od 15°C u školi bolesno 5% učenika, a na temperaturi od 20°C - 2%. Osim temperature, postoje i drugi faktori koji utiču na prehladu, različiti za različite škole, i nemoguće ih je sve kontrolisati.

Uradite sljedeće uzastopno:

=> unesite podatke Excel kao što je prikazano na sl. 2.12 (vidi temu 9);

=> koristite Čarobnjak za grafikone da napravite dijagram raspršenja koji vizuelno prikazuje zavisnost tabele;

=> odgovori na pitanje da li je na osnovu ove tačke moguće postaviti hipotezu o postojanju linearne korelacije između vrednosti;

=> ako je odgovor jasno negativan, ispravite tabelu tako da hipoteza o linearnoj korelaciji postane vjerodostojnija;


Zadatak 2

Dođite do tablice uparenih mjerenja vrijednosti nekih veličina između kojih postoji hipotetička korelacija. Analizirajte ovaj odnos radi prisustva linearne korelacije.

Primjeri relevantnih povezanih količina uključuju:

Nivo obrazovanja (mjeren, na primjer, ukupnim godinama školovanja) i nivo mjesečnih primanja;

nivo obrazovanja i nivo pozicije (za ovo drugo, osmislite konvencionalnu skalu);

Broj računara u školi po učeniku i prosječna ocjena pri testiranju nivoa poznavanja standardnih tehnologija obrade informacija;

Broj sati koje srednjoškolac provede na domaćem zadatku i prosječna ocjena;

Količina unesenog gnojiva na tlo i prinos određene kulture.

Semakin I.G., Henner E.K., Računarstvo i IKT, 11

Dostavili čitaoci sa internet stranica

Sadržaj lekcije beleške sa lekcija podrška okvirnoj prezentaciji lekcija metode ubrzanja interaktivne tehnologije Vježbajte zadaci i vježbe radionice za samotestiranje, treninzi, slučajevi, potrage domaća zadaća diskusija pitanja retorička pitanja učenika Ilustracije audio, video i multimedija fotografije, slike, grafike, tabele, dijagrami, humor, anegdote, vicevi, stripovi, parabole, izreke, ukrštene riječi, citati Dodaci sažetakačlanci trikovi za radoznale jaslice udžbenici osnovni i dodatni rječnik pojmova ostalo Poboljšanje udžbenika i lekcijaispravljanje grešaka u udžbeniku ažuriranje fragmenta u udžbeniku, elementi inovacije u lekciji, zamjena zastarjelog znanja novim Samo za nastavnike savršene lekcije kalendarski plan za godinu; Integrisane lekcije

Predmet: Praktični rad br. 17

"Proračun korelacionih zavisnosti u Microsoft Excel-u"

Vrsta lekcije: praktičan rad

Ciljevi:

Dobivanje ideje o korelacionoj zavisnosti veličina;

Ovladavanje metodom izračunavanja koeficijenta korelacije pomoću funkcije CORREL;

Formiranje vještina rada u MS Excel-u;

Razvoj sistemskog mišljenja, koje omogućava da se u okolnoj realnosti identifikuju sistemi, elementi sistema koji su adekvatni zadatku;

Formiranje profesionalnih radnih vještina.

Oprema:

Interaktivna ploča;

Tokom nastave:

I. Organizacioni trenutak (5 min.)

Pozdrav. Predmet poruke.

II. Ažuriranje znanja (5 min.)

Provjera domaćeg.

III. Praktični rad (30 min.)

Praktični rad br. 17

Vježba 1

Potrebno je izvršiti proračune korelacije između učinka učenika i troškova poslovanja škole, opisanih u § 38 udžbenika.

1. Popunite tabelu sa sljedećim podacima:

A

IN

WITH

p/p

Troškovi (RUB/osoba)

Akademski učinak (prosječan rezultat)

3,81

345

4,13

4,30

100

3,96

203

3,87

420

4,33

210

137

4,21

463

4,4

231

3,99

134

3,9

100

4,07

294

4,15

396

4,1

3,76

480

4,25

450

3,88

496

4,50

102

4,12

150

4,32

2. Konstruisati dijagram rasejanja zavisnosti veličina (njegov izgled je prikazan u udžbeniku na slici 6.7).

3. Izvršite statističku funkciju CORREL, navodeći raspon vrijednosti u dijaloškom okviru: B2:B21 i C2:C21.

4. Zapišite vrijednost koeficijenta korelacije.

Zadatak 2

Izvršite proračune korelacionih zavisnosti uspeha učenika od nabavke udžbenika i od nabavke računara, prikazanih u sledećoj tabeli.

Osiguravanje obrazovnog procesa

Školski broj

Dostupnost udžbenika(%)

Akademski učinak (prosječan rezultat)

Dostupnost računara(%)

Akademski učinak (prosječan rezultat)

3,81

3,98

4,15

4,01

4,69

4,34

4,37

4,41

4,53

3,94

4,23

3,62

100

4,73

4,6

3,69

4,24

4,08

4,36

4,2

3,99

4,32

4,5

Uporedite dobijene vrednosti koeficijenata korelacije sa onima datim u § 38 udžbenika.

Zadatak za samostalan rad na temu

"Korelacione zavisnosti"

Dođite do tablice uparenih mjerenja vrijednosti nekih veličina između kojih postoji hipotetička korelacija. Analizirajte ovu zavisnost na postojanje linearne korelacije.

Primjeri relevantnih povezanih količina uključuju:

nivo obrazovanja (mjeren, na primjer, u ukupnom broju godina školovanja) i nivo mjesečnih primanja;

nivo obrazovanja i nivo pozicije (za ovo drugo osmislite konvencionalnu skalu);

broj računara u školi po učeniku i prosječna ocjena pri testiranju nivoa poznavanja standardnih tehnologija obrade informacija;

broj sati koje srednjoškolci potroše na domaći zadatak i prosječnu ocjenu;

količina gnojiva unesenog na tlo i prinos određene kulture.

U ovom slučaju možete ići na dva načina. Prvi, ozbiljniji i praktično korisniji: ne dolazite samo do hipotetičke korelacije, već i pronalazite stvarne podatke o tome u literaturi. Drugi način je lakši: tretirate ga kao igru ​​kako biste razumjeli što je korelacija i razvili tehničke vještine za analizu i došli do odgovarajućih podataka, pokušavajući to učiniti na najvjerovatniji način.

IV. Sažetak lekcije (2 min.)Objavljuju se rezultati.

V. Domaći (3 min.)Ponoviti § 38

Jedinstveni državni ispit iz informatike je izborni ispit koji polažu kandidati za IT smjerove. Stručnjak Jedinstvenog državnog ispita, specijalista obrazovno-metodičkog rada i programer pripremnih programa za ispit iz informatike govorili su o tome kako se najbolje pripremiti za ovaj ispit. Ljudmila Gontar.

Kakva je trenutna situacija sa informatikom u srednjim školama? Koliko dobro školarci poznaju informatiku?
U redovnoj školi se za informatiku izdvaja jedan do dva sata sedmično. Istovremeno, nastavni plan i program uključuje dosta materijala koji učenici uče različite teme. U principu, možemo reći da djeca dobro poznaju informatiku. Na kurseve mi dolaze uglavnom studenti sa dobrim i odličnim ocjenama. Ali mogu analizirati nivo znanja o određenim temama informatike koje su neophodne za polaganje Jedinstvenog državnog ispita, a ovdje sve nije tako dobro. Prilično je teško pripremiti se za Jedinstveni državni ispit u školskim časovima. Informatika je izborni predmet, a da biste ovdje postigli visoku ocjenu potrebna su vam dodatna znanja i, shodno tome, dodatna nastava kako biste detaljnije proučavali određene teme. To može biti samostalno učenje, izborni predmet u školi, nastava sa mentorom ili kursevi - izbor je na učenicima i njihovim roditeljima.

Prošle godine, iz prvog dijela Jedinstvenog državnog ispita iz informatike, isključeni su svi testni zadaci koji su zahtijevali odabir tačnog odgovora. Sada učesnici ispita moraju sami da unesu odgovor. Koliko je ovo otežalo ispit?
Ovo je veoma dobra inovacija. Ispit je postao teži za slabe studente, jer im je izbor odgovora omogućio da metodom selekcije pronađu tačan. Za ostalu djecu ispit nije bio težak.

Po vašem iskustvu, koje oblasti informatike su najteže za školarce i izazivaju najviše poteškoća? Koje su teme najjednostavnije?
Nekoliko USE zadataka može se svrstati u jednu veliku temu. Stoga je bolje reći da postoje zadaci u kojima školarci prave najveći broj grešaka. Navešću njihove brojeve: to su zadaci br. 5, br. 9, br. 10, br. 11, br. 12, br. 16, br. 18 i broj 23. Prvih pet su osnovna pitanja o temama kao što su “Neujednačeno i uniformno kodiranje”, “Kodiranje teksta, zvuka, bitmap slika”, “Rekurzivni algoritmi” i “Adresiranje na Internetu”. Najčešći uzroci problema s ovim zadacima su računske greške ili mehaničko ovladavanje temom. Kada se pitanje promijeni, učenik je izgubljen, iako se rješenje problema ne mijenja.

Zadaci br. 16, br. 18 i br. 23 se jedva ili uopšte ne razmatraju u školskom kursu. Br. 16 i br. 18 su zadaci naprednog nivoa za djecu koja imaju za cilj visok rezultat. Zadatak br. 16 se odnosi na temu „Računski sistemi“, a greške su uglavnom računske. U zadatku br. 18 o transformaciji logičkih izraza maturanti najčešće prave greške u tehnici izvođenja. Ali zadatak broj 23 tehnički je najteži od cijelog prvog dijela Jedinstvenog državnog ispita.

Osim toga, informatiku ne bi trebalo da pohađaju djeca koja imaju problema sa matematikom. Ako imate poteškoća sa matematikom, biće teško u informatici. Ove dvije teme su vrlo blisko povezane.

Najjednostavnije teme uključuju sisteme binarnih brojeva, tablice logičke istine, baze podataka i sisteme datoteka, proračunske tablice, varijable, operatore dodjele i računske algoritme. Svi se oni ogledaju u zadacima od br. 1 do br. 6 koje ispunjavaju gotovo svi učenici, uključujući i one slabe.

Koji zadaci na Jedinstvenom državnom ispitu iz informatike vrijede najviše bodova? Koji je najbolji način da se pripremite za njih?
Što je veći broj zadatka, to je veći rezultat - ovako funkcionira Jedinstveni državni ispit. Najnoviji zadatak - br. 27 - je ocijenjen više od ostalih, odnosno 4 boda od početnih 35. Za zadatke br. 26 i br. 24 možete dobiti 3 boda, za zadatak br. 25 - 2 boda, br. 23 - 1 bod. Četiri zadatka iz 2. dijela (br. 24-27) iznose 34 boda od 100 testnih bodova, odnosno više od trećine maksimalnog rezultata ispita.

Da biste se dobro pripremili za ove zadatke, potrebno je svaki put raditi veliki broj vježbi i raditi na greškama. Ovdje je također važno potražiti pomoć od učitelja, jer je potrebno mnogo više vremena da sve ovo sami savladate.

Postoji li “formula za uspjeh” koja će vam pomoći da se na najbolji mogući način pripremite za Jedinstveni državni ispit iz informatike?
Prvo pravilo je rad: treba raditi, raditi i opet raditi. Druga tajna je rad na greškama, to se mora učiniti bez greške. I treće, kada dovršavate zadatak, pažljivo pročitajte pitanje od početka do kraja kako biste izbjegli nepažljive greške. Šteta je kada školarci odgovore na pogrešno pitanje koje se postavlja u problemu.
Koje izvore preporučujete da se sami pripremite za ispit?
1. “FIPI web stranica”;
2. “Lokalitet K. Poljakova”;
3. Zbirke testnih zadataka Jedinstvenog državnog ispita i vježbi obuke FIPI.

Koje su zamke u zadacima drugog dijela? Na šta treba obratiti pažnju kada se pripremate za zadatke povećane složenosti?
Zadatak br. 24 Ovdje morate biti u stanju izvršiti i razumjeti algoritam napisan u programskom jeziku. Ako razumete, to znači da ćete izvršiti zadatke navedene u izdanju, ako ih ne razumete, onda nećete. Ovaj zadatak postavlja dva ili tri pitanja, a prvo od njih sadrži tajnu razumijevanja algoritma i pronalaženja onih grešaka koje se predlažu da se pronađu, zapišu i isprave. Prvo odgovorite na prvo pitanje, to će vam pomoći da shvatite algoritam i pronađete greške.

Zadatak br. 25 Da bi se ovaj zadatak izvršio, potrebno je prije svega analizirati algoritme problema koji su predloženi u FIPI „Ujedinjeni kodifikator državnog ispita u računarstvu“. Zadatak zahtijeva da kreirate algoritam za rješavanje problema u programskom jeziku, posebno da možete raditi sa brojevima, da možete odabrati brojeve sa traženim uslovima iz skupa brojeva, da radite u bilo kojem brojevnom sistemu , i znati znakove djeljivosti. Ako su momci u školi učili "Algoritamiku", onda im je lakše izvršiti ovaj zadatak. Školarci koji dolaze na moje časove i nisu upoznati s ovom temom, prije svega, počinju dosljedno proučavati algoritme iz „Kodifikatora“.

Zadatak br. 26 U ovom zadatku važno je pronaći odgovor na predloženo pitanje, formulirati potpun odgovor i dokazati tačnost odabranog odgovora.

Zadatak br. 27 Zadatak je kreativan - i jedini gdje diplomac mora samostalno napisati program. Obično ga uspješno izvode školarci koji već nekoliko godina pišu programe i dobro poznaju matematiku. Zadatak vrijedi ili 2 boda ili 4. Na času sa momcima detaljno radim na nijansama ovog zadatka kako bi na ispitu dobili što više bodova.

Ostalo je još mjesec dana do Jedinstvenog državnog ispita iz računarstva. Kako biste savjetovali maturantima da rasporede svoje vrijeme?
U preostalom vremenu morate naporno trenirati kako biste učvrstili stečene vještine. Potrebno je riješiti što više problema i odvojeno raditi na onim zadacima koji izazivaju najveće poteškoće u izvršenju. Ako ste se sami pripremali za Jedinstveni državni ispit, vrlo je važno da se sada konsultujete sa nastavnikom, jer svaki zadatak ima svoj obrt koji morate znati.

“Galton je bio jako impresioniran Darwinovom teorijom evolucije, a posebno idejom da se pojedinci koji pripadaju istoj biološkoj vrsti razlikuju jedni od drugih. Individualne karakteristike koje promovišu preživljavanje podliježu „prirodnoj selekciji“ i prenose se na potomstvo. Galton je vjerovao da je inteligencija osobina koja varira među pojedincima, da je važna za preživljavanje i da se nasljeđuje na isti način kao i fizičke karakteristike poput boje očiju ili visine. Prikupio je činjenice koje potvrđuju nasljednost inteligencije i objavio dvije knjige o ovom pitanju: Nasljedni geniji (1869) i Engleski naučnici: Priroda i njegovanje (1874). Potonji rad je popularizirao pojmove “priroda” i “njegovanje” koji su danas široko poznati. U svom radu, Hupton je uočio statističku tendenciju da se genijalnost i sposobnost u određenim oblastima (na primjer, sklonost za hemiju ili pravo) mogu pratiti unazad kroz nekoliko generacija unutar porodice. Međutim, potcijenio je utjecaj okoline i zaključio da genijalnost nastaje kao rezultat prenošenja nasljednih informacija. Svoje gledište argumentirao je posebno činjenicom da inteligencija u populaciji ima normalnu distribuciju. Druge nasljedne osobine (kao što je visina) također imaju normalnu distribuciju, pa je Galton ovu statističku činjenicu uzeo kao pokazatelj utjecaja nasljeđa.

Tek 1888. naučnik je uspeo da pokaže visoku učestalost pojavljivanja takvih osobina kao što je genijalnost u porodicama: svoje ideje je formulisao u delu pod naslovom „Korelacija i njeno merenje“. Prvo, Galton je otkrio da se podaci mogu organizirati u redove i stupce na poseban način i došao do prototipa današnjeg "raspršenog dijagrama". Drugo, Galton je primijetio da kada je "korelacija" nepotpuna, obrazac je počeo da se pojavljuje. Roditelji iznad prosječne visine imali su visoku djecu, ali često nisu bila visoka kao majka i otac. Roditelji ispodprosječne visine imali su djecu koja su bila niska, ali ne toliko niska. To znači da je visina djece sklona zakržljanju, ili nazadovanje, prema aritmetičkoj sredini u populaciji.

Fenomen "regresije na srednju vrijednost", koji predstavlja prijetnju internoj valjanosti istraživanja, jedno je od Galtonovih najistaknutijih otkrića.

Galtonovo treće zapažanje je da graf aritmetičke sredine za svaki stupac tabele raspršivanja daje manje-više ravnu liniju. U suštini, to je vrsta „linije regresije“. Tako je Galton otkrio glavne karakteristike korelacione analize.

Nakon čitanja o Galtonovom radu, Karl Pearson je nastavio svoja istraživanja u ovoj oblasti i razvio formulu za izračunavanje koeficijenta korelacije. On je označio koeficijent "r", što znači "regresija", u čast Galtonovog otkrića regresije na srednju vrijednost. Prateći Galtona, Pearson je vjerovao da analiza korelacije potvrđuje ideju o nasljednosti mnogih svojstava koja se nalaze u pojedinačnim porodicama. (Citirao Goodwin D., Research in Psychology. Peter, 2004, str. 312-313).

Smatra se da su varijable korelirane ako postoji bilo kakav odnos između njih. To se podrazumijeva pod samim pojmom "korelacija" - međusobna povezanost, odnos. U slučaju direktne ili pozitivne korelacije, odnos je takav da su visoke vrijednosti jedne varijable povezane s visokim vrijednostima druge, a niske vrijednosti prve s niskim vrijednostima druge. Negativna korelacija znači inverzni odnos. Visoke vrijednosti jedne varijable povezane su s niskim vrijednostima druge, i obrnuto.

Odnos između vremena posvećenog učenju i ocjena primjer je pozitivne korelacije. Primjer negativne korelacije bio bi odnos između izgubljenog vremena i GPA. Potrošeno vrijeme može biti operativno definiran kao broj sati sedmično provedenih na određenim aktivnostima, kao što su igranje video igrica ili gledanje televizijskih serija.

Jačina korelacije pokazuje posebna vrijednost deskriptivne statistike – “koeficijent korelacije”. Koeficijent korelacije je -1,00 za direktnu negativnu korelaciju, 0,00 za bez korelacije i +1,00 za savršenu pozitivnu korelaciju. Najčešći koeficijent korelacije je Pearsonov r. Pearson r se izračunava za podatke dobivene korištenjem interval ili skala omjera. Za druge mjerne skale razmatraju se druge vrste korelacije. Na primjer, za redne podatke (odnosno uređene), izračunava se Spearmanov ρ(rho) (inače poznat kao r s).

Baš kao i aritmetička sredina i standardna devijacija, koeficijent korelacije je deskriptivna statistika. Konačna analiza određuje da li je određena korelacija značajno veća (ili manja) od nule. Dakle, za korelacijske studije, nulta hipoteza (H 0) kaže da je stvarna vrijednost r = 0 (tj. nema veze), a alternativna hipoteza (H 1) kaže da je r ≠ 0. Odbaciti nultu hipotezu je odlučiti da postoji značajan odnos između dvije varijable.

Scatter plot

Jačina korelacije može se otkriti gledanjem dijagrama raspršenja. To je grafički prikaz odnosa na koji korelacija ukazuje. U slučaju potpuno pozitivne ili potpuno negativne korelacije, tačke formiraju pravu liniju, a nulta korelacija proizvodi dijagram raspršenja tipa (a) čije su tačke raspoređene nasumično. U poređenju sa umerenom korelacijom (d i e), jake tačke se nalaze bliže jedna drugoj (b i c). Općenito, kako korelacija slabi, tačke na dijagramu raspršenosti se pomiču dalje od dijagonale koja povezuje točke u punoj korelaciji. ushićenje jednako +1,00 ili -1,00.

a) r = 0 b) r = -0,9 c) r = +0,9

d) r = - 0,56 d) r = +0,61

Raspršene dijagrame raspršene gore (osim za a) aproksimirane su pravim linijama, odnosno odražavale su linearne zavisnosti. Međutim, nisu svi odnosi linearni, a izračunavanje Pearsonovog r za nelinearni slučaj neće pomoći u otkrivanju prirode takvog odnosa. Sljedeća slika prikazuje hipotetički primjer odnosa između uzbuđenja i izvedbe zadatka, ilustrujući Yerkes-Dodsonov zakon: složeni zadaci se dobro izvode na umjerenim razinama uzbuđenja, ali loše na vrlo niskim i vrlo visokim nivoima. Dijagram raspršenja pokazuje da tačke padaju duž određene krive, ali ako pokušamo primijeniti linearnu korelaciju dobićemo r blizu nule.

Kada provodite korelacijsko istraživanje, važno je uzeti u obzir ljude čiji rezultati spadaju u širok raspon. Ograničavanje raspona jedne ili obje varijable smanjuje korelaciju. Pretpostavimo da proučavamo odnos između GPA i akademskog učinka na univerzitetu (procijenjeno prosječnim ocjenama koje su brucoši dobili na kraju godine). Na sl. a) pokazuje kako bi dijagram raspršenosti mogao izgledati u studiji od 25 učenika. Koeficijent korelacije je +0,87. Ali ako proučavate ovaj odnos ligatura na primjeru učenika koji su u školi dobili prosječnu ocjenu 4,5 i više, t o korelacija će se promijeniti, pada na +0,27.

a) r = 0,87 b) r = 0,27

Koeficijent determinacije – g 2

Važno je imati na umu da je to prilično lako pogrešno razumjeti značenje određene Pearsonove r vrijednosti ako je +0,70, onda je veza zaista relativno jaka nemojte misliti da je +0,70 nekako povezano sa 70%, iu ovom slučaju odnos se uspostavlja na 70%. Ovo nije istina. Za tumačenje vrijednosti korelacije treba koristiti koeficijent determinacije (r 2). Nalazi se kvadriranjem r, pa stoga njegova vrijednost nikada nije negativna. Ovaj koeficijent je formalno definisan kao stepen varijabilnosti jedne korelacione varijable uzrokovane varijabilnosti druge varijable. Objasnimo ovo konkretnim primjerom.

Sprovedena je studija u kojoj se mjeri nivo emocionalne depresije i prosječan rezultat na 100 učesnika. Testiramo odnos između dvije varijable i nalazimo negativnu korelaciju: što je viši nivo depresije, to je niži prosječan rezultat, i obrnuto, što je depresija niža, to je prosječni rezultat veći. Razmotrite dvije vrijednosti korelacije koje se mogu dobiti iz ove studije - -1,00 i -0,50. Koeficijent determinacije će biti jednak 1,00 i 0,25, respektivno. Da biste razumjeli značenje ovih vrijednosti, prvo uzmite u obzir da će se prosječan rezultat od 100 ispitanih osoba vjerovatno kretati od 3,0 do 5,0. Kao istraživači, želimo da saznamo razlog takve varijabilnosti– zašto jedna osoba dobije 3,2 boda, a druga 4,4, itd. Drugim riječima, želimo da znamo šta uzrokuje individualne razlike u GPA? Zapravo, ovo može biti zbog nekoliko faktora: navike učenja, opći nivo inteligencije, emocionalna stabilnost, sklonost odabiru lakih predmeta za učenje, itd. Kao što pokazuju rezultati testa depresije, naša hipotetička studija ispituje jedan od ovih faktora- emocionalnu stabilnost, G 2 pokazuje kolika se može pripisati varijabilnost srednjih rezultatadirektno sa depresijom. U prvom slučaju, gdje je r = -1,00 i r 2 = 1,00, možemo zaključiti da je 100% varijabilnosti u srednjim ocjenama posljedica varijabilnosti rezultata depresije. Stoga možemo reći da je 100% razlika između prosječnih ocjena (3,2 i 4,4 itd.) uzrokovano depresijom. U pravoj studiji takav rezultat se, naravno, ne može dobiti. U drugom slučaju, gdje je r = -0,5 i r 2 = 0,25, samo jedna četvrtina (25%) varijanse u srednjim ocjenama bi bila posljedica depresije. Preostalih 75% je zbog drugih faktora sličnih gore navedenim. Ukratko, koeficijent determinacije je bolja mjera snage veze od Pearsonovog r.

Regresiona analiza: Izrada pretpostavki

Najvažnija karakteristika studija korelacije je mogućnost ako postoji jaka korelacija stvaraju pretpostavke o budućem ponašanju. Korelacija između dvije varijable omogućava, na osnovu vrijednosti jedne od njih, predviđanje vrijednosti druge. To je lako pokazati na primjeru s prosječnim ocjenama. Ako znamo da su vrijeme posvećeno učenju i GPA u korelaciji, te da neko uči 45 sati sedmično, možemo precizno predvidjeti relativno visok GPA za tog studenta. Isto tako, visok GPA će predvidjeti vaše vrijeme provedeno u učenju. Izrada pretpostavki na osnovu studija korelacije se zove regresiona analiza.

Na sl. prikazuje dijagram raspršenosti za: a) vrijeme posvećeno učenju i GPA i b) izgubljeno vrijeme i GPA. Svaki grafikon također prikazuje regresijsku liniju, koja se koristi za stvaranje pretpostavki. Regresijska linija se također naziva “optimalna linija”: ona predstavlja najbolji mogući način da se sumiraju tačke dijagrama raspršenja. To znači da su apsolutne vrijednosti vertikalnih udaljenosti između svake tačke na grafikonu i linije regresije minimalne.

Regresijska linija se izračunava pomoću formule Y = a + b X, gdje je a tačka u kojoj prava linija seče Y osu (tj. segment odsečen na Y osi), a b– ovo je ugao nagiba prave linije, odnosno njena relativna strmina. X je poznata veličina, a Y je veličina koju pokušavamo da predvidimo Znajući 1) jačinu korelacije i 2) standardnu ​​devijaciju za korelirane varijable, možemo izračunati količinu. b, znajući 1) vrijednost b i 2) mogu se naći prosječne vrijednosti koreliranih varijabli A.

Regresiona analiza koristi jednadžbu regresije za predviđanje Y vrijednosti (kao što je GPA) na osnovu X vrijednosti (kao što je vrijeme posvećeno učenju). Y se ponekad naziva kriterijumski varijabla, a X - predikat-torn varijabla. Međutim, da bi se napravile tačne pretpostavke, korelacija mora biti znatno iznad nule. Što je korelacija veća, to će tačke dijagrama raspršenja biti bliže liniji regresije i više ćete biti sigurni da su vaše pretpostavke tačne. Dakle, ranije napomenuti problem ograničenja dometa, koji smanjuje korelaciju, također smanjuje valjanost predviđanja.

Grafikon jednadžbe regresije pokazuje kako napraviti predviđanja pomoću regresijske linije.

Na primjer, koju prosječnu ocjenu treba očekivati ​​od studenta koji provede 34 sata sedmično učeći. Da bismo dobili odgovor, povlačimo okomice sa osi X na liniju regresije, a zatim od tačke preseka do ose Y vrednost tačke na Y osi će biti procenjena vrednost (zapamtite da je tačnost pretpostavke). zavisi od jačine korelacije). Dakle, 40 sati učenja bi predvidjelo GPA od 3,4, a izgubljenih 41 sat bi predvidio GPA nešto iznad 2,3. Korišćenjem formule regresija može izračunati preciznije vrijednosti i napraviti preciznija predviđanja.

Trebali biste znati da se regresiona analiza koristi u većini studija o kojima saznajemo iz medija.

Na primjer, možemo naići na izvještaj studije o “faktorima rizika za srčani udar” koji, na osnovu značajne korelacije između pušenja i srčanih bolesti, zaključuje da je kod teških pušača veća vjerovatnoća da će razviti kardiovaskularne bolesti nego kod nepušača. To znači da je pušenje prediktor srčanih bolesti. Na osnovu druge studije koja ispituje „profil nasilnog supružnika“, može se zaključiti da se vjerovatnoća takvog ponašanja povećava ako je počinitelj nezaposlen. Ovo proizilazi iz korelacije između nezaposlenosti i sklonosti ka nasilnom ponašanju. Na osnovu prisustva korelacije pomoću regresione analize, znajući prvu, može se napraviti pretpostavka o drugoj.