Dom baze podataka Korištenje algoritama za predviđanje izbora: chat s nacrtanim linzerom

Korištenje algoritama za predviđanje izbora: chat s nacrtanim linzerom

Anonim

Drew će se predstaviti na Samitu o velikim podacima o inovacijama, 30. i 31. siječnja u Las Vegasu: http://analytics.theiegroup.com/bigdata-lasvegas, uz govornike iz Obame za Ameriku, Best Buy, LinkedIn, New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs i mnogi drugi.


Link za registraciju: http://bit.ly/Zs3wms


Ovaj je intervju vodio George Hill, a objavljen je u časopisu Big Data Innovation Magazine.


Kakva je reakcija bila na vaša predviđanja?


Većina reakcija bila je usredotočena na razliku u točnosti između onih koji smo proučavali ispitivanja javnog mišljenja i predviđanja popularnih stručnjaka i komentatora "osjećaja utrobe". Na dan izbora, analitičari podataka poput mene, Nate Silver (blog New York Timesa FiveThirtyEight), Simon Jackman (Sveučilište Stanford i Huffington Post) i Sam Wang (Princeton Izborni konzorcij) postavili su Obamine šanse za ponovni izbor na preko 90% i ispravno predvidjeli 332 izborna glasa za Obamu kao najvjerojatniji ishod. U međuvremenu, stručnjaci poput Karl Rovea, Georgea Willa i Stevea Forbesa rekli su da će Romney pobijediti - a u nekim slučajevima i lako. To je dovelo do razgovora o "pobjedi za kvante", za koju se nadam da će prenijeti na buduće izbore.


Kako ocjenjujete algoritam koji se koristi u vašim predviđanjima?


Moj model predviđanja procijenio je državne glasove i konačni izborni glas, svakog dana kampanje, počevši u lipnju. Htio sam da procjena ovih prognoza bude što pravednija i objektivnija - i da mi ne ostave prostora da maše ako nisu u pravu. Dakle, otprilike mjesec dana prije izbora objavio sam na svojoj internetskoj stranici skup od osam kriterija ocjenjivanja koje bih koristio nakon što se saznaju rezultati. Kako se ispostavilo, model je savršeno funkcionirao. Preko ljeta je predviđalo da će Obama osvojiti sve svoje države iz 2008. minus Indiana i Sjeverna Karolina, a jedva da je odstupio od tog predviđanja čak i nakon što je potpora Obami porasla naviše u rujnu, a zatim je nakon prve predsjedničke rasprave umro.


Količina podataka koju su tijekom ove kampanje koristili neovisni analitičari i timovi kampanja bila je ogromna, kakve to implikacije ima na upotrebu podataka u 2016. godini?


Kampanja 2012. dokazala je da se višestrukim, raznolikim izvorima kvantitativnih informacija može upravljati, vjerovati i uspješno primjenjivati ​​u različitim ciljevima. Stranci smo mogli unaprijed predvidjeti ishod izbora. Unutar kampanja postigli su se ogromni koraci u ciljanju birača, praćenju mišljenja, prikupljanju sredstava i odazivu birača. Sada kada znamo da ove metode mogu funkcionirati, mislim da nema povratka. Očekujem da će izvjestitelji i komentatori kampanje mnogo više ozbiljno shvatiti agregaciju anketa. I iako se čini da Obama i demokrati trenutno imaju prednost u tehnologiji kampanje, bio bih iznenađen ako republikanci ne bi brzo sustigli.


Mislite li da je uspjeh ove kampanje vođene podacima značio da rukovoditelji kampanja sada trebaju biti analitičar i strateg?


Voditelji kampanja možda neće trebati biti analitičari, ali oni bi trebali više cijeniti kako se podaci i tehnologija mogu iskoristiti u njihovu korist. Kampanje su uvijek koristile istraživanje ankete za formuliranje strategije i mjerenje osjećaja birača. Ali sada je na raspolaganju čitav niz drugih moćnih alata: web stranice za društveno umrežavanje, baze podataka o biračima, mobilni pametni telefoni i marketing putem e-pošte. I to je u prilog nedavnom napretku u metodologijama anketiranja i statističkom modeliranju mišljenja. Trenutno se u američkoj politici kampanje događa puno inovacija.


Uspjeli ste predvidjeti izborne rezultate 6 mjeseci unaprijed, što mislite, koji je realni maksimalni vremenski okvir za precizno predviđanje rezultata pomoću vaših analitičkih tehnika?


Otprilike je četiri ili pet mjeseci koliko nas znanost odmah dopušta; a to čak i malo gura. Prije toga, ankete nisu dovoljno informativne o eventualnom ishodu: previše je ljudi ili neodlučno ili nisu počeli obraćati pažnju na kampanju. Povijesni ekonomski i politički čimbenici za koje se pokazalo da su u korelaciji s izbornim ishodima, također počinju gubiti svoju prediktivnu moć nakon što prijeđemo granice oko otprilike 4-5 mjeseci. Srećom, to još uvijek daje dovoljno vremena za planiranje strategije i donošenje odluka o raspodjeli njihovih resursa.

Korištenje algoritama za predviđanje izbora: chat s nacrtanim linzerom