Osoblje Techopedia, 25. kolovoza 2016
Odlazak: Domaćin Rebecca Jozwiak razgovara o fenomenu ugrađenih analitičara i znanstvenika s podacima o građanima s dr. Robin Bloor, Dez Blanchfield i Davidom Sweenor-om.
Da biste pogledali videozapis, morate se registrirati za ovaj događaj. Registrirajte se da biste pogledali video.
Rebecca Jozwiak: Dame i gospodo, zdravo i dobrodošli u Hot Technologies. "Embed Everywhere: Omogućavanje znanstvenika o podacima o građanima" naša je tema danas. Popunjavam vašeg uobičajenog domaćina, ovo je Rebecca Jozwiak, a puni Eric Kavanagh. Da, ova godina je vruća. Osobito je izraz „znanstvenik podataka“ privukao veliku pažnju iako smo ih zvali dosadna imena poput „statističara“ ili „stručnjaka za analitiku“, prilično se bave istom vrstom aktivnosti, ali ima novo seksi ime i to je privlačeći puno pažnje. Vrlo je poželjno da na radnom mjestu imaju koristi od organizacije, i svi ga žele. Ali oni su: 1) skupi, 2) teško pronaći. Znate, stalno su vijesti o nedostatku vještina znanstvenika podataka, ali svejedno nude ogromnu vrijednost za organizaciju i ljudi nekako žude da smisle kako doći do te vrijednosti bez da bacaju ni trunku, tako da govoriti.
Ali dobra vijest je da vidimo kako izlaze alati i softver koji nadoknađuju taj nedostatak. Imamo automatizaciju, strojno učenje, ugrađenu analitiku, o čemu ćemo danas učiti, i to je nekako potaklo novi termin, "znanstvenik o građanima", i što to znači? Ne, to nije vaš obučeni istraživač podataka, to bi mogao biti vaš poslovni korisnik, vaš BI stručnjak, netko iz IT-a, netko tko nema pozadinu, ali možda ne nužno i stručnost. Ali, što se ovih alata i softvera čini, omogućuje li više ljudi pristup tim pametnim rješenjima iako oni možda ne znaju duboko kodiranje. Ali to samo pomaže poboljšati ukupne performanse kada svima pružite malo više pristupa toj analitičkoj misli. Ne morate nužno trenirati da biste imali vrstu znatiželje koja može dovesti do dobrih uvida u vašoj tvrtki.
Raspravljajući o tome da je danas s nama naš vlastiti Robin Bloor, glavni analitičar Bloor grupe, jedan od samih neuhvatljivih podataka, Dez Blanchfield, zvao nas je, a danas ćemo David Sweenor iz Dell Statistice održati prezentaciju. A s tim ću to prenijeti Robin Bloor.
Robin Boor: U redu, hvala na uvodu. Nekako sam o tome razmišljao u povijesnom kontekstu. Ono što mi ovdje gledamo je jedan od dizajna Leonarda da Vincija za neku vrstu jedrilice koju bi čovjek mogao staviti na leđa. Nemam pojma da li bi to zapravo uspjelo. Ne bih se htio upustiti u to, moram reći. Međutim, da Vinci, kad god pomislim na da Vincija, mislim na njega kao na jednog od najinteresantnijih i analitičnijih ljudi koji je ikada postojao. I sasvim je jasno ako samo pogledate taj gliser da je dizajniran na osnovu ptičjeg krila, a on je na ovaj ili onaj način proučavao letove ptica kako bi ga izgradio.
Ako zauzmemo povijesnu perspektivu - zapravo sam to pogledao - analitika je možda najstarija primjena matematike. Postoje popisi koji datiraju još od Babilonskih vremena. Znamo za to jer u osnovi postoje neke klinopisne tablete koje na sebi imaju takve podatke. Nije poznato je li bilo što išta ranije. Ali očigledno je da ste sebi naklonili civilizaciju s velikom populacijom ljudi, to zapravo zahtijeva planiranje i vrijedi znati što planirate i koji su zapravo zahtjevi tih ljudi.
I tamo je počelo i tamo je počelo računanje jer su rana računala, rana mehanička računala zapravo bila, mislim da je prvi bio popis stanovništva koji je stvorio Hollerith, a koji je postao IBM, vjerujem. Sve je to krenulo naprijed. Postojala je neka vrsta međimurja između možda 1970-ih i današnjice, gdje se mnoštvo drugih aplikacija i analitičara, moglo bi se reći, zauzelo sjedalo. Da, odvijala se analitika - događala se u velikim organizacijama, posebno bankama i osiguravajućim društvima, i zapravo General Electric-om i telcom i sličnim stvarima - ali to se uglavnom nije koristilo u cijelom poslu i sada se uglavnom počinje navikavati na sve strane poslovanje. I to je stvarno promijenilo igru. Prvo na što sam mislila upozoriti je piramida podataka, što mi se posebno sviđa. Ovo sam, mislim, nacrtao jedan od tih 20 godina - barem prije 20 godina - kako bih pokušao i razumio, zaista, u to vrijeme, pokušavao sam razumjeti BI i neke rane iskopavanja podataka o kojima se radilo. Ono što sam ovdje definirao je ideja podataka, a primjeri su signali, mjerenja, snimke, događaji, transakcije, proračuni, agregacije, pojedinačne točke informacija. Možete ih smatrati molekulama informacija, ali to su pojedinačne točke. To postaje informacija čim dobije kontekst. Povezani podaci, strukturirani podaci, baze podataka, vizualizacija podataka, crtači, crtači i ontologije - svi oni smatraju mojom glavom informacijom jer ovo što ste učinili objedinjuje mnogo raznolikosti zajedno i stvara nešto više od točke podataka, nešto što zapravo ima oblik, matematički oblik.
Iznad toga imamo znanje. Ispitivanjem informacija možemo naučiti da postoje različiti obrasci i možemo iskoristiti te obrasce formuliranjem pravila, politika, smjernica, postupaka i tada to poprima oblik znanja. I gotovo svi računalni programi, bez obzira na to što rade, su svojevrsno znanje, jer rade protiv podataka i na njih primjenjuju pravila. Imamo ta tri sloja i sve se više usavršava između slojeva. Na lijevoj strani ovog dijagrama prikazani su novi podaci koji su unijeti, tako da je mnogo toga statično. Podaci se gomilaju, informacije se skupljaju, a znanje potencijalno raste. Na vrhu, imamo "Razumijevanje", i rekao bih, iako je to filozofski argument, da razumijevanje postoji samo u ljudskim bićima. Ako grešim u vezi s tim, onda ćemo nas u nekom trenutku sve zamijeniti računalima. Ali umjesto da vodim raspravu, prijeći ću na sljedeći dijapozitiv.
Kad sam pogledao ovo, zanimljivo, ovo je nešto nedavno, zanimljivo je bilo pokušati i shvatiti što je zapravo analitika. I na kraju, crtajući različite dijagrame i završavajući s jednim koji je izgledao ovako, došao sam do zaključka, u stvari, razvoj analitike je zapravo samo razvoj softvera s groznom količinom matematičkih formula. Analitičko istraživanje malo se razlikuje od razvoja softvera u smislu da biste zapravo uzeli mnogo, mnogo različitih modela i istražili ih kako biste generirali nova saznanja o podacima. Ali nakon što ga generirate, on se implementira ili u ono što ja smatram pasivnom podrškom za odluke, a to su informacije koje su tek dodane korisniku; podrška za interaktivno odlučivanje, što je stvari poput OLAP-a, gdje se korisniku daje strukturirani skup podataka pomoću kojeg mogu istražiti i zaključiti stvari za sebe koristeći različite dostupne alate. Puno vizualizacije je takvo. I onda imamo automatizaciju ako možete samo pretvoriti analitički uvid koji ste sakupili u skup pravila koja se mogu implementirati, nije nužno da ljudsko biće uključuje. To je način na koji sam to gledala kad sam sve to radila. I razne stvari su mi se počele događati. Jednom ćemo područje aktivnosti, što ćemo reći, jednom kad se domena podataka stvarno minira, temeljito minira, temeljito se istraži u svakom mogućem smjeru, s vremenom će jednostavno postati kristalizirani BI. Izmišljeno znanje počinje postati znanje koje na različite načine obavještava različite korisnike i povećava njihovu sposobnost, za nadati se, da stvarno obavljaju posao koji rade.
Jedna od stvari koje sam primijetio i promatrao sam prediktivnu analitiku oko pet godina, ali prediktivna analitika postaje BI, u smislu da se tek pretvara u korisne informacije za hranjenje ljudi i kao što sam već istaknuo, postoji automatizirano BI izvješćivanje, BI istražno, BI, vrlo različite gradacije i prediktivna analitika zapravo idu u sva tri smjera. A analitički postupak, kao što sam naglasio, nije toliko različit u razvoju softvera, samo ga rade različiti ljudi s malo drugačijim vještinama. Pretpostavljam da bih trebao naglasiti da su vještinama potrebnim za stjecanje zaista dobrog znanstvenika podataka potrebne godine za stjecanje. Nije ih lako steći i velik broj ljudi to ne može učiniti, ali to je zato što uključuje razumijevanje matematike na vrlo sofisticiranoj razini da bi se znalo što vrijedi, a što nije. Analitički razvoj, otkriće novih znanja, implantacija analitike, radi o tome da znanje postane operativno. To je ona vrsta pozadine koju vidim čitavoj analitičari. To je ogromno područje i na njemu postoje mnoge, mnoge dimenzije, ali mislim da se generalizacija odnosi na sve.
Onda je tu poremećaj poslovanja, kao što sam već spomenuo da postoji niz organizacija, farmaceutske kompanije su još jedna, koja u svom DNK imaju analitiku. Ali postoje mnoge organizacije koje to zaista nemaju u svojoj DNK, a sada imaju mogućnost, sada su softver i hardver daleko jeftiniji nego što su nekad bili, a sada ga imaju mogućnost iskoristiti. Rekao bih niz stvari. Prvo je analitika, au mnogim slučajevima to je istraživanje i razvoj. Možda samo primjenjujete analitiku na određeno područje organizacije i može se činiti uzaludnim da na jedan ili drugi način opet analizirate narudžbe kupaca iz različitih perspektiva, spajajući ih s drugim podacima. Ali analitika zapravo stvara mogućnost da se promatra organizacija kao cjelina i da se prilično analizira bilo koja određena aktivnost koja se događa unutar organizacije i čitavog lanca aktivnosti. Ali kad se jednom preselite u to područje, rekao bih da je to istraživanje i razvoj. I postavlja se pitanje koje sam postavila nekoliko puta, a to je: „Koliko kompanija treba potrošiti na analitiku?“ I mislim da je najbolji način da razmišljate o pružanju odgovora na to da analitiku smatram istraživanjem i razvojem. i pitajte, "Pa koliko biste potrošili na istraživanje i razvoj u području učinkovitosti poslovanja?"
A tvrtke koje nisu s analitikom, postoji puno stvari koje oni ne znaju. Prije svega, oni ne znaju kako to učiniti. Obično ako oni zapravo na ovaj ili onaj način usvajaju analitiku unutar organizacije - oni zapravo nemaju druge mogućnosti nego otići na savjetovanje koje im može pomoći u tome, jer za većinu bi to bilo nemoguće ili stvarno vrlo teško. tvrtke zapravo zapošljavaju znanstvenika s podacima, pronalazeći ga, plaćajući ga i vjerujući im da rade ono što vi želite. Vrlo teško. Većina tvrtki ne zna kako zaposliti ili obrazovati osoblje da to zaista i radi, a razlog za to je jednostavno taj što ga još nema u DNK, pa to nije dio njihovih prirodnih poslovnih procesa. To vodi u sljedeću točku. Ne znaju kako to učiniti poslovnim procesom. Najbolji način za to je, usput rečeno, kopirati ono što farmaceutske tvrtke i osiguravajuće kuće, samo pogledati, a neke tvrtke u zdravstvenom domu, samo pogledati način na koji koriste analitiku i kopirati ga. Jer je to poslovni proces. Ne znam kako to policija ili izvršiti reviziju. To je stvarno, posebno sada kada je jako puno softverskih tvrtki stvorilo proizvode koji automatiziraju strašno puno analitike. Poanta o reviziji je važna kada imate konzultantsku uslugu ili nekoga na licu mjesta kome se može vjerovati da će razumjeti rezultate bilo kojeg analitičkog izračuna, to je vrsta izbora koju morate donijeti, ali ako u to ugradite stvarno moćne analitičke alate ruke ljudi koji ne razumiju pravilno analitiku, vjerojatno će skočiti na zaključke koji možda nisu točni. I kao što rekoh, tvrtke ne znaju kako ga proračunati.
To su okusi analitike, samo ću ih proći. Statistička analitika i statističko modeliranje bitno se razlikuje od prediktivne analitike, od kojih većina usput odgovara krivulji. Strojno učenje razlikuje se od onih stvari, analitika staza i vremenske serije, koje se u osnovi obavljaju u statusnim tokovima, opet su različite. Grafička analitika opet je drugačija, a tekstualna i semantička analitika opet različiti. Ovo samo ukazuje da je to stvar u više žanrova. Nije, ne počnete raditi analitiku, započinjete sa istraživanjem svojih problema i tražite razne alate i razne arome analitike koji će im odgovarati. I na kraju, neto mreža. Zbog evolucije hardvera i softvera, prema mom mišljenju analitika je u povojima. Još je puno, puno toga još, a vidjet ćemo kako se odvija u narednim godinama. Mislim da sada mogu proslijediti loptu Dezu.
Dez Blanchfield: Da, razgovaraj o teškom činu koji treba slijediti, Robin. Ovu ću temu ukratko posjetiti iz jednog od mojih najdražih uglova, a to je ugao čovjeka. Toliko se promjena događa u našem svakodnevnom životu. Jedan od najvećih poremećaja u našem svakodnevnom životu, prema mom mišljenju, upravo je svakodnevni posao. Izlazite na posao i pokušavate obaviti posao za koji ste angažirani i sve veća očekivanja da ćete prijeći od svakodnevne osobe do superheroja i količine informacija koja se vrti oko organizacija i emitira vrlo, vrlo brzo, to je značajan izazov i sve više i više moramo pružiti bolje i bolje alate ljudima kako bi se pokušali nositi s protokom znanja i informacija, pa sam pomislio da bih pokušao doći s tim iz malo zabavnog ugla, Ali, uvijek mi se dojmi kako imamo ove visoke umove ili flash mobove i tako dalje, koji nas nekako vode ka onome o čemu pričamo kao o analitičari, ali stvarno ono o čemu govorimo je da informacije učinimo dostupnima ljudima, i dopuštajući im da međusobno komuniciraju i rade na takav način da je to prirodno i da se osjeća normalno.
Ustvari, podsjeća me na YouTube videozapis o maloj djeci, maloj bebi, koja sjedi na podu i sjedi tamo i igra se s iPadom i vrti se okolo, štipanje i stiskanje i premještanje slika i igranje sa ekranom, tamošnji podaci. A onda roditelj oduzima iPad i stavlja djetetu časopis, tiskani časopis u djetetovo krilo. A to dijete vjerojatno nema više od dvije godine. Dijete počinje pokušavati prelaziti sa zaslona časopisa, štipka ga i stiska, a magazin ne reagira. Dijete diže prst prema gore i gleda ga i misli: "Hmm, mislim da moj prst ne funkcionira", a ono se zabija u ruku i misli: "Ah ne, prst mi djeluje. Osjećam ruku i to izgleda dobro ", i zamahuje prstom, a prst se pomiče i reagira. Da. Zatim ponovo pokušava komunicirati s časopisom, a tiho i gledaj da se ne štipka i ne stiska i pomiče. Zatim oduzimaju časopis i stavljaju iPad natrag u krilo, i odjednom stvar funkcionira. Dakle, evo bebe koja je došla i obučena za korištenje analitičkog alata ili alata za strujanje uživo za zabavu i ne može doznati kako časopis treba raditi i kako okretati stranice.
A to je sam po sebi zanimljiv koncept. Ali kad razmišljam o znanju koje se kreće po organizacijama i načinu na koji protok podataka te načinu ponašanja ljudi, često razmišljam o ovom konceptu onoga što su ljudi naučili biti flash mob, što je događaj gdje i koji društveni mediji čine to je još lakše učiniti, ideju kao takvu koja je otići na ovo mjesto u ovo vrijeme i datum i radnju, ili video i naučiti te plesove, ili nositi ovaj obojeni šešir i usmjeriti sjever u jedan sat. A ti gurneš to kroz svoju mrežu, i nepromjenljivo čitav gomila ljudi, stotine njih, pojavljuju se na istom mjestu u isto vrijeme rade isto i tu je ovaj wow faktor, poput, "Sveta krava, to je bilo stvarno impresivno! "Ali zapravo je stvarno jednostavna ideja i jednostavan koncept koji se tek gura putem naših mreža i postižemo ovaj ishod koji je vizualno zapanjujuća i zvučno impresivna stvar. A kad razmišljate o organizaciji, načinu na koji želimo da se ljudi ponašaju i načinu na koji želimo da se bave informacijskim sustavima i kupcima, često je to jednostavno, ideja ili koncept ili kulturološka ili ponašajna osobina koju pokušavamo prenijeti kroz i osnaživanje pomoću alata i informacija.
I podupirući sve to mantru koju imam više od dva i pol desetljeća i to je, ako vaše osoblje ne može pronaći ono što im treba za posao, bili to alati ili informacije, uvijek će izumiti kotač. Dakle, ovo je sve veći izazov, gdje imamo puno znanja, puno informacija i stvari koje se kreću vrlo brzo, da želimo spriječiti ljude da izmisle kotač. I kad smo razmišljali o našem radnom okruženju, vraćajući se u kut ljudi, što je jedan od mojih najdražih, bio sam zadivljen kad smo se iznenadili da kabineti nisu pogodno okruženje za dobre rezultate, ili smo postavili stvari ovako grozne slike ovdje, i to se nije puno promijenilo, samo je spustio zidove i nazvao ih otvorenim radnim prostorima. Ali u sredini sa žutom petljom oko njih dvoje ljudi razmjenjuju znanje. Pa ipak, ako pogledate ostatak sobe, svi oni tamo sjede i poslušno tuku tamo, stavljajući informacije u ekran. I češće od toga, ne stvarno razmjenjujući znanje i podatke, a za to postoji niz razloga. Ali interakcija na sredini poda s lijeve strane u žutom krugu, dvoje ljudi tamo razgovara, razmjenjuje znanje i vjerojatno pokušava nešto pronaći, pokušavajući reći: "Znate li gdje je ovo izvješće, gdje ja mogu pronaći ove podatke, kojim se alatom služim? "A vjerojatno to nije uspjelo pa nemaju ništa i lutali su po podu, prekršili pravilo uredskog prostora u kabini i učinili to osobno.
I imali smo slična okruženja širom ureda u koja smo se šalili, ali stvarnost je da su prilično moćni i učinkoviti. A jedan od mojih favorita je mobilna ili fiksna analitička platforma koja se naziva hladnjak za vodu, gdje ljudi tamo ustaju i čavrljaju i razmjenjuju znanje te uspoređuju ideje i obavljaju analitiku dok stoje uz hladnjak vode i izmjenjuju ideje. Oni su vrlo moćni koncepti kada razmišljate o njima. Ako ih možete prevesti u svoje sustave i alate, dobit ćete nevjerojatan ishod. I imamo stalno omiljeno, a to je u stvari najmoćnije uredsko središte za distribuciju podataka, inače poznato kao recepcija. A ako ne možete pronaći nešto, kamo idete? Pa hodaš do prednjeg ureda i odlaziš na recepciju i kažeš: "Znate li gdje je x, y, z?" I usuđujem se da mi itko kaže da to nisu učinili bar jednom u novom posao ili u jednom trenutku kad nešto jednostavno ne mogu pronaći. I morate se zapitati, zašto su to slučajevi? Trebao bi biti negdje na intranetu ili nekom alatu ili bilo čemu. Trebalo bi ga lako pronaći.
Pa, kad je riječ o podacima i analitičkim podacima i alatima koje smo pružili našem osoblju da rade svoj posao i načinu na koji ljudi komuniciraju s poslovima, shvatio sam da prije nedavnog pojavljivanja analitičkih alata i velikih platformi za podatke ili "obrada podataka" kako to nazivaju u staroj školi, izvještavanje i razmjena znanja daleko je od dinamične ili kolaborativne ili otvorene, a kad razmišljate o vrsti sustava za koji očekujemo da ljudi obavljaju svoj posao, imali smo klasično, ljudi ga sada nazivaju nasljeđem, ali stvarnost je da je to jedino nasljeđe i ono je i danas ovdje, i stoga to zapravo i nije ostavština. Ali tradicionalni HR sustavi i ERP sustavi - upravljanje ljudskim resursima, planiranje resursa poduzeća, upravljanje podacima poduzeća i sustavi koji koristimo za upravljanje informacijama za vođenje tvrtke. Neizbježno je izoliran. I od vrha, jednostavne platforme poput intranetskih odjela, pokušavaju komunicirati gdje su stvari i kako ih dobiti i kako komunicirati sa znanjem o mjestu. To pojavljujemo na našoj intraneti. Dobra je kao i ljudi koji ulažu vrijeme i trud da to stave gore, jer u protivnom to ostaje samo u vašoj glavi. Ili imate podatke koji sjede skroz na dnu lanca prehrane, u korporativnim SAN-ima i svemu tome, tako da su mreže skladišnih prostora pune datoteka i podataka, ali tko zna gdje ih pronaći.
Češće nego ne, gradili smo ove zatvorene podatkovne platforme ili zatvorene sustave i ljudi su se preokrenuli radi proračunskih tablica i PowerPointa kako bi proslijedili informacije okolo. No, u mojoj se glavi nedavno dogodila zanimljiva stvar, a to je da mobilni uređaji i internet općenito djeluju na način da bi stvari zapravo mogle biti bolje. I to pretežno u potrošačkom prostoru. A zanimljivo je da smo u svakodnevnom životu počeli imati stvari poput internetskog bankarstva. Nismo morali fizički ići u banku da bismo komunicirali s njima, mogli smo to obaviti telefonom. U početku je to bilo nezgodno, ali onda je internet obišao i imali smo web stranicu. Znate, i koliko ste puta zapravo bili u svojoj banci u posljednje vrijeme? Zapravo ne mogu, razgovarao sam o tome neki dan i zapravo se ne mogu sjetiti posljednji put kad sam otišao u svoju banku, što sam bio prilično šokiran, mislio sam da se toga moram prisjetiti, ali bilo je tako dugo Prije se zapravo ne mogu sjetiti kad sam otišao tamo. I tako sada imamo ove uređaje u ruci u obliku mobitela i telefona, tableta i prijenosnih računala, imamo mreže i pristup alatima i sustavima, te potrošački prostor koji smo naučili da stvari mogu biti bolje, ali zato nagle promjene potrošačkog prostora koje su bile letargičnije i ledenije promjene unutar poduzeća i okruženja, tu promjenu nismo uvijek uzimali u svakodnevni radni život.
I volim zabavljati se činjenicom da ne možete uživo prenositi podatke na papir. Na ovoj slici ovdje sjedi osoba koja gleda neke analitike koje su izvedene, a tu je i prekrasan graf koji je napravio netko kome je vjerojatno plaćeno puno novca kao statističar ili aktuar, a sjedi tamo i pokušava napraviti analitika na papiru i tiskanje na njoj. Ali evo zastrašujuće stvari: Na primjer, ti ljudi u ovoj sobi za sastanke, a ja ću to koristiti kao primjer, komuniciraju s podacima koji su sada povijesni. I stara je godina od kada je ta stvar proizvedena i potom ispisana, pa je možda izvještaj star tjedan dana. Sada donose odluke o ne toliko lošim podacima, već o starim podacima, koji uvijek mogu biti loši podaci. Danas donose odluku na temelju nečeg povijesnog, što je zaista loše mjesto. Uspjeli smo zamijeniti tu papirnu kopiju sa sličnim tabletima i telefonima jer smo vrlo brzo radili u potrošačkom prostoru, a sada smo to riješili u prostoru poduzeća, da je u stvarnom vremenu uvid u stvarnu vrijednost vremena.
I u tome smo sve bolji i bolji. I to me dovodi do stajališta koje je Robin ranije podigao, to je bio koncept znanstvenika o građanima i pokretač ovog koncepta. Za mene, istraživač podataka o građanima samo su obični ljudi s pravim alatima i informacijama o tome što voli iPad. Ne moraju se baviti matematikom, ne moraju znati algoritme, ne moraju primijeniti algoritme i vladati podacima, samo trebaju znati kako koristiti sučelje. I to me vraća mom uvodu i konceptu mališana koji tamo sjedi s iPadom naspram časopisa, nasuprot iPadu. Mali dijete može vrlo brzo, intuitivno naučiti kako koristiti sučelje iPada kako bi uronio u informacije i komunicirao s njim, iako je to možda igra ili streaming medija ili videozapisa. Ali nije mogao dobiti isti odgovor ili interakciju s trake časopisa i samo treperi stranicu za stranicom, što nije baš privlačno, pogotovo ako ste dijete koje je odraslo s iPadima. Neizmjerno, ljudska bića mogu vrlo brzo potražiti i naučiti kako voziti alate i stvari koje ćemo im pružiti i ako im pružamo sučelje poput mobilnih uređaja, posebice tableta i pametnih telefona s dovoljno velikim ekranima, a posebno ako možete komunicirati s njima u dodiru, s pokretima prsta, odjednom vam se čini ovaj pojam znanstvenika o podacima o građanima.
Netko tko može primijeniti znanost o podacima s pravim alatima, ali bez da to zapravo mora znati. I u mom umu mnogo je toga, kao što rekoh, potaknuto utjecajem potrošača, koje se premjestilo i pretvorilo u potražnju i poduzetništvo. Nekoliko stvarno brzih primjera. Mi, mnogi od nas počeli bismo raditi s našim blogovima i web stranicama, poput stavljanja malih oglasa ili gledanja u praćenje i kretanje, koristili smo alate poput Google Analitike i probudili smo činjenicu da u našim blogovima i malim web stranicama, tamo bismo mogli staviti male bitove koda i Google bi nam u stvarnom vremenu dao uvid u to tko posjećuje web mjesto, kada i gdje i kako. A u stvarnom vremenu zapravo smo mogli vidjeti ljude kako napadaju web stranicu, prolaze kroz stranice i zatim nestaju. I to je bilo prilično zapanjujuće. Još uvijek volim to raditi, kad ljudima pokušavam objasniti analitiku u stvarnom vremenu, jednostavno im pokazujem web mjesto s uključenim Google Analyticsom i zapravo vidim interakciju uživo s ljudima koji napadaju web mjesta i pitaju ih: "Zamislite ako imali ste takve vrste uvida u svoj posao u stvarnom vremenu. "
Uzmite primjer maloprodaje, a možda i farmaceutske, mislim da je u Americi nazivate prodavaonicom droga, ljekarnom u koju ulazite i kupujete sve, od tableta protiv glavobolje, preko krema za sunčanje i šešira. Pokušaj vođenja te organizacije bez informacija u stvarnom vremenu zastrašujući je koncept, sada znamo što znamo. Na primjer, možete mjeriti promet nogu, možete staviti uređaje oko trgovine s nasmiješenim licem s jedne strane zaslona jer ste sretni, a nesretno crveno s desne i neke različite nijanse u sredini. Danas postoji platforma nazvana "Sretno ili ne" na kojoj ulazite u dućan i možete sretnuti sretno ili tužno lice, ovisno o povratnim informacijama o vašem kupcu. A to može biti interaktivno u stvarnom vremenu. Možete dobiti cijene usmjerene na potražnju uživo. Ako je tamo puno ljudi, možete malo povisiti cijene, a možete napraviti i raspoloživost dionica i recite ljudima, na primjer - aviokompanije će na primjer ljudima reći koliko je mjesta sada dostupno na web mjestu kada Rezervirate let, ne smijete samo nasumično birati i nadam se da možete doći i dobiti let. Podaci HR-a uživo, možete reći kada se ljudi uključuju i završavaju. Nabava, ako ste u postupku nabave i imate podatke uživo, mogli biste raditi stvari poput čekanja sat vremena i zaštititi od cijene američkog dolara kako biste kupili sljedeći teret zaliha i pojavili se tovarni stvari.
Kad ljudima pokažem Google Analytics i prebacim takvu anegdotu, ovaj eureka trenutak, taj trenutak "a-ha!", U njihovom umu im se pali ova žarulja poput: "Hmm, vidim puno mjesta na kojima bih to mogao učiniti, Kad bih samo imao alate i kad bih samo imao pristup tom znanju. "A to sada vidimo i na društvenim medijima. Svatko tko je pametni korisnik društvenih medija osim što prikazuje samo fotografije doručka, ima tendenciju da pogleda koliko voli i koliko prometa dobiva i koliko prijatelja dobiva, a to rade i sa voli, recimo, Twitter kao analitičko sredstvo. Možete otići na Twitter.com da koristite alat, ali upišete u Google Twitter Analytics dot com, ili kliknete gornji desni gumb i spustite izbornik i učinite to, dobićete ove lijepe, žive grafikone koji vam govore koliko tweeta koje radite sami i koliko interakcija s njima. I analitika u stvarnom vremenu samo na vašim osobnim društvenim medijima. Zamislite kada bismo imali slične Google Analytics i Facebook te LinkedIn i Twitter, statistika eBaya dolazi vam, ali u vašem radnom okruženju.
Sad su nam pod vrhom uživo vrsta interneta i mobilnih, a to postaje koncept moći. I to me upućuje na moj zaključak, a to je da sam uvijek našao da organizacije koje rano koriste alate i tehnologiju stječu tako značajnu prednost u odnosu na svoje konkurente da ih konkurenti zapravo nikad ne mogu sustići. A to sada vidimo i kod sukoba podataka s građanima. Ako možemo uzeti ljude s vještinama, znanjem za koje smo ih unajmili i možemo im pružiti prave alate, posebno mogućnost da vide podatke u stvarnom vremenu i otkriju podatke i znaju gdje je to bez da hodamo po kabinama i postavljajte pitanja naglas, kad morate ići i stajati do hladnjaka za vodu da biste napravili neku komparativnu analizu s ljudima ili otišli i pitali na recepciji gdje je indeks. Ako to mogu učiniti na dohvat ruke i mogu to odnijeti na svoje sastanke sa sobom i sjediti u sobi za sastanke gledajući kroz ekrane u stvarnom vremenu, a ne u papirnatom obliku, odjednom smo osnažili naše osoblje koje ne treba biti stvarno znanstvenici podataka, ali da zapravo koriste znanost o podacima i postižu nevjerojatne rezultate za organizacije. I mislim da je ta tipna točka koju smo zapravo prenijeli sada u koju je potrošač doveden u poduzeće, izazov je kako to poduzeće pružiti i to je tema koju pretpostavljam u današnjoj raspravi. I s tim ću završiti svoj komad i predati da čujem kako to možemo riješiti. David, na tebe.
David Sweenor: U redu, hvala vam puno ljudi, i hvala Robin. Znate, Robin, slažem se s tvojom izvornom procjenom. Analitički postupak, zapravo se ne razlikuje od razvoja softvera. Mislim da je izazov u organizaciji zapravo stvarno velik, znate, možda stvari nisu tako dobro definirane, možda postoji istraživačka komponenta i kreativna komponenta. I Dez, znaš, slažem se s tobom, dosta je iznova kotača, i znaš, ne postoji organizacija u koju danas ulazim, pitaš, pa, zašto to radiš na ovaj način? Zašto taj posao posluje? Pitanje je lako, a često je to teško promijeniti. Volim analogiju, konzumaciju stvari. I tako više ne kad odem u aerodrom i želim promijeniti svoje mjesto - to radim na svom mobitelu. Ne moram ići do agenta na štandu i tijekom 15 minuta gledam kako agent unosi nešto na jednobojni monitor kako bih promijenio svoj položaj sjedala. Jednostavno radije to radim na svom telefonu i tako je zanimljiv razvoj događaja.
Danas ćemo malo razgovarati o kolektivnoj inteligenciji. Za one koji nisu svjesni, Statistica je vodeća analitička platforma koja postoji već više od 30 godina. Ako pogledate bilo koju od tamo objavljenih publikacija u analitičkoj industriji, to se uvijek pojavljuje na vrhu kao jedno od najintimitivnijih i najlakših za upotrebu naprednog softverskog paketa za analitiku. Tako smo proteklih nekoliko godina proveli radeći na konceptu zvanom kolektivna inteligencija, i prelazimo ga na novu razinu. Htio sam započeti ovaj razgovor s: kako se posao obavlja u vašoj organizaciji?
I tu su dvije slike. Ona na lijevoj strani je slika iz 1960-ih, a karijeru nisam započeo u 1960-ima, ali slika s desne strane je - to je tvornica poluvodiča u kojoj sam počeo raditi. I radio sam u crnoj zgradi, s crnim krovom u gornjem lijevom kutu. Ali napravili su poluvodičke stvari. Ovo je nedavna slika sa Google Images. Ali kad se vratite na sliku 1960. s lijeve strane, vrlo je zanimljiva. Ti ljudi sjede u redu i izrađuju integrirane sklopove i poluvodiče. Ali postoji standardizacija, postoji standardni način da se stvari rade, a postojao je i dobro definiran proces. Znate, možda budući da svi ti ljudi sjede u otvorenom okruženju, možda je postojala neka suradnja. Mislim da smo malo toga izgubili unutar radne snage znanja.
Kad sam sjeo u gornju lijevu zgradu, ako sam htio surađivati s nekim, nije otvoren. Bili su ti uredi, možda je neki tim bio udaljen ili sam možda morao proputovati ovaj kampus; bilo je 25 minuta hoda i morao bih popričati s nekim u zgradi s desne strane. Mislim da smo nešto izgubili na putu. I tako, znate, i ja sam isto pomislio, zašto ljudi - koliko ljudi stalno izumljuje volan unutar vaše organizacije? Mislim da znate kako su organizacije u cjelini dobro obavile posao 1990-ih i 2000-ih sa CRM-om i pohranom podataka, a donekle i s BI-om. Iz nekog razloga analitika je malo zaostala. Bila su značajna ulaganja u skladištenje podataka, standardizaciju i normalizaciju vaših podataka, i sve to, i CRM, ali analitika je iz nekog razloga zaostajala. I pitam se zašto. Možda postoji kreativa - možda vaš postupak nije dobro definiran, možda ne znate koju odluku ili polugu pokušavate okrenuti u svom poslu da promijenite stvari. Kad danas krenemo u organizacije, puno je ljudi koji rade vrlo ručno u proračunskim tablicama.
I znate, jutros sam pogledao stat, mislim da je pisalo da 80, 90 posto proračunskih tablica ima pogreške, a neke od njih mogu biti vrlo značajne. Poput one u Whaleu, gdje je JPMorgan Chase zbog pogrešaka u proračunskoj tablici izgubio milijarde i milijarde dolara. Dakle, mislim da pretpostavljam da mora postojati bolji način da se stvari dovrše. I kao što smo spomenuli, imamo te znanstvenike. Ti su ljudi skupi i teško ih je pronaći. A ponekad su i neka čudna patka. Ali mislim, znate, ako bih morao sumirati što je znanstvenik podataka, vjerojatno netko razumije podatke. Mislim da je netko tko razumije matematiku, netko tko razumije problem. I doista, netko tko može priopćiti ishode. A ako ste znanstvenik podataka, ovih dana imate veliku sreću, jer vam se plaća vjerojatno udvostručila u posljednjih nekoliko godina.
Ali istina je rečeno, puno organizacija nema te znanstvenike s podacima, ali vaša organizacija ima pametnih ljudi. Imate organizaciju, imate puno pametnih ljudi i oni koriste proračunske tablice. Znate, statistika i matematika im nije osnovni posao, ali oni koriste podatke za pokretanje poslovanja. Stvarno, izazov s kojim se susrećemo je kako da se ponašate, ako imate sreće da imate znanstvenika ili statističara ili dva, kako ih možete uzeti i kako možete poboljšati suradnju tih ljudi i ostale osobe unutar vaše organizacije? Ako pogledamo vrstu strukture naše organizacije, počet ću i idem s desna na lijevo. I znam da je ovo unatrag, ali tu liniju poslovnih korisnika imamo.
Ovo je najveći dio populacije zaposlenog na znanju, a za ove je ljude potrebno uložiti analitiku u svoju poslovnu aplikaciju. Možda oni vide analitički izlaz na zaslonu pozivnog centra ili tako nešto, pa im poručuje da sljedeću najbolju ponudu daju kupcu. Možda je to potrošač ili dobavljač na web portalu, i to im odmah daje zasluge, ili takvim stvarima. Ali ideja je da troše analitiku. Ako idemo na sredinu, to su ti radnici na znanju. To su ljudi koji danas rade s proračunskim tablicama, ali proračunske tablice su podložne pogreškama i u nekom trenutku im je ponestalo goriva. Ti znanstvenici s podacima o građanima, kako ih mi nazivamo, znate, ono što mi pokušavamo učiniti za njih je stvarno povećanje razine automatizacije.
A s analitikom čujete da je 80 do 90 posto rada u preporukama podataka, i to nije stvarna matematika, ali to je prepariranje podataka. Pokušavamo to automatizirati, bilo da to učinite, a mi imamo čarobnjake i predloške i stvari koje se mogu ponovo upotrijebiti, a vi zapravo ne morate imati znanje o temeljnoj infrastrukturi u vašem okruženju. A onda ako pogledamo krajnje lijevo, imamo te znanstvenike. I kao što sam spomenuo, oni su u manjku. A ono što pokušavamo učiniti da učinimo produktivnijima jest omogućiti im da stvore stvari koje ti znanstvenici s podacima o građanima mogu učiniti. Smatrajte to blokom Lego, tako da ti znanstvenici podataka mogu stvoriti imovinu za višekratnu upotrebu koju građanin znanstvenik može koristiti. Izgradite ga jednom tako da ne moramo stalno izmišljati kotač.
A onda bi se mogli zabrinuti i ovi momci možemo li raditi baze podataka i utjecati na ulaganja u postojeću tehnologiju koja je napravila vaša tvrtka. Znate, u ovom danu i dobu nema smisla miješati podatke po cijelom svijetu. Dakle, ako pogledamo Statisticu, kao što sam već spomenuo, to je platforma koja postoji već dugo vremena. A riječ je o vrlo inovativnom proizvodu. Miješanje podataka, nije bilo izvora podataka kojem ne možemo pristupiti. Imamo sve stvari za otkrivanje i vizualizaciju podataka koje biste očekivali; možemo to učiniti u stvarnom vremenu. I vjerojatno ima - mislim da unutar softvera postoji preko 16.000 analitičkih funkcija, tako da je to više matematike nego što sam je ikad mogao upotrijebiti ili razumjeti, ali tu je i ako vam treba.
Imamo mogućnost kombiniranja poslovnih pravila i analitičkih tijekova rada kako bismo zaista donijeli poslovnu odluku. Prekoračite tek, evo algoritma, ovdje je tijek rada, ali imate pravila poslovanja s kojima se uvijek morate suočiti. Vrlo smo sigurni u upravljanju. Koristi se u velikom broju farmaceutskih klijenata, jer nam FDA vjeruje. Znate, samo dokaz pudinga da imamo mogućnosti kontrole i revizije da ih prihvatimo. I na kraju, znate, mi smo otvoreni, fleksibilni i proširivi, pa morate stvoriti platformu koja je to, želite da vaši istraživači podataka budu produktivni, želite da vaši građani proučavaju podatke da budu produktivni, želite biti u mogućnosti razmjestiti te analitičke rezultate radnicima unutar vaše organizacije.
Ako ga pogledamo, evo primjera nekih vizualizacija. No, biti u mogućnosti distribuirati svoj analitički izlaz prema poslovnim korisnicima, pa je prvi primjer na lijevoj strani, to je mrežni analitički dijagram. A možda ste istražitelj prevare i ne znate kako se uspostavljaju te veze, a to mogu biti ljudi, to mogu biti entiteti, mogu biti ugovori, zaista bilo što. Ali možete to manipulirati mišem i komunicirati s njim da biste stvarno shvatili - ako ste istražitelj prevare, da biste razumjeli prioritetni popis koga treba istražiti, zar ne, jer ne možete sa svima razgovarati, pa imate davati prioritet.
Ako pogledamo sliku s desne strane tamo, za nadzornu nadzornu ploču za održavanje, to je zaista zanimljiv problem. Možda ste vlasnik zračne luke, a imate ove skenere tijela unutra. Ovi skeneri za tijelo, ako idete u zračnu luku, tamo su neke komponente koje imaju otprilike devet mjeseci trajanja. A ove su stvari stvarno, jako skupe. Ako u svojoj zračnoj luci imam više ulaznih točaka, više skenera, broj jedan želim osigurati da imam odgovarajuće osoblje na svakoj kapiji, a za dijelove koji su u skenerima, ne želim ih naručiti ni previše rano, i želim ih imati prije nego što se pokvari. Imamo mogućnost, možda ako imate zračnu luku, da možemo predvidjeti kada će se te stvari pokvariti i predvidjeti razinu osoblja.
Ako pogledamo donje desno, ovo je ako ste u proizvodnom okruženju, ovo je samo grafički prikaz proizvodnog toka. I malo je teško vidjeti, ali crveni i zeleni semafori su u ovim različitim procesnim sektorima, tako da ako sam inženjer, tamo ide vrlo sofisticirana matematika, ali mogu se detaljno upoznati u tom određenom sektoru procesa i pogledati parametara i unosa koji, možda, čineći to izvan kontrole. Ako pogledamo našeg znanstvenika s podacima o građanima, naš je cilj zaista olakšati znanstvenicima s podacima o građanima. Imamo čarobnjake i predloške, a jedna stvar mislim da je zaista zanimljiva, je li ovaj automatizirani čvor za provjeru zdravlja podataka. I stvarno što ovo radi, ima ugrađene pametne uređaje.
Spomenuo sam pripremu podataka - treba mnogo vremena, a to je u agregiranju podataka i njihovoj pripremi. Ali pretpostavimo da imam svoje podatke, mogu ih pokrenuti kroz ovaj čvor zdravstvene provjere podataka, i on provjerava invarijantnost, rijetkost i odmetnike, i sve ove stvari ispunjava nedostajuće vrijednosti i čini puno matematike koju ne Ne razumijem, pa mogu ili prihvatiti zadane postavke, ili ako sam malo pametniji, mogu ih promijeniti. Ali poanta je u tome što taj proces želimo automatizirati. Ova stvar ima oko 15 različitih provjera i ishoda na očišćenom skupu podataka. Ono što radimo olakšava ljudima stvaranje ovih radnih tokova.
Ovdje govorimo o suradnji između znanstvenika podataka i građana. Ako pogledamo ove slike s desne strane, vidimo da je to tijek pripreme podataka. A možda je ovo vrlo sofisticirano, možda je ovo tajni umak vaše tvrtke, ne znam, ali znamo da netko u vašoj organizaciji može pristupiti jednom ili više ovih silosa podataka koje imamo. Trebamo način da ih uzmemo i spojimo zajedno broj dva, možda postoji posebna obrada koju želimo obaviti, a to je izvan našeg zdravstvenog pregleda i to je tajni umak vaše tvrtke. Mogu stvoriti ovaj tijek rada u našoj organizaciji, i on propada kao čvor. Vidite strelicu usmjerenu prema dolje, to je samo čvor, a mi možemo imati stotinu tih stvari unutar organizacije. Ideja je da imamo ljude koji znaju nešto o određenom prostoru, oni mogu stvoriti tijek rada, a netko drugi to može ponovo upotrijebiti. Pokušavamo svesti na najmanju količinu kotača.
I mi možemo učiniti isto s analitičkim modeliranjem tijekova rada. U ovom slučaju s desne strane, ovaj tijek rada, možda postoji 15 različitih algoritama, i želim odabrati najbolji za zadatak. A ja ne moram razumjeti kao istraživača podataka o građanima što se događa u onom paukovom neredu, ali on se samo urušava u čvor, a možda taj čvor jednostavno kaže, „izračunajte rezultat kreditnog rizika.“ „Izračunajte šansu kirurške stranice infekcije, "što imate. „Izračunajte vjerojatnost da će se dogoditi lažna transakcija.“ Kao istraživač podataka o građanima, mogu se poslužiti ovom vrlo sofisticiranom matematikom koju je izgradio netko drugi, možda je jedan od tih znanstvenika ugradio u moju organizaciju.
Iz perspektive znanosti o podacima, razgovarao sam s znanstvenicima koji vole pisati kod i razgovarao sam s znanstvenicima koji ne vole pisati kod. I to je u redu, tako da imamo vrlo vizualno, grafičko korisničko sučelje. Možemo uzeti naše podatke, možemo izvršiti automatizirani zdravstveni pregled podataka i možda želim napisati kod. Sviđa mi se Python, sviđa mi se R, ali ideja je da ti znanstvenici s podacima nedostaju i sviđa im se kod na određenom jeziku. Mi nemamo posebnu sklonost jeziku na koji želite kodirati, pa ako to želite učiniti, učinite R; ako želite učiniti Python, učinite Python. To je odlično. Ako želite raspršiti svoju analitiku na Azure, rastavite je u oblak. I stoga je cilj ovdje zaista ponuditi fleksibilnost i mogućnosti kako bi vaše znanstvenice podataka bile što produktivnije.
Sada su znanstvenici s podacima, oni su prilično pametni ljudi, ali možda nisu stručnjaci za sve, a možda postoje i neke jaze u onome što mogu učiniti. Ako pogledate unutar industrije, postoji mnogo različitih analitičkih tržišta. Ovo je primjer, možda trebam prepoznati sliku i nemam tu vještinu, možda možda odem u Algoritmiju i dobijem algoritam prepoznavanja slike. Možda odem na Apervitu i dobijem vrlo poseban algoritam zdravstvene zaštite. Možda želim koristiti nešto u biblioteci strojnog učenja Azure. Možda želim koristiti nešto u rodnoj platformi Statistica.
Opet, ideja ovdje je da želimo utjecati na globalnu analitičku zajednicu. Budući da nećete imati sva znanja unutar četiri zida, kako možemo stvoriti softver - i to je ono što radimo - što vašim znanstvenicima za podatke omogućuje korištenje algoritama s raznih tržišta. To radimo s R i Python već duže vrijeme, ali to se proširuje i na ta tržišta aplikacija koja postoje vani. I isto što vidite ovdje na vrhu ovoga, mi koristimo H2O na Sparku, tako da postoji puno analitičkih algoritama. Ne morate se fokusirati na njihovo kreiranje ispočetka, ponovo ćemo ih koristiti u zajednici otvorenog koda i želimo da ti ljudi budu što produktivniji.
Sljedeći korak, nakon što imamo naše znanstvenike o podacima o građanima i naše znanstvenike s podacima, zaista je kako promovirati i distribuirati te najbolje prakse? U okviru našeg softvera imamo tehnologiju koja vam omogućuje distribuciju analitike bilo gdje. I to je više pogled na upravljanje modelom, ali više me ne vežu četiri zida ili specifična instalacija unutar Tulse, Tajvana ili Kalifornije, ili što već imate. Ovo je globalna platforma, a imamo mnogo, mnogo kupaca koje je implementirao u svojoj upotrebi na više web lokacija.
I doista, ključne su stvari, ako nešto radite na Tajvanu i želite to ponoviti u Brazilu, to je sjajno. Uđite tamo, zgrabite predloške za višekratnu upotrebu, zgrabite tokove rada koje želite. To pokušava stvoriti te standarde i uobičajeni način stvari, tako da svugdje ne radimo stvari potpuno drugačije. I druga ključna komponenta toga je da stvarno želimo uzeti matematiku tamo gdje podaci žive. Ne morate miješati podatke između, znate, Kalifornije i Tulse te Tajvana i Brazila. Imamo tehnologiju koja nam omogućava da upotrijebimo matematiku prema podacima, a mi ćemo imati još jedan Hot Technology webcast na tu temu.
Ali ovu arhitekturu nazivamo i evo skrivenog zavičaja, Native Distributed Analytics arhitekture. Ključna ideja iza toga je da imamo platformu, Statistica, i ja mogu izvoziti analitički tijek rada kao atom. I mogao bih napraviti model ili čitav tijek rada, tako da nema veze. Ali mogu to stvoriti i izvesti na jeziku prikladnom ciljnoj platformi. Na lijevoj strani ovoga čini puno ljudi, ali oni to rade u izvornom sustavu. To je u redu, možemo činiti bodovanja i možemo napraviti izgradnju modela u bazi podataka, tako da je to zanimljivo.
A onda s desne strane imamo Boomi. Ovo je popratna tehnologija, surađujemo sa svim tim. Ali mi također možemo iskoristiti te tokove rada i u osnovi ga transportirati bilo gdje u svijetu. Sve što ima IP adresu. I ne moram imati Statisticu instaliranu na javnom ili privatnom oblaku. Sve što može pokrenuti JVM, možemo pokrenuti te analitičke tijekove rada, radne tijekove za pripremu podataka ili samo modele na bilo kojoj od ovih ciljnih platformi. Bilo da se radi o mom javnom ili privatnom oblaku, bilo da je u mom traktoru, automobilu, domu, žarulji, internetu stvari, imamo tehnologiju koja vam omogućava da transportirate te radne tijekove bilo gdje u svijetu.
Pogledajmo. Znate, mi imamo poslovne korisnike, tako da ovi ljudi, koji imamo tehnologiju, omogućuju im da troše proizvode u formatu koji im je ugodan. Imamo znanstvenike o građanima, a ono što pokušavamo učiniti je poboljšati suradnju, učiniti ih dijelom tima, zar ne? I tako želimo da ljudi prestanu izmišljati kotač. I imamo te znanstvenike, tamo bi mogao postojati jaz u vještinama, ali oni mogu kodirati na jeziku koji žele, mogu ići na analitička tržišta i tamo koristiti algoritme. I tako s ovim, kako ne biste mogli pomisliti da je s ovim sve strašno? Ovo je savršeno, ovo radimo. Gradimo tijekove koji se mogu ponovo upotrijebiti, dajemo upute ljudima, dajemo im Lego blokove kako bi mogli graditi ove moćne dvorce i sve što žele učiniti. Ukratko, imamo platformu koja omogućuje osnaživanje poslovnih korisnika, znanstvenika podataka o građanima, znanstvenika programera, imamo - možemo se pozabaviti bilo kojim slučajem upotrebe IoT edge analitike i omogućavamo ovaj pojam kolektivne inteligencije. S tim mislim da ćemo ga vjerojatno otvoriti za pitanja.
Robin Bloor: Pa dobro. Mislim da prvo - mislim, da budem iskren, mislim da me je Dell Statistica već ranije informirao, i da budem iskren, zapravo sam prilično iznenađen stvarima za koje nisam znao da ste iznijeli u prezentaciji, I moram reći da je jedna stvar, to je nešto što je meni smetalo prilikom usvajanja analitike, da li je to, nabavljanje alata, zar ne? Ima gomilu alata vani, postoje alati s otvorenim kodom itd. I tako dalje, a postoje razne, kako bih nazvao, polu-platforme. Ali mislim da je razlika koju imate, posebno me impresionirala nekim tijekom rada.
Ali razlika je u tome što vam se čini da osiguravate kraj do kraja. To je poput analitike sofisticirani poslovni proces koji započinje sa prikupljanjem podataka, a zatim prolazi kroz čitav niz koraka, ovisno o tome kako su podaci lažni, a zatim se može razgranati u čitav niz različitih matematičkih napada na podaci. A onda se na jedan ili drugi način pojavljuju rezultati i to trebaju biti akcije. Naišao sam na ogromnu količinu analitike gdje je učinjeno mnogo velikog posla, ali nema toga da se to poduzme na djelovanje. I čini se da imate jako puno onoga što se traži. Ne znam koliko je sveobuhvatan, ali način je sveobuhvatniji nego što sam očekivao. Nevjerojatno sam impresioniran time.
Želio bih da komentirate proračunske tablice. Već ste nešto rekli, ali jedna od stvari koju sam primijetio i zabilježio tijekom godina, ali to postaje sve više i više očigledno je da postoji jako puno proračunskih tablica koje su sustav sjenki i stvarno mislim Mislim, proračunska tablica, bila je to prekrasno sredstvo prilikom uvođenja i bila je divna otkad na puno različitih načina, ali to je uopćeni alat, zapravo nije prikladan svrsi. To sigurno nije jako dobro u BI kontekstu i mislim da je to grozno u kontekstu analitike. Pitao sam se da li imate neki komentar o, recimo, primjerima gdje je Statistica izblijedio, prekomjerna upotreba proračunske tablice ili neki komentar koji biste željeli dati o tome?
David Sweenor: Da, mislim da, znate, možete potražiti poznate pogreške u proračunskim tablicama. Google ili bilo koja tražilica koju koristite vratit će se s obiljem rezultata. Ne mislim da ćemo ikada zamijeniti proračunske tablice. To nije naša namjera, ali puno organizacija u koje odlazim, postoji nekoliko ovih čarobnjaka za proračunske tablice ili nindže ili kako god ih želite zvati, ali oni imaju ove vrlo sofisticirane proračunske tablice i morate razmišljati, što se događa kad ove ljudi pobjede u loto i ne vrate se? I tako, ono što pokušavamo učiniti, znamo da će proračunske tablice postojati tako da ih možemo progutati, ali mislim da ono što pokušavamo učiniti je razviti vizualni prikaz vašeg tijeka rada kako bi se mogao razumjeti i dijeliti s drugim ljudima, Proračunske tablice su prilično teške i prilično ih je teško dijeliti. I čim mi pošaljete svoju proračunsku tablicu, promijenio sam je, a sad više ne sinkroniziramo i dobivamo različite odgovore. Ono što pokušavamo učiniti je staviti neke zaštitne ograde oko ovoga i učiniti stvari malo učinkovitijima. A proračunske su tablice zaista grozne za kombiniranje više skupova podataka zajedno, znate? Oni tamo padaju. Ali nećemo ih zamijeniti, gutamo ih i imamo ljude koji se počinju mijenjati, jer ako imamo čvor koji kaže "izračunati rizik", to pokušava učiniti osoba koja koristi proračunsku tablicu. Dakle, tih više nema.
Robin Bloor: Da, mislim, rekao bih da, znate, iz jedne perspektive na koju gledam stvari, rekao bih da su proračunske tablice odlične za stvaranje informacija. Čak su izvrsni za stvaranje otoka znanja, ali stvarno su loši za dijeljenje znanja. Oni nemaju mehanizam za to, pa ako nekome proslijedite proračunsku tablicu, to nije kao da je možete pročitati kao članak koji je točno objasnio što rade. Jednostavno je nema. Mislim da, znate, stvar koja me se najviše dojmila u prezentaciji i o Statisticinim mogućnostima, čini se nevjerojatno agnostičkom. Ali ova nit prolazi kroz tijek rada. Da li sam u pravu ako pretpostavim da biste mogli pregledati tijek radnog tijeka točno preko, znate, od prikupljanja podataka pa sve do ugrađivanja rezultata u određene BI aplikacije ili čak pokretanje aplikacija?
David Sweenor: Da, apsolutno. I ima sposobnost da se sve to iskoristi u potpunosti i neke organizacije to koriste u potpunosti, a ja sam pod nikakvom iluzijom da li bilo koja tvrtka ovih dana kupuje sve od jednog dobavljača. Imamo miks. Neki koriste Statisticu za sve, a neki ga koriste za modeliranje tijekova rada, neki ga koriste za tijek pripreme podataka. Neki ga koriste za distribuciju stotina inženjerskih izvještaja inženjerima. I tako imamo sve između. I stvarno je kraj i to je, znate, agnostička platforma, jer ako postoje algoritmi koje želite koristiti u R ili Python, Azure, Apervita, sve što, znate, koristite. To je sjajno, budite produktivni, koristite ono što znate, koristite ono što vam je ugodno i imamo mehanizme kako bismo osigurali da su oni kontrolirani i podložni reviziji i sve takve stvari.
Robin Bloor: Posebno mi se sviđa taj aspekt toga. Mislim, ne znam možete li govoriti preko onoga što ste rekli bogatstvu onoga što je vani. Mislim, pogledao sam to, ali nisam ga pogledao sveobuhvatno i sigurno ima ogroman broj Python knjižnica u našim knjižnicama, ali postoji li nešto što možete dodati toj slici? Jer mislim da je to vrlo zanimljiva stvar, znate, ideja da imate komponente koje su pouzdane, jer ste poznavali razne ljude koji su ih stvorili i razne ljude koji su ih koristili. Znate, možete li obogatiti ono što ste već rekli o tome?
David Sweenor: Da, mislim da su neka od tržišta tržišta aplikacija, znate, algoritma na tržištu. Na primjer, znate, dr. John Cromwell na Sveučilištu Iowa, razvio je model koji će predvidjeti, koji se koristi u stvarnom vremenu dok nas operiraju, dat će vam ocjenu ako želite dobiti kirurško mjesto infekcije. A ako taj rezultat bude dovoljno visok, poduzet će intervenciju u operacijskoj sali. To je vrlo zanimljivo. Pa možda postoji još jedna bolnica koja nije tako velika. Pa, Apervita je tržište zdravstvenih aplikacija za analitiku. Možete ga pronaći na mnogim ovim tržištima aplikacija, možete ih pronaći i ponovo ih koristiti, a transakcija je između vas i onoga tko je vlasnik, ali možete ga pronaći ili možete reći: "Evo što mi treba. "Mislim da je to što iskorištava tu globalnu zajednicu, jer su danas svi stručnjaci, a ne možete sve znati. Mislim da su R i Python jedno, ali ova ideja o: "Želim raditi ovu funkciju, staviti spektakl na neko od tih mjesta na tržištu aplikacija i neka je netko razvije za vas." I oni to mogu unovčiti, mislim da to je vrlo zanimljivo i vrlo različito od čisto otvorenog modela.
Robin Bloor: U redu. U svakom slučaju, loptu ću proslijediti Dezu. Želite li zaroniti, Dez?
Dez Blanchfield: Apsolutno i volio bih na trenutak ostati na proračunskoj tablici, jer mislim da je uhvatio pravu suštinu mnogih onoga o čemu mi ovdje govorimo. Robin je komentarisao, s obzirom na prelazak sa starih proračunskih tablica u njihov fizički oblik na elektronički. Imali smo zanimljivu stvar u kojoj su, kad znate, proračunske tablice prvobitno bile stvari, to su samo listovi papira s redovima i stupovima, a vi biste ih ručno zapisali, a zatim biste ih prebacili i izračunali bilo radeći i to s vrha glave ili s nekim drugim uređajem. Ali još uvijek imamo priliku da pogreške isteknu s rukopisom ili disleksijom, a sada smo to zamijenili pogreškama pri upisu. Rizik je da je s proračunskim tablicama profil rizika brži i veći, ali mislim da alati poput Statistice preokreću piramidu rizika.
Često crtam ovu sliku na ploči ljudskog bića na vrhu, kao jedna osoba, a zatim kolekciju njih na dnu, recimo, zamislimo deset njih na dnu te ploče, a crtam piramida gdje je točka piramide kod pojedine osobe i podnožje piramide zbir ljudi. I to koristim da vizualiziram ideju da ako jedna osoba na vrhu napravi proračunsku tablicu napravi grešku i podijeli je s deset ljudi, a sada imamo deset primjeraka pogreške. Budite vrlo oprezni sa svojim makronaredbama i budite vrlo oprezni sa svojim Visual Basicom ako se krećete prema tome. Jer kad izrađujemo elektroničke alate poput proračunskih tablica, to je vrlo moćan, ali moćan i na dobar i na loš način.
Mislim da alati kao što je Statistica stvaraju mogućnost obrnutosti tog profila rizika i to je da sada možete doći do točke gdje imate puno alata koji su dostupni pojedinoj osobi i dok prelaze iz mnoštva alata na vrhu piramida i onda do samog dna gdje je točka piramide koja je sada obrnuta stvarni alat, ako imamo tim ljudi koji grade te alate i te algoritme. A znanstvenik podataka ne mora biti specijalist regresijske analitike na svojim podacima. Možda će moći koristiti alat, ali možda imate pet ili šest statističara i aktuara i znanstvenika podataka i neke matematičare koji rade na tom alatu, taj modul, taj algoritam, taj dodatak i tako dalje na jeziku proračunske tablice, Zamislite da su svaku objavljenu proračunsku tablicu koju biste mogli koristiti zapravo napisali stručnjaci koji su testirali makronaredbe, testirali Visual Basic, osigurali da algoritmi rade, pa kad ste ih dobili mogli biste samo ubaciti podatke u nju, ali zapravo ih niste mogli razbiti i zato je bolje kontrolirati.
Mislim da mnogo analitičkih alata to radi. Pretpostavljam da je došlo do toga da li sada to vidite na terenu, vidite li prijelaz s proračunskih tablica koji bi potencijalno mogli gurnuti pogreške i pogreške i riskirati, do točke u kojoj alati koje gradite sa svojim sada, s tim da je otkrivanje podataka točno u stvarnom vremenu, a ljudi koji grade module i algoritme uklanjaju ili smanjuju taj profil rizika? Da li služba za korisnike to vidi u stvarnom smislu ili mislite da se to upravo događa, a oni to ne shvaćaju?
David Sweenor: Znate, mislim da postoji nekoliko načina da se na to odgovori. Ali ono što vidimo jest, znate, u bilo kojoj organizaciji, a spomenuo sam da analitika za koju mislim da je zaostajala iz perspektive korporativnog ulaganja, kao što smo napravili sa skladištenjem podataka i upravljanjem CRM-om. Ali ono što vidimo, znači da će trebati puno toga da se promijeni organizacija, da se prevlada ta organizacijska inercija. Ali ono što vidimo jesu ljudi kako uzimaju proračunske tablice, uzimaju im radne tijekove, a ja sam spomenuo sigurnost i upravljanje: „Pa, možda imam proračunsku tablicu“, „Pa, mogu to zaključati i mogu kontrolirati verzije.“ vidimo puno organizacija, možda upravo tamo počnu. A ako se promijeni, slijedi tijek rada, a ja završim, broj jedan, tko ga je promijenio? Zašto su to promijenili. Kad su ga promijenili. A također mogu postaviti radni tijek tako da neću stavljati novu proračunsku tablicu u proizvodnju ako je ne potvrdi i ovjeri jedna, dvije, tri, koliko god strana koje želite definirati u svom tijeku rada. Mislim da ljudi počinju poduzimati i organizacije počinju poduzimati dječje korake tamo, ali vjerojatno bih sugerirao da imamo dug put.
Dez Blanchfield: Zapravo i mislim da s obzirom da gradite i na sigurnosnim kontrolama i na upravljanju tamo, radno opterećenje može automatski preslikati to u njemu i sve do glavnog službenika za rizike, što je sada stvar. Možete početi kontrolirati kako se tim alatima i sustavima pristupa i tko radi što s njima, tako da je to vrlo moćno. Mislim da su druge stvari koje se događaju u tome da vrste alata koje mi pružate poklanjaju ljudskom ponašanju više nego tradicionalnim proračunskim tablicama o kojima govorimo, jer ako imam sobu punu ljudi s istom nadzornom pločom i pristupom istim podacima koji zapravo mogu dobiti drugačiji pogled i, kao rezultat toga, dobivaju malo drugačiji uvid od istih podataka koji odgovaraju njihovim potrebama kako bi mogli surađivati. Tada imamo humaniji pogled i interakciju s poslovanjem i procesom donošenja odluka, za razliku od toga da svi idemo na isti sastanak s istim PowerPointom i ispisane iste proračunske tablice, sve iste fiksne podatke.
Vidite li prijelaz u ponašanju i kulturi u organizacijama koje nekako preuzimaju vaše alate sada tamo gdje vide da se to događa, gdje nije poput petorice ljudi u sobi koji gledaju istu proračunsku tablicu pokušavajući je samo verbalizirati i bilježiti na njoj, ali sada zapravo komuniciraju s nadzornim pločama i alatima u stvarnom vremenu, s vizualizacijom i analitikom na dohvat ruke te dobivaju potpuno drugačiji tijek razgovora i interakcije, ne samo na sastancima, već samo o općoj suradnji oko organizacije? Jer to mogu učiniti u stvarnom vremenu, jer mogu postaviti pitanja i dobiti pravi odgovor. Je li to trend koji trenutno vidite ili se to još nije sasvim dogodilo?
David Sweenor: Ne, mislim da je definitivno krenuo tim putem i mislim da je vrlo zanimljiva stvar, ako uzmemo za primjer primjer neke tvornice. Možda netko tko posjeduje određeni sektor procesa unutar te tvornice želi pogledati i komunicirati s tim podacima na određeni način. A možda i ja, previdjevši sve procese, možda ovaj na dnu, možda ga želim pogledati kroz sve. Mislim da ono što viđamo je, broj jedan, ljudi počinju koristiti zajednički niz vizualizacija ili standardnih vizualizacija unutar svojih organizacija, ali također je prilagođeno ulozi u kojoj su. Ako sam procesni inženjer, možda to je sasvim drugačiji pogled od nekoga ko ga gleda iz perspektive lanca opskrbe, i mislim da je to sjajno jer mora biti prilagođen i mora se gledati kroz objektiv koji vam treba da biste dovršili svoj posao.
Dez Blanchfield: Pretpostavljam da proces odlučivanja pada, vremenski i brzinom, da bi se donošenje pametnih i točnih odluka također brzo povećavalo, zar ne? Jer ako imate analitiku u stvarnom vremenu, nadzorne ploče u stvarnom vremenu, ako imate alate Statistica na dohvat ruke, ne morate trčati preko poda da biste nekoga pitali o nečemu, to imate u tiskanom obliku. Možete na neki način surađivati, komunicirati i donijeti odluke u letu i odmah dobiti takav ishod. Što mislim da neke tvrtke doista još nisu shvatile, ali kad to urade, to će biti ovaj eureka trenutak da, da, još uvijek možemo ostati u svojim kabinama i raditi kod kuće, ali možemo komunicirati i surađivati i te odluke što radimo dok surađujemo odmah se pretvara u ishode. Gledaj, mislim da je bilo fantastično čuti što imaš do sada reći i stvarno se radujem kad vidim gdje to ide. I znam da imamo puno pitanja u pitanjima i pitanjima, tako da ću se vratiti u Rebeccu da prođem kroz neke od njih kako bismo što brže došli do njih. Hvala vam puno.
Rebecca Jozwiak: Hvala Dez, i da Dave, imamo puno pitanja od publike. I hvala Dez i Robin na uvidu. Znam da je ovaj određeni sudionik morao odustati na vrhuncu sata, ali ona se nekako pita, vidite li da odjeli za informacijske sustave više stavljaju prioritet na sofisticirane kontrole podataka, a ne na način da im je ugodno u pružanju alata za radnika znanja? Mislim, je li to - nastavite.
David Sweenor: Da, mislim da to ovisi o organizaciji. Mislim da banka, osiguravajuća kuća, možda imaju različite prioritete i načine postupanja, nasuprot marketinškoj organizaciji. Pretpostavljam da bih trebao reći da to samo ovisi o industriji i funkciji koju gledate. Različite industrije imaju različita žarišta i naglaske.
Rebecca Jozwiak: Dobro, to ima smisla. A onda je još jedan sudionik htio znati, što je motor iza Statistice? Je li to C ++ ili su tvoje stvari?
David Sweenor: Pa, ne znam mogu li to točno utvrditi s obzirom na to da postoji već 30 godina i da je razvijen prije mog vremena, ali postoji osnovna biblioteka analitičkih algoritama koji su algoritmi Statistica koji se pokreću. I vidjeli ste ovdje da i mi možemo pokretati R, možemo pokrenuti Python, možemo provaliti do Azure, možemo pokrenuti Spark na H2O, pa pretpostavljam da bih na to pitanje trebao odgovoriti u smislu, to su različiti motori. I ovisno o tome koji algoritam odaberete, ako je to Statistica, on se pokreće ovako, ako odaberete H2O i Spark, on to koristi, pa je to različit od njih.
Rebecca Jozwiak: Dobro. Druga vrsta sudionika upitala je posebno pokazujući na ovaj slajd, želeći znati, na neki način, kako znanstvenik podataka o građanima zna koje predloške za višekratnu upotrebu treba koristiti? I pretpostavljam da ću nekako od toga napraviti šire pitanje. To je, što vidite kada ulaze lokalni korisnici ili poslovni analitičari i žele koristiti te alate, koliko je lako da ih pokupe i pokrenu?
David Sweenor: Pretpostavljam da bih odgovorio na to i ako možete koristiti, ako ste upoznati sa sustavom Windows, ovo je platforma sa sustavom Windows, tako da sam presjekao vrh ovih snimaka zaslona, ali ima vrpcu za Windows. Ali kako znati koji tijek rada koristiti? Izgleda kao Windows Explorer, pa postoji struktura stabala i možete ga konfigurirati i postaviti bez obzira na to što ga vaša organizacija želi postaviti. Ali moglo bi biti, samo biste imali te mape i unutar ovih mapa stavljali biste ove predloške za višekratnu upotrebu. I mislim da vjerojatno postoji nomenklatura koju bi vaša tvrtka mogla usvojiti, recimo ovdje je "izračunati profil rizika", evo "dobiti podatke iz tih izvora" i da im imeš sve što želiš. To je besplatna mapa, samo povucite bilješke na svoje platno. Dakle, prilično jednostavno.
Rebecca Jozwiak: Dobro. Možda demo sljedeći put. Zatim se pojavljuje druga vrsta sudionika, i to ste vi i Robin i Dez razgovarali što se tiče netočnosti, posebno na proračunskoj tablici, ali smeća u / smeću vani i on vidi da je još kritičnije kad je riječ do analitike. Kako bi bilo spomenuto da, zlouporaba podataka, doista može dovesti do nekih nesretnih odluka. I pita se kakva su vaša stajališta o razvoju više nesigurnih algoritama, pretpostavljam za, koristi on riječ "pretjerana" upotreba analitike. Znate, netko uđe, stvarno se uzbuđuju, želi napraviti ovu naprednu analitiku, želi pokrenuti ove napredne algoritme, ali možda nisu baš sigurni. Pa što radite u zaštitnom obliku protiv toga?
David Sweenor: Da, pretpostavljam da ću odgovoriti na to najbolje što mogu, ali mislim da se sve svodi na ljude, procese i tehnologiju. Imamo tehnologiju koja pomaže ljudima i omogućuje bilo koji postupak koji želite uvesti u svoju organizaciju. U primjeru slanja kupona nekome, to možda i nije tako kritično, a ako je digitalno to zaista i nije trošak, možda postoji jedna razina sigurnosnih kontrola i možda nas nije briga. Ako predviđam kirurško mjesto infekcije, možda želim biti malo pažljiviji oko toga. Ili ako predviđam kvalitetu i sigurnost lijekova i takve stvari, možda želim biti malo pažljiviji u vezi s tim. U pravu ste, smeće u / smeće vani, tako da ono što pokušavamo učiniti je pružiti platformu koja će vam omogućiti da ga prilagodite onom procesu koji vaša organizacija želi usvojiti.
Rebecca Jozwiak: Dobro. Imam još nekoliko pitanja, ali znam da smo prošli dosta vremena i samo želim reći našim predavačima, to je bilo fenomenalno. I želimo se puno zahvaliti Daveu Sweenoru iz tvrtke Dell Statistica. Naravno, dr. Robin Bloor i Dez Blanchfield, hvala vam što ste danas analitičari. Sljedećeg ćemo mjeseca imati još jedan webcast s Dell Statisticom. Znam da je Dave nagovijestio temu. Bit će riječ o rubovima analitike, još jednoj fascinantnoj temi, a znam da će se na tom webcastu raspravljati o nekim vrlo uvjerljivim slučajevima uporabe. Ako vam se svidjelo ovo što ste vidjeli danas, vratite se još sljedećeg mjeseca. I s tim, narode, pozdravljam se. Hvala puno. Doviđenja.