Dom zvučni Analiza ruba: napokon ekonomija jota

Analiza ruba: napokon ekonomija jota

Anonim

Osoblje Techopedia, 22. rujna 2016

Povlačenje: Domaćin Rebecca Jozwiak razgovara o analitičkim analizama s dr. Robin Bloor, Dez Blanchfield i Shawn Rogers Dell Statistica.

Trenutno niste prijavljeni. Prijavite se ili prijavite da biste pogledali videozapis.

Rebecca Jozwiak: Dame i gospodo, zdravo i dobrodošli u Hot Technologies 2016. Danas imamo "Edge Analytics: Konačno ekonomija interneta". Moje ime je Rebecca Jozwiak. Bit ću vaš moderator za današnji webcast. Ako se želite pridružiti Twitter razgovoru, tweetujemo s hashtagom od # HOTTECH16.

Dakle, IoT, definitivno vruća tema ove godine i internet stvari, zapravo je riječ o strojnim podacima, podacima senzora, podacima zapisnika, podacima uređaja. Ništa od toga nije novo, tu vrstu podataka imali smo zauvijek, ali jest da je stvarno nismo uspjeli upotrijebiti i sada vidimo samo mnoštvo novih načina korištenja tih podataka. Osobito u medicinskoj industriji, financijskim tržištima, s naftom i plinom, robom, to je samo mnoštvo informacija koje su se neiskorištene. I nije baš puno ljudi shvatilo kako to dobro učiniti. Govorimo o puno malo podataka, ali mnogo je podataka i znate da su problemi s mrežom uključeni, uključen je hardver ili ga treba obraditi i kako to učiniti bez začepljenja sustava? Pa to ćemo danas naučiti.

Evo naše linije stručnjaka. Imamo dr. Robina Bloora, našeg glavnog analitičara iz The Bloor Group. Također imamo Deza Blanchfielda, našeg znanstvenika za podatke iz The Bloor Group. I drago nam je što Shawn Rogers, direktor globalnog marketinga i kanala iz tvrtke Dell Statistica. A s tim ću loptu proslijediti Robinu.

Dr. Robin Bloor: Dobro, hvala vam na tome. Pritisnuti ću gumb i baciti slajd. Nemam pojma zašto sam stvorio ovu apokaliptičnu sliku za internet stvari. Možda zato što mislim da će to na kraju postati kaotično. Krenut ću ravno. Ovo je mjesto za tečaj u bilo kojoj IoT prezentaciji. Morate, na ovaj ili onaj način, reći nešto nevjerojatno o tome gdje sve to ide. I zapravo, većina toga je vjerojatno istina. Ako zapravo gledate na način na koji se te krivulje postupno šire. Znate, osobna računala, pametni telefoni i tableti vjerojatno će i dalje rasti. Pametni televizori će vjerojatno rasti. Nosivi, oni vjerojatno sada eksplodiraju u usporedbi s onim prije nekoliko godina. Povezani automobili, neizbježno je da će gotovo svi automobili biti povezani široko i stalno prenositi podatke. I sve ostalo. A ovaj specifični grafikon BI Intelligencea ukazuje da će sve ostalo nadmašiti očite stvari vrlo, vrlo brzo.

Pa što reći o IoT-u? Prvo je samo arhitektonska točka. Znate, kad dobijete podatke i obrađujete ih, na ovaj ili onaj način, morat ćete ih sastaviti. A s podacima o sadašnjim količinama i prikupljanje na raznim mjestima, njih dvoje više nisu prirodno zajedno. Pretpostavljam da su bili u starim mainframe danima. Stoga možete razmišljati o tome da postoje procesijski sloj, transportni sloj i podatkovni sloj. Na ovaj ili onaj način, transportni sloj će danas pomicati obradu ili premještati podatke po mrežama. Dakle, evo izbora: Možete premjestiti podatke u obradu, možete premjestiti obradu na podatke, možete premjestiti obradu i podatke na prikladno mjesto izvršenja, ili možete dijeliti obradu i dijeliti podatke. A što se tiče interneta stvari, podaci su već po trenutačnom stanju izbrisani, a vjerovatnoća je da će jako puno obrade biti obrijano kako bi se aplikacije koje je potrebno pokrenuti odvijale.

Pa sam naslikao sliku. Zanimljiva stvar o IoT-u, govorim o domeni združivanja u ovom dijagramu i ističem da postoje poddomene. Dakle, možete zamisliti da je IoT domena 1 ovdje neko vozilo, a domena 2 i domena 3 i domena 4 su automobili neke vrste, a lokalno ćete skupljati podatke, pokretat ćete lokalne aplikacije na tim podacima i staviti ćete razne stvari u akciju. Ali da biste imali analitiku o svim automobilima, morat ćete prenijeti podatke u centar, ne nužno i sve podatke, ali ćete morati objedinjavati u centru. A ako razmislite o tome, onda biste možda trebali imati mnogo, mnogo različitih domena združivanja za isti skup IoT stvari. I same se domene mogu dodatno sakupljati. Tako da biste mogli imati tu ponavljajuću hijerarhiju. U osnovi, ono što imamo je nevjerojatno složena mreža. Daleko složeniji od svega što smo prije imali.

Ovdje imam bilješku na dnu. Svi čvorovi mreže, uključujući čvorove listova, mogu biti tvorci podataka, spremišta podataka i točke obrade. A to vam daje mogućnost distribucije, kakvu kakvu još nismo vidjeli. Dez će o tome razgovarati malo više, pa ću prijeći na ovu točku. Jednom kada smo kod interneta i svi su podaci zapravo postali događaji, smisao ovog dijapozitiva je samo da naznači da ćemo se morati standardizirati u događajima. Morat ćemo to imati, u najmanju ruku, morat ćemo to imati. Imat ćemo vrijeme događaja, zemljopisni položaj do kojeg se dogodio, virtualnu ili logičku lokaciju procesa koji ga je stvorio, izvorni uređaj koji ga je stvorio, ID uređaja tako da točno znate koji je izvorni uređaj stvorio, vlasništvo podataka i aktera, oni ljudi koji imaju pravo koristiti podatke na neki ili drugi način, morat će nositi svoja dopuštenja sa sobom, što znači, zaista, oni će morati nositi sigurnost sa sobom, a onda je tu sami podaci. Kad pogledate na to, shvatite da, čak i ako imate senzor koji ne radi ništa drugo nego prijaviti temperaturu nečega svake sekunde ili slično, zapravo postoji prilično puno podataka da se točno utvrdi gdje su podaci nastao i ono što zapravo jest. Usput, ovo nije iscrpan popis.

Dakle, što se tiče budućeg IT krajolika, način na koji ja to vidim jest: to nije samo internet stvari, već i činjenica da ćemo biti u svijetu aktivnosti usmjerenih na događaje, i stoga morat će imati arhitekture koje upravljaju događajima, a te arhitekture će morati obuhvaćati velike mreže. A druga stvar je sve u stvarnom vremenu, nije nužno da mi radimo u stvarnom vremenu, ali nešto što nazivam poslovnim vremenom je vrijeme u kojem se podaci moraju dostavljati i spremni prerađivati. To možda neće biti, milisekunda nakon što je stvoreno. Ali uvijek postoji takvo vrijeme za svaki podatak i jednom kad imate arhitekturu koja je utemeljena na događajima, postaje sve razumnije razmišljati u smislu stvarnog pristupa načinu na koji funkcionira svijet.

Dakle, spuštanje, jer ono o čemu zapravo govorimo je analitika na IoT-u. Unatoč svemu, još uvijek je vrijeme za uvid, a nije samo vrijeme za uvid, uvid mora biti praćen radnjama. Dakle, vrijeme za uvid i vrijeme za djelovanje ono je na čemu bih se srušio. Rekavši to, loptu ću vratiti Dez.

Dez Blanchfield: Hvala, Robin. Uviđavan kao i uvijek. Volim činjenicu da je teško postupati na svakoj instanci, ali dat ću sve od sebe.

Jedna od stvari koje vidim i često me zabavljam, da budem iskrena, i to ne u bešćutnom i negativnom obliku, ali postoji velika briga i panika zbog interneta stvari koje preuzimaju svijet. i odrezati nas, a vi ćete početi gubiti svoje podatke, pa želim malo osvrnuti se na neke stvari koje smo radili u posljednja dva do tri desetljeća, a koje su bile faksimila internetu stvari, ali možda ne baš na istoj skali. I samo da pokažemo da smo zapravo ovdje i riješili smo neke probleme, ne na ovoj razini razmjera, a ne ovom brzinom. Jer to znači da zapravo možemo riješiti problem i da znamo koji su od tih odgovora; upravo smo se trebali loviti i ponovo primijeniti neka saznanja koja smo imali prije. A znam da je ovo cijeli razgovor koji ćemo započeti i imam čitav niz zabavnih stvari samo za razgovor o kojima ću razgovarati u odjeljku Pitanja i odgovori.

Ali kad razmišljamo o internetu stvari u krugu, postoji velika centralizacija koja je trenutno na razini dizajna koja je napisana u vrlo ranim danima. Na primjer, Fitbit uređaji obično idu na jedno središnje mjesto i vjerojatno se negdje nalazi u oblačnoj platformi i svi ti podaci s svih tih uređaja pogađaju isti, recimo, prednji kraj snopa, uključujući web i aplikacije i usluge temeljene na podacima. Ali s vremenom će ta skala zahtijevati ponovno inženjering kako bi se mogao nositi s količinom podataka koji dolazi od njih i preusmjerit će ih tako da postoji više prednjih krajeva i više kopija snopa na više lokacija i regija. I to vidimo i imamo nekoliko primjera koje ću vam dati o kojima možemo razgovarati.

Ključna poanta ovoga je da, iako smo vidjeli neka od ovih rješenja koja ću uskoro pokriti, opseg i obujam podataka i mrežni promet koji će generirati internet stvari hitno zahtijevaju pomak s središnjeg prema mom mišljenju, to znamo, ali mi to znamo, ali nismo nužno shvatili kakvo je rješenje. Kada razmišljamo o konceptu što je Internet stvari, to je mrežni model velikih razmjera. Puno i puno stvari sada stvaraju buku. Stvari koje do nedavno nisu bukirale. I u stvari, mislim da je bilo jučer, u šali sam govorio o stajlingu, ali otišao sam kupiti novi toster i došao je s opcijom koja bi mi mogla reći razne stvari, uključujući i kada treba čišćenje. I nova mikrovalna pećnica s vrlo sličnom značajkom i čak bi se zapravo mogla pingati aplikacija na mom telefonu koja bi rekla da je stvar koju sam zagrijavala sada učinjena. I vrlo sam mišljenja da ako postoji par stvari o kojima ne želim razgovarati, to su moj hladnjak, mikrovalna pećnica i tosteri. Prilično mi je ugodno kad su oni glupi uređaji. Ali nedavno sam dobio novi automobil, malog Audija, i on to sa mnom razgovara i s tim sam prilično zadovoljan, jer me zanimaju stvari o kojima govori. Poput ažuriranja karata u stvarnom vremenu, da biste mi rekli gdje je bolja ruta od točke A do točke B jer je otkriven promet kroz razne mehanizme s podacima koje šalje.

Imam ovaj slajd. Već smo vidjeli da mrežni modeli velikih količina zahtijevaju prijelaz s centralnog na distribuirano hvatanje i isporuku modela za obradu podataka i analitiku. Vidjeli smo kako se stvari pomiču s tri mala dijagrama na desnom rubu gdje imamo, lijevo od tri, postoji centralizirani model sa svim malim uređajima koji dolaze na središnje mjesto i prikupljaju podatke i razmjera nije tako velika, oni se tamo odlično snalaze. U sredini smo dobili malo decentraliziraniji model i koncentrator i govorili, a to je ono što mislim da će nam trebati s internetom stvari u sljedećoj generaciji. I tada na desnoj strani imamo tu potpuno distribuiranu i isprepletenu mrežu, gdje će internet stvari i stroja do stroja ići u vrlo kratkom roku u budućnosti, ali nismo baš sasvim ondje iz niza razloga. I to uglavnom zato što većinu komunikacija do sada koristimo internetske platforme i zapravo nismo izgradili drugu mrežu koja bi prenosila puno tih podataka.

Postoje druge mreže koje već postoje, poput Batelcove mreže. Mnogi ljudi ne razmišljaju o činjenici da telekomunikacijske mreže nisu internet. Internet je na mnogo načina vrlo odvojena stvar. Usmjeravaju podatke sa pametnih telefona preko telefonskih mreža, a potom preko telefonskih mreža i interneta općenito gdje ih zapravo dijele u dvije mreže. Ali posve je moguće i vjerojatno da će internetu stvari trebati druga mreža. Govorimo o industrijskom internetu kao temi općenito, o kojoj sada nećemo ulaziti u detalje, ali u osnovi govorimo o drugoj mreži koja je posebno dizajnirana za vrste prijevoza podataka ili interneta stvari i od stroja do stroja. komunikacija.

No, neki od primjera želio sam podijeliti na mjestu gdje smo vidjeli mreže velikih razmjera i dobro raspoređeni podaci rade poput interneta. Internet je bio dizajniran i oblikovan od prvoga dana kako bi mogao preživjeti nuklearni rat. Ako se dijelovi u SAD-u raznesu, internet je dizajniran tako da se podaci mogu kretati Internetom bez gubitka paketa iz razloga koji su još uvijek povezani. A to i danas postoji na globalnoj razini. Internet ima višestruke mogućnosti oko prepuštenosti i usmjeravanja paketa. A zapravo internet koji kontrolira stvar pod nazivom BGP, Border Gateway Protocol i BP Gateway Protocol, BGP, posebno je dizajniran da se nosi s ruterom ili prekidačem ili s padom poslužitelja. Kada pošaljete ili primite e-poštu, ako pošaljete tri e-pošte zaredom, nema garancije da će svaka od tih poruka e-pošte slijediti istu rutu do istog krajnjeg odredišta. Iz različitih se razloga mogu kretati različitim dijelovima interneta. Moglo bi doći do prekida rada, mogu postojati prozori održavanja gdje se stvari izvan mreže mogu nadograditi, može doći do gužve u mreži, a to vidimo i kod stvari poput prometne mreže s automobilima i javnim prijevozom, brodovima i avionima. Sadržaj dobivamo na našim uređajima poput prijenosnih računala i tableta i računala putem preglednika i tako dalje svakog dana putem mreža za dostavu sadržaja. Mreže za dostavu sadržaja podrazumijevaju uzimanje kopija sadržaja s vaše primarne platforme za posluživanje, poput web poslužitelja, te premještanje kopija tog i predmemorije malog iznosa na rub mreže i isporučivanje samo vama iz najbližeg ruba.

Zaštita od neželjene pošte i cyber-sigurnosti - ako se događaj neželjene pošte dogodi u Kanadi, a Microsoft to otkrije i vidi da se grupi slučajnih ljudi šalje mnogo primjeraka istog e-maila, na njemu se uzimaju kontrolni listovi, potpis za tu poruku je stvorili i stavili u mrežu i odmah distribuirali. Tako da ta e-pošta nikad ne uđe u moj pretinac pristigle pošte ili, ako se to dogodi, odmah se označi kao neželjena pošta jer je otkrivena negdje drugo na rubu mreže. I tako se drugim dijelovima ruba mreže priča o ovom potpisu neželjene poruke i ona se stavlja u indeks baze podataka, a ako se te poruke počnu pojavljivati ​​na drugoj strani planeta, otkrivamo ih i znamo da su neželjena pošta. A isto se odnosi i na kibernetičku sigurnost. Hak koji se događa na jednoj strani planete otkriva se i registrira, preslikava i odjednom na drugom dijelu mreže možemo se boriti protiv toga, podnijeti pravila i pravila i promijeniti da vidimo možemo li je blokirati. Osobito s novim utjecajem stvari kao što su uskraćivanje usluge ili distribuirano uskraćivanje usluge gdje se tisuće strojeva koriste za napad na središnju web stranicu.

Bitcoin i blockchain su po zadanom u svojoj prirodi distribuirana knjiga, blockchain i rješava se bilo kakvim prekidima ili lomovima na mreži. Otkrivanje i sprječavanje prijevara, napajanje električnom energijom i vodom - viđamo, znate elektroenergetsku mrežu, ako jedan dio mreže na njemu stablo stabla i izvadi stup i žicu, moja kuća i dalje dobiva struju. Ne znam čak ni za to, često je ne vidim ni u vijestima. Svi smo navikli na prometne mreže gdje je prvobitno postojao centralizirani model, "Svi putevi vodili su do Rima", kako kažu, i onda smo na kraju morali ići na decentralizirani model sa središtima i žbicama, a onda smo otišli do umrežene mreže gdje se kroz različite mrežaste rute i različita raskrižja može doći s jedne strane grada na drugu. Ono što ovdje vidimo jest da će ovaj centralizirani model onoga što sada radimo s internetom stvari morati gurnuti do ruba mreže. A to se odnosi na analitiku više nego ikad prije, a to je da moramo analitiku gurnuti u mrežu. A za to je potrebno potpuno nov pristup u načinu na koji pristupamo i obrađujemo te podatke i tokove podataka. Sada govorimo o scenariju u kojem vjerujem da vidimo ograničenu inteligenciju potisnutu do ruba mreže na uređajima povezanim na internet, ali uskoro ćemo vidjeti kako ti uređaji povećavaju inteligenciju i povećavaju razinu analitike koju žele napraviti. Kao rezultat toga, morat ćemo te pametne snage gurnuti dalje i dalje kroz mrežu.

Na primjer, pametne aplikacije i društveni mediji - ako razmišljamo o društvenim medijima i nekim pametnim aplikacijama, one su i dalje vrlo ključne. Znate, postoje samo dva ili tri data centra za slične Facebooku. Google je postao puno decentraliziraniji, ali još uvijek je ograničen broj podataka centara širom svijeta. Kad razmišljamo o personalizaciji sadržaja, morate razmišljati na vrlo lokalnoj razini. Puno se toga radi u vašem pregledniku ili na lokalnom sloju mreže za dostavu sadržaja. A mi razmišljamo o zdravlju i fitnessima - broj podataka koji se prikuplja od njih postaje lokalno analiziran, pa nove verzije Garmin i Fitbit uređaja koje stavite na zglob postaju pametnije i pametnije u uređaju, Sada ne šalju sve podatke o vašem otkucaju srca na centralizirani poslužitelj kako bi pokušali obaviti analitiku; ugrađuju tu inteligenciju izravno u uređaj. U navigaciji za automobile nekada je bilo da će automobil neprestano dobivati ​​ažuriranja i karte s središnjeg mjesta, a sad su pametni u automobilu i automobil će sam donositi odluke i na kraju će se automobili umrežiti. Automobili će međusobno razgovarati putem nekih bežičnih mreža, što bi moglo biti preko 3G ili 4G bežične mreže u sljedećoj generaciji, ali s vremenom će to biti uređaj do uređaja. I jedini način na koji ćemo se nositi s tom količinom je čineći uređaje pametnijima.

Već imamo sustave upozoravanja u slučaju nužde koji će lokalno prikupljati informacije i slati ih centralno ili u umreženu mrežu i donositi odluke o onome što se događa lokalno. Na primjer, u Japanu postoje aplikacije koje ljudi pokreću na svojim pametnim telefonima s akcelerometrima na pametnom telefonu. Akcelerometri u pametnom telefonu otkrivat će vibracije i kretanje i mogu utvrditi razliku između uobičajenog svakodnevnog kretanja i drhtanja i udara potresa. I taj će vas telefon odmah početi upozoravati, lokalno. Stvarna aplikacija zna da otkriva potrese. Ali također dijeli te podatke putem mreže u distribuiranom modelu koncentratora i govornika kako bi vas ljudi u vašoj blizini upozorili odmah ili što je prije moguće kako podaci prolaze kroz mrežu. I na kraju, kad dođe do središnjeg mjesta ili distribuirane kopije središnje lokacije, odguruje ljude koji nisu u neposrednom području, nisu otkrili kretanje planeta, ali ih treba upozoriti jer možda dolazi tsunami.

A pametna gradska infrastruktura - pojam inteligentne infrastrukture, intelekt već ugrađujemo u pametne zgrade i pametnu infrastrukturu. U stvari, jučer sam parkirao svoj automobil u gradu na novom području gdje se dio grada obnavlja i obnavlja. Ponovo su obavili sve ulice, a na ulicama su senzori, a stvarni brojilo za parkiranje zna da kad se vozim s automobilom, zna da kad se osvježim za ograničenje od dva sata automobil se nije pomaknuo, a zapravo me nije pustio da se napunim i ostanem još dva sata. Morao sam ući u auto, izvući se iz prostora i zatim se povući da ga prevarim kako bih mogao tamo ostati još dva sata. No, ono što je zanimljivo je da ćemo na kraju stići do otkrića da automobil nije samo detektirao automobil koji ulazi u područje kao lokalizirani senzor, već stvari poput optičkih karakteristika gdje će se prepoznavanje primijeniti kamerama koje gledaju moju registarsku tablicu, i to će znati da sam se zapravo upravo izvukao, povukao unutra i prevario, i jednostavno mi neće dopustiti obnovu i krenut ću dalje. A onda će distribuirati te podatke i osigurati da to ne mogu raditi nigdje drugdje, a neprestano izvoditi mrežu. Jer to po prirodi mora postati pametnije, inače ćemo se svi i dalje zavaravati.

Primjer za to sam ustvari osobno živio u tehnologiji vatrozida, kasnih 80-ih i ranih 90-ih, proizvodu koji se zove Check Point FireWall-1. Vrlo jednostavna tehnologija vatrozida pomoću koje smo kreirali pravila i gradili pravilnike i pravila oko određenih stvari, recimo da vrste prometa kroz određene portove i IP adrese i mreže kako bi došli do i jedni od drugih, web promet s jednog mjesta na drugo, od pregledača i klijenta do kraja našeg poslužitelja. Ovaj problem smo riješili tako što smo zapravo izvadili logiku iz samih firewall-a i stvarno je premjestili u ASIC, integrirani krug specifičan za aplikaciju. Kontrolirala je portove u Ethernet sklopkama. Otkrili smo da serveri računala, računala koja smo zapravo koristili kao servere za donošenje odluka kao firewall, nisu bili dovoljno moćni da podnose količinu prometa koja prolazi kroz njih za svako malo pregledavanje paketa. Problem smo riješili pomicanjem logike potrebne za provođenje inspekcije paketa i otkrivanja interneta u mrežne sklopke koje su distribuirane i sposobne da obrađuju količinu podataka koja prolazi kroz mrežnu razinu. Nismo se brinuli o tome na centralnoj razini sa zaštitnim zidovima, premjestili smo ga na sklopke.

Stoga smo proizvođači izgradili sposobnost da gurnemo staze i pravila i pravila u Ethernet sklopku tako da na stvarnoj razini Ethernet porta, a možda i mnogi ljudi u bazenu nisu upoznati s tim jer smo svi sada žive u bežičnom svijetu, ali jednom se sve vrijeme moralo priključiti preko Etherneta. Sada smo na razini Ethernet porta provjeravali pakete kako bismo vidjeli je li paketima uopće dopušteno da se presele u sklopku i na mrežu. Nešto od ovoga, ono što sada rješavamo oko ovog izazova uhvaćanja podataka u mreži, konkretno s IRT uređaja, te ih pregledavamo i radimo analizu na njemu, a vjerojatno i analitiku na njemu u stvarnom vremenu za donošenje odluka o njima. A dio toga je stjecanje uvida u poslovnu inteligenciju i informacije o tome kako ljudi donose bolje odluke i druge analitike i performanse za stvari stroja na stroj gdje uređaji razgovaraju s uređajima i donose odluke.

I to će biti trend koji moramo riješiti u bliskoj budućnosti, jer ako to ne učinimo, jednostavno ćemo završiti s ovom bukom buke. I vidjeli smo u svijetu velikih podataka, vidjeli smo kako se podatkovna jezera pretvaraju u močvare podataka koje tek završimo s bukom koju nismo smislili kako riješiti analitiku obrade u centraliziranom. moda. Ako ne riješimo ovaj problem, prema mom mišljenju, s IoT-om ćemo odmah dobiti rješenje platforme i završit ćemo na vrlo, vrlo lošem mjestu.

I imajući to na umu, završit ću sa svojim stavom koji je taj da vjerujem da je jedna od najvećih promjena koja se događa u velikom prostoru podataka i analitike pokrenuta trenutnom potrebom da se reagira na utjecaj Interneta. stvari o analitikama s velikim količinama i u stvarnom vremenu, po tome što je potrebno da je premjestimo u mrežu, a zatim na kraju na rub mreže samo da bismo se mogli nositi s njezinom opsegom, samo da bismo je obradili. I na kraju, nadamo se, smo inteligenciju u mrežu i rub mreže postavili u sastajalište i govorili model da zapravo možemo njime upravljati i steći uvid u stvarnom vremenu i iz njega dobivati ​​vrijednost. I s tim ću putem proslijediti našem gostu i vidjeti gdje nas ovaj razgovor vodi.

Shawn Rogers: Puno hvala. Ovo je Shawn Rogers iz Dell Statistice, a za početak, u potpunosti se slažem sa svim glavnim temama koje su se ovdje dotakle. I Rebecca, započeli ste s idejama o, znate, ovi podaci nisu novi, a meni je nevjerojatno koliko vremena i energije trošimo na raspravu o podacima, podacima, podacima IoT-a. I svakako je relevantno, znate, Robin je napravio poentu, čak i ako radite nešto stvarno jednostavno i kucate u termostat jednom u sekundi, to znate, radite to 24 sata dnevno i zapravo imate znate neke zanimljive izazove s podacima. Ali, znate, na kraju - i mislim da puno ljudi u industriji ovako govori o podacima - da zapravo i nije sve toliko zanimljivo i, Rebekino poanta, to je dugo bilo dugo, ali u prošlosti ga nismo mogli dobro iskoristiti. I mislim da napredna analitička industrija i BI industrija općenito počinju okretati glavu prema IoT-u. I Dez, na kraju, ovo je dio ili jedna od izazovnih točaka krajolika velikih podataka, mislim da je vrlo istinito. Mislim da su svi vrlo uzbuđeni što možemo učiniti s ovom vrstom podataka, ali istodobno, ako ne možemo smisliti kako primijeniti uvid, poduzeti mjere i, znate, dobiti analitiku gdje su podaci, mislim da imat ćemo izazove za koje ljudi ne vide da im stvarno dolaze.

S tim u vezi, u naprednom analitičkom prostoru veliki smo obožavatelji onoga što mislimo da se može dogoditi s IoT podacima, pogotovo ako na to primjenjujemo analitiku. I tu je puno informacija na ovom dijapozitivu i pustit ću sve da love i kljucaju, ali ako pogledate različite sektore poput maloprodaje do krajnje desne strane, vidi se njihova prilika koja proizlazi iz mogućnosti da budu inovativniji ili imaju nešto ušteda troškova ili optimizacija procesa ili poboljšanja vrlo su važni i za njih se vidi mnogo slučajeva korištenja. Ako pogledate, znate, slijeva udesno preko dijapozitiva, vidjet ćete kako svaka od tih pojedinačnih industrija zahtijeva nove mogućnosti i nove mogućnosti za razlikovanje za sebe kada primjenjuju analitiku na IoT. I mislim da je suština, ako namjeravate ići niz taj put, ne morate se brinuti samo o podacima, kao što smo raspravljali, i arhitekturi, već morate pogledati i kako najbolje primijenite analitiku na nju i tamo gdje se analitika treba odvijati.

Znaš, mnogi od današnjih poziva, Robin i ja smo se poznavali jako dugo i vodili bezbroj razgovora o tradicionalnim arhitekturama u prošlosti, onima oko centraliziranih baza podataka ili skladišta podataka o poduzećima i slično, i kao što smo mi ' pronašli smo u posljednjem desetljeću ili na taj način radimo prilično dobar posao na rastezanju ograničenja te infrastrukture. I nisu tako postojani ili jaki kao što bismo željeli da budu danas kako bi podržali sve sjajne analitike koje primjenjujemo na informacije i, naravno, informacije narušavaju i arhitekturu, brzina podataka, količina podataka itd. definitivno produžuju ograničenja nekih naših tradicionalnijih pristupa i strategija ovakvoj vrsti rada. I zato mislim da nekako počinje pozivati ​​na potrebu da kompanije zauzmu agilnije i možda fleksibilnije gledište ovoga i to je dio, valjda, volio bih razgovarati o malo oko IoT strane.

Prije nego što to učinim, odvojit ću trenutak samo da pustim sve na poziv, da vam kažem malo o tome što je Statistica i što radimo. Kao što možete vidjeti na naslovu ovog slajda, Statistica je prediktivna analitika, veliki podaci i vizualizacija za IoT platformu. Sam proizvod star je nešto više od 30 godina i natječemo se s ostalim liderima na tržištu koji ste vjerojatno poznati po mogućnosti da u podatke možete primijeniti prediktivnu analitiku, naprednu analitiku. Vidjeli smo priliku da proširimo domet gdje polažemo analitiku i počnemo raditi na nekim tehnologijama koje su nas prilično pozicionirale kako bismo iskoristili ono što su i Dez i Robin razgovarali danas, a to je novi pristup i kamo ćete staviti analitiku i kako ćete je stopiti s podacima. Uz tu stranu dolaze i druge stvari s kojima se morate moći nositi s platformom, a kao što sam spomenula, Statistica je na tržištu već duže vrijeme. Vrlo smo dobri u stvarima spajanja podataka i mislim da, znate, danas nismo previše razgovarali o pristupu podacima, ali o tome da možemo pristupiti raznim mrežama i dobiti vaše prave podatke na pravo vrijeme postaje sve zanimljivije i važnije za krajnje korisnike.

I na kraju, ovdje ću prokomentirati još jedan dio, jer je Dez napravio dobar stav o samim mrežama, imajući određenu razinu kontrole i sigurnosti nad analitičkim modelima u vašem okruženju i kako se pripisuju postajanju podataka vrlo važnim. Kad sam se uvukao u ovu industriju prije nekoliko godina - mislim da je bilo gotovo 20 - u ovom trenutku - kada smo razgovarali o naprednoj analitici, to je bio na vrlo kuriran način. Samo je nekoliko ljudi u organizaciji imalo svoje ruke, oni su je rasporedili i ljudima dali odgovor prema potrebi ili pružili uvide prema potrebi. To se zaista mijenja i ono što vidimo je mnogo ljudi koji su radili na jedan ili više raznolikih i fleksibilnijih načina da dođu do podataka, primjenjujući sigurnost i upravljanje podacima, a zatim bi mogli surađivati ​​na njima. To su neke od važnih stvari koje Dell Statistica gleda.

Ali želim zaviriti u temu koja je malo bliža današnjem naslovu koji je, kako trebamo baviti se podacima koji dolaze s interneta stvari i što biste mogli tražiti kada tražite drugačija rješenja. Klizač koji sam upravo sada ustao pred vama nekako je tradicionalno gledanje i Dez i Robin su se nekako dotakli ove, ideje o razgovoru sa senzorom, bilo da je to automobil ili toster ili vjetrenjača ili šta već imate, a zatim te podatke premjestite iz izvora podataka preko vaše mreže natrag u centraliziranu vrstu konfiguracije, kao što je Dez spominjao. A umrežava se i mnoge tvrtke ulaze u prostor IoT-a izvorno počinju raditi s tim modelom.

Druga stvar koja se pojavila, ako pogledate prema dnu slajda, je ova ideja o uzimanju drugih tradicionalnih izvora podataka, proširivanju IoT podataka, a zatim u ovoj vrsti jezgre, bilo da je vaša jezgra podatkovni centar ili ona možda je u oblaku, zapravo nije važno, uzeli biste proizvod poput Statistice i zatim u njemu primijenili analitiku, a zatim te uvide pružili potrošačima s desne strane. Mislim da su u ovom trenutku to ulozi na tablici. To morate raditi i morate imati dovoljno otvorenu arhitekturu za naprednu analitičku platformu i razgovarati sa svim tim, vrstama različitih izvora podataka, svim tim senzorima i svim tim različitim odredištima gdje imate podatke. I mislim da je to nešto što morate biti u mogućnosti učiniti i mislim da ćete smatrati istinom da je puno lidera na tržištu u stanju učiniti ove vrste stvari. Ovdje u Statistici nekako razgovaramo o ovome kao o temeljnoj analitici. Idi, prikupi podatke, vrati ih u jezgru, obradi ih, dodaj više podataka ako je potrebno ili ako je povoljno, napravi analitiku, a zatim podijeli te informacije za djelovanje ili na uvid.

I zato mislim da su to sigurno sa stajališta funkcije, vjerojatno bismo se svi složili da je, to znate, ovo nužna potreba i svi to trebaju raditi. Tamo gdje počinje postajati zanimljivo, to je gdje imate ogromne količine podataka, što dolazi iz različitih izvora podataka, poput IoT senzora, kao što sam već spomenuo, bilo da je riječ o automobilu ili sigurnosnoj kameri ili proizvodnom procesu, to počinje postati prednost u mogućnosti obavljanja analitike tamo gdje se podaci stvarno proizvode. I prednost većine ljudi, mislim da, kada počnemo pomicati analitiku iz jezgre prema rubu, je ta sposobnost da se razbacuju neki izazovi podataka koji se događaju, a Dez i Robin će to vjerojatno komentirati na kraju danas, ali mislim da morate biti u mogućnosti nadzirati i poduzeti mjere na podacima na rubu tako da nije uvijek potrebno sve te podatke premjestiti na svoju mrežu. Robin je o tome govorio u svojoj, svojevrsnoj, arhitektonskoj slici koju je nacrtao, gdje imate sve ove različite izvore, ali obično postoji neka točka združivanja. Točka agregacije koju prilično često vidimo nalazi se ili na razini osjetnika, ali još češće na razini gateway-a. A ovi pristupnici postoje kao svojevrsni posrednik u protoku podataka iz izvora podataka prije nego što se vratite na jezgru.

Jedna od mogućnosti koje je Dell Statistica iskoristio je naša mogućnost izvoza modela s naše centralizirane napredne analitičke platforme kako bismo mogli uzeti model, a zatim taj model izvršiti na rubu na nekoj drugoj platformi, poput gateway-a ili iznutra baze podataka, ili što imate. I mislim da je fleksibilnost koju nam pruža zapravo zanimljiva točka današnjeg razgovora, je li to danas u vašoj infrastrukturi? Jeste li sposobni premjestiti analitiku do mjesta gdje podaci žive nasuprot samo uvijek premještanja podataka do mjesta na kojem žive vaše analitike? I to je nešto na što se Statistica fokusira već duže vrijeme, a kad pogledate slajdove vidjet ćete da tamo postoji neka druga tehnologija od naše sestrinske tvrtke, Dell Boomi. Dell Boomi je platforma za integraciju podataka i integraciju aplikacija u oblaku i mi zapravo koristimo Dell Boomi kao uređaj za trgovinu kako bi naše modele prebacili iz Dell Statistice, preko Boomija i izvan ruba uređaja. I mislimo da je ovo agilni pristup kojem će kompanije biti zahtjevne, koliko im se sviđa verzija koju sam vam pokazao prije malo vremena, a to je vrsta srži ideje premještanja podataka sa senzora sve do vrha centar, u isto vrijeme tvrtke će htjeti to moći raditi na način na koji ovdje nekako ocrtavam. A prednosti za to čine neke od stvari koje su Robin i Dez napravili, a to je da li možete donijeti odluku i poduzeti korake brzinom svog poslovanja? Možete li premještati analitiku s jednog mjesta na drugo i možete uštedjeti vrijeme, novac i energiju i složenost neprestanog premještanja tih rubnih podataka natrag u srž.

Sada sam prvi koji će reći da će neki rubni podaci uvijek biti dovoljno visoki, gdje bi imalo smisla pohranjivati ​​te podatke i čuvati ih i vraćati ih na svoju mrežu, ali koja će vam rubna analitika omogućiti da je li sposobnost donošenja odluka brzinom kojom podaci zapravo dolaze, zar ne? Da biste mogli primijeniti uvid i radnju brzinom tamo gdje je najveća moguća vrijednost. I mislim da je to nešto što ćemo svi tražiti kad je riječ o korištenju napredne analitike i IoT podataka, ovo je prilika za kretanje brzinom poslovanja ili brzinom kojom klijent zahtijeva. Mislim da je naše stajalište da mislim da trebate raditi oboje. I mislim da će vrlo brzo i vrlo brzo, budući da sve više kompanija gleda raznovrsne skupove podataka, posebno one s IoT-ove strane, početi gledati prodajni prostor i tražiti što je Statistica sposobna učiniti. Što znači uvesti model u srži, kao što to već tradicionalno radimo već dugi niz godina, ili ga rasporediti na platformama koje su možda možda netradicionalne, poput IoT gateway-a, i zapravo moći postići rezultat i primijeniti analitičke podatke na rubu podataka. I mislim da tu dolazi do uzbudljivog dijela ovog razgovora. Budući da smo sposobni primijeniti analitičar na rubu u trenutku kad podaci odlaze od senzora, omogućava nam da djelujemo onoliko brzo koliko trebamo, ali također nam omogućava da odlučimo, trebaju li ti podaci odmah vratiti se do srži? Možemo li to ovdje dostaviti, a zatim poslati u komadima i dijelovima i raditi kasnije na daljnjoj analizi? To je ono što vidimo puno naših vodećih kupaca.

Način na koji Dell Statistica to radi je da mi to možemo iskoristiti, pa recimo na primjer izgradite neuronsku mrežu u Statistici, a neuronsku mrežu želite staviti negdje drugdje u vašoj podatkovnoj cjelini. Imamo mogućnost ispisa tih modela i svih jezika koje ste primijetili u desnom kutu - Java, PPML, C i SQL i tako dalje, također uključujemo Python i također možemo izvoziti naše skripte - i dok pomičete tu platformu koja je centralizirana, tada taj model ili taj algoritam možete implementirati gdje god vam treba. I kao što sam već spomenuo, koristimo Dell Boomi da ga stavimo i parkiramo na mjestu gdje ga trebamo pokrenuti, a zatim možemo vratiti rezultate, ili možemo pomoći u vraćanju podataka, ocjenjivanju podataka i poduzimanju akcija korištenjem našeg pravila, Sve su te stvari postale nekako važne kada počnemo gledati ovu vrstu podataka i razmišljamo iznova.

Ovo je nešto što će većina vas na telefonu morati učiniti jer će to postati skupo i oporezivati ​​vašu mrežu, kao što je Dez spomenuo, kako biste premjestili podatke s lijeva od tih dijagrama desno od tih dijagrama vrijeme. Ne zvuči puno, ali vidjeli smo proizvodne kupce sa deset tisuća senzora u svojim tvornicama. A ako u svojoj tvornici imate deset tisuća senzora, čak i ako samo ove sekunde radite neke vrste testova ili signala, govorite o osamdeset i četiri tisuće redaka podataka iz svakog od tih pojedinačnih senzora dnevno. I tako se podaci definitivno gomilaju i Robin je to spomenuo. Unaprijed sam spomenuo nekoliko industrija u kojima vidimo kako ljudi rade prilično zanimljive stvari pomoću našeg softvera i IoT podataka: automatizacija zgrada, energija, komunalije je zaista važan prostor. Vidimo da se mnogo radi na optimizaciji sustava, čak i servisu kupaca i, naravno, cjelokupnom radu i održavanju, unutar energetskih postrojenja i zgrade za automatizaciju. A ovo su neki od slučajeva upotrebe za koje vidimo da su prilično moćni.

Prije smo radili analitiku, pretpostavljam da je pojam skovan. Kao što sam napomenuo, u Statistici imamo duboke korijene. Tvrtka je osnovana prije gotovo 30 godina, tako da imamo kupce koji se vraćaju već dosta vremena koji integriraju IoT podatke sa svojom analitikom i već neko vrijeme. A Alliant Energy je jedan od naših slučajeva korištenja ili referentnih kupaca. I možete zamisliti problem koji energetska tvrtka ima s fizičkom postrojenjem. Skaliranje izvan zidova fizičkih postrojenja je teško, pa energetske tvrtke poput Allianta traže načine kako optimizirati svoj energetski učinak, u osnovi poboljšavajući svoj proizvodni proces i optimizirajući ga na najvišu razinu. A oni koriste Statisticu za upravljanje peći u postrojenjima. A za sve nas koji se vraćamo u svoje rane dane na nastavi nauke svi znamo da u peći nastaje toplina, toplina stvara paru, turbine se vrte, dobivamo struju. Problem za tvrtke poput Allianta je zapravo optimiziranje načina na koji se stvari zagrijavaju i izgaraju unutar tih velikih ciklonskih peći. I optimiziranje proizvodnje kako bi se izbjegli dodatni troškovi zagađenja, istiskivanje ugljika i slično. I tako morate biti u mogućnosti nadzirati unutrašnjost jedne od tih ciklonskih peći sa svim tim uređajima, senzorima, a zatim uzimati sve te podatke senzora i kontinuirano mijenjati energetski proces. A to je upravo ono što Statistica radi za Alliantu od otprilike 2007. godine, prije nego što je čak i izraz IoT bio super popularan.

Na Rebekinu poantu, podaci sigurno nisu novi. Sposobnost za obradu i pravilno korištenje zaista se događa tamo gdje su uzbudljive stvari. Danas smo malo razgovarali o zdravstvenoj zaštiti u prethodnom pozivu i primjećujemo sve vrste aplikacija za rad ljudi nalik boljoj njezi pacijenata, preventivnom održavanju, upravljanju lancem opskrbe i operativnoj učinkovitosti zdravstvene zaštite. A to je u tijeku i postoji puno različitih slučajeva upotrebe. Ono na što smo u Statistici ponosni ovdje je naš klijent Shire Biopharmaceuticals. A Shire proizvodi specijalne lijekove za zaista teško liječene bolesti. A kada za svoje kupce kreiraju seriju lijekova, to je izuzetno skup proces i taj izuzetno skup proces također zahtijeva vrijeme. Kad razmišljate o proizvodnom procesu dok vidite, izazovi su objedinjavanje svih podataka, dovoljno fleksibilnost na različite načine unošenja podataka u sustav, provjeravanje informacija i mogućnost prediktivnog načina na koji možemo pomoći tom kupcu. I procese koji su izvlačili većinu informacija iz naših proizvodnih sustava, naravno i uređaja i senzora koji pokreću ove proizvodne sustave. Odličan je slučaj za to kako kompanije izbjegavaju gubitak i optimiziraju svoje proizvodne procese koristeći kombinaciju senzorskih podataka, IoT podataka i redovitih podataka iz svojih procesa.

Pa znate, dobar primjer gdje proizvodnja, a posebno visokotehnološka proizvodnja, koristi zdravstvenoj industriji oko ove vrste rada i podataka. Mislim da bih htio još nekoliko stvari napomenuti prije nego što ga zamotam i vratim Dezu i Robinu. Ali znate, mislim da je ideja da ćete moći gurnuti svoj analitičar bilo gdje u svom okruženju postati vrlo važna za većinu tvrtki. Priključivanje tradicionalnom formatu ETL-ovih podataka iz izvora natrag do središnjih lokacija uvijek će imati svoje mjesto u vašoj strategiji, ali to ne bi trebalo biti vaša jedina strategija. Danas morate zauzeti mnogo fleksibilniji pristup stvarima. Da biste primijenili sigurnost koju sam spomenuo, izbjegavajte oporezivanje vaše mreže, da biste mogli upravljati i filtrirati podatke budući da dolaze s ruba i odrediti koje podatke vrijedi čuvati dugoročno, koje podatke vrijedi prenijeti na našu mrežu ili koje podatke tek treba analizirati u trenutku kad su stvoreni kako bismo donosili najbolje moguće odluke. To je svugdje i bilo gdje analitički pristup nešto što smo pri srcu Statistici priuštili i to je nešto u čemu smo vrlo iskusni. I vraća se na jedan od tih dijapozitiva koji sam ranije spomenuo, mogućnost izvoza svojih modela na raznim jezicima kako bi se mogli uskladiti i uskladiti s platformama na kojima se podaci stvaraju. I onda naravno imati distribucijski uređaj za one modele, što je također nešto što donosimo za stol i zbog čega smo jako uzbuđeni. Mislim da je danas razgovor, ako se stvarno ozbiljno bavimo ovim podacima koji su u našim sustavima već duže vrijeme i željeli bismo pronaći konkurentnu prednost i inovativni kut da to iskoristimo, morate primijeniti neke tehnologije koja vam omogućava da se udaljite od nekih onih restriktivnih modela koje smo koristili u prošlosti.

Opet, moja poanta je da ako to želite učiniti IoT, mislim da to morate biti u srži, i unijeti podatke te ih uskladiti s drugim podacima i obaviti svoju analitiku. Ali isto tako koliko je važno ili možda još važnije, morate imati tu fleksibilnost da biste analitičar stavili na podatke i premjestili analitičar iz središnje strane vaše arhitekture na rub za prednosti koje sam spomenula prije. To je malo o tome tko smo i što radimo na tržištu. Izuzetno smo uzbuđeni zbog IoT-a, mislimo da definitivno dolazi do starenja i da postoje velike mogućnosti da svi ovdje utječu na svoju analitiku i kritične procese s ovom vrstom podataka.

Rebecca Jozwiak: Shawn, hvala puno, bila je to zaista fantastična prezentacija. I znam da će Dez vjerojatno umrijeti da vam postavi nekoliko pitanja, pa Dez, pustit ću vas prvo.

Dez Blanchfield: Imam milijun pitanja, ali ja ću sadržati sebe jer znam da će i Robin imati. Jedna od stvari koju vidim široko i otvoreno je pitanje koje se postavlja i stvarno želim steći uvid u vaše iskustvo s obzirom na to da ste u srcu stvari. Organizacije se bore s izazovom, a izgleda da su neke od njih upravo pročitale sličnosti Klausa Schwaba "Četvrta industrijska revolucija", a zatim su imale napad panike. A oni koji ovu knjigu nisu upoznati, u biti je to uvid gospode, Klausa Schwaba, za koji mislim da je profesor, koji je od pamtivijeka osnivač i izvršni predsjednik Svjetskog ekonomskog foruma, a knjiga je u biti o cijeli taj sveprisutni internet eksplozija stvari i nekih utjecaja na svijet općenito. Organizacije s kojima razgovaram nisu sigurne trebaju li preraditi postojeće okruženje ili uložiti sve u izgradnju svih novih okruženja, infrastrukture i platformi. Vidite li i u Dell Statistici, kako ljudi preuređuju trenutna okruženja i razmještaju vašu platformu u postojeću infrastrukturu ili ih vidite kako preusmjeravaju fokus na izgradnju nove infrastrukture i pripremaju se za ovo potonuće?

Shawn Rogers: Znate, imali smo priliku opsluživati ​​obje vrste kupaca i biti na tržištu sve dok mi imamo, te će vam se mogućnosti nekako širiti. Imamo kupce koji su stvorili potpuno nove tvornice u posljednjih nekoliko godina i opremili ih senzorskim podacima, IoT-om, analitičkim podacima od samog kraja, što se završava tijekom cijelog procesa. Ali moram reći da su većina naših kupaca ljudi koji već neko vrijeme rade ovu vrstu posla, ali su prisiljeni ignorirati te podatke. Znate, Rebecca je točku postavila prednje strane - to nisu novi podaci, ova vrsta podataka je dugo bila dostupna u mnogo različitih formata, ali gdje je problem bio u povezivanju s njom, premještajući ga i dovodeći ga negdje gdje biste mogli učiniti nešto pametno s njim.

I zato bih rekao da većina naših kupaca danas gleda ono što imaju, a Dez, prije ste to iznijeli, da je to dio te velike revolucije podataka i mislim da je ono što se zapravo radi, je li to sve revolucija podataka, zar ne? Ne moramo više zanemariti određene podatke o sustavu ili proizvodne podatke ili podatke o automatizaciji građevina, sada imamo prave igračke i alate da ih nabavimo, a zatim i s njima pametno raditi. I mislim da u ovom prostoru postoji puno pokretača koji su to i učinili, a neki od njih su tehnološki. Znate, velika infrastrukturna rješenja podataka poput Hadoopa i drugih učinila su malo skupljim i malo lakšim razmišljanju o stvaranju podatkovnog jezera te vrste informacija. A sada gledamo oko poduzeća da idemo: "Hej, imamo analitiku u svom proizvodnom procesu, ali da li bi se oni poboljšali ako bismo mogli dodati neki uvid u te procese?" I to je, mislim, ono što većina rade naši kupci. To nije toliko stvaranje od temelja, već povećavanje i optimiziranje analitike koju već imaju s novim podacima.

Dez Blanchfield: Da, događaju se neke uzbudljive stvari u nekim od najvećih industrija koje smo vidjeli, a koje ste spomenuli, o snazi ​​i komunalnim uslugama. Zrakoplovstvo upravo prolazi kroz ovaj bum gdje je jedan od mojih najdražih uređaja o kojima stalno govorim, Boeing 787 Dreamliner, i sigurno Airbusov ekvivalent, A330 krenuo istom rutom. Bilo je poput šest tisuća senzora u 787 kad je prvi put pušten, a mislim da sada govore o petnaest tisuća senzora u novoj verziji. I zanimljivo je razgovarati s nekim ljudima koji su na tom svijetu bila da je ideja o stavljanju senzora u krilo i tako dalje, i nevjerojatna stvar 787 na dizajnerskoj platformi je ta što su, opet, izmislili sve avion. Poput krila, na primjer, kad zrakoplov uzleti, krila se savijaju do dvanaest i pol metara. Ali u ekstremima se krila mogu saviti na vrhu do 25 metara. Ova stvar izgleda kao ptica koja leprša. Ali ono što nisu imali vremena popraviti je inženjering analitike svih tih podataka, pa imaju senzore koji čine da LED svjetla trepere zeleno i crveno ako se dogodi nešto loše, ali zapravo ne završavaju dubokim uvidom u stvarno vrijeme. A oni također nisu riješili problem kako premjestiti količinu podataka, jer u domaćem zračnom prostoru u SAD-u svakodnevno ima 87.400 letova. Kad svaki zrakoplov dohvati otkup 787 Dreamliner-a, to je 43 petabajta podataka dnevno, jer ti zrakoplovi trenutno stvaraju oko pola terabajta podataka. A kad pomnožite 87.400 letova dnevno u SAD-u s pet ili pola terabajta, na kraju imate 43, 5 petabajta podataka. Fizički to ne možemo pomicati. Dakle, dizajnom moramo analitiku gurnuti u uređaj.

Ali jedna od stvari koja je zanimljiva kada pogledam cijelu ovu arhitekturu - i želim vidjeti što mislite o ovome - jesmo li krenuli prema glavnom upravljanju podacima, vrstama, prvim principima upravljanja podacima, povlačenju? sve na središnju lokaciju. Imamo baze podataka, a zatim stvaramo malo ribnjaka, ako želite, dijelove onoga na čemu radimo analitiku, ali distribucijom do ruba, jednu od stvari koja se stalno pojavljuje, posebno od ljudi iz baze podataka i upravitelja podataka ili ljudi koji se bave upravljanjem informacijama, što se događa kad imam puno distribuiranih minijaturnih minijaturnih podataka? Kakve su se stvari primijenile na ovo razmišljanje s obzirom na rubnu analitiku u vašem rješenju, s obzirom na to da bi, tradicionalno, sve dolazilo centralno s jezerom podataka, a sad završimo s ovim malim lokvama podataka svugdje, i iako možemo vršite analitiku na njima lokalno kako biste dobili neki lokalni uvid, koji su izazovi s kojima ste se suočili i kako ste to riješili s tim podijeljenim skupom podataka, a posebno kada dobijete mikrokozmose podatkovnih jezera i raspoređenih područja?

Shawn Rogers: Pa mislim da je to jedan od izazova, zar ne? Kako odlazimo od, znate, vraćanja svih podataka natrag u središte mjesta ili u osnovni analitički primjer koji sam dao, a zatim radimo distribuiranu verziju, je da završite sa svim tim malim silosima, zar ne? Baš kao što ste prikazali, zar ne? Malo rade, rade se neke analitike, ali kako ih vratiti natrag? I mislim da će ključ biti orkestracija kroz sve to i mislim da ćete se složiti sa mnom, ali ja sam sretan ako ne, mislim da smo prilično gledali tu evoluciju neko vrijeme.

Vraćajući se danima naših prijatelja, gospodina Inmon-a i gospodina Kimballa, koji su svima pomogli u arhitekturi ulaganja u njihovo rano skladište podataka, s tim što smo napustili ovaj centralizirani model odavno. Usvojili smo ovu novu ideju kako bismo podacima omogućili da pokažu njezinu gravitaciju tamo gdje je najbolje da se nalaze unutar vašeg ekosustava i uskladili podatke s najboljom mogućom platformom za najbolji mogući ishod. I počeli smo nekako trošiti, mislim, više orkestrirani pristup našem ekosustavu kao sveobuhvatan način vršenja stvari, jer tamo pokušavamo poravnati sve te komade odjednom. Koju vrstu analitičkog ili radnog posla radim s podacima, kakvu vrstu podataka, to će vam pomoći diktirati gdje trebaju živjeti. Gdje se proizvodi i kakvu gravitaciju imaju podaci?

Znate, vidimo mnogo ovih velikih primjera podataka gdje ljudi govore o jezerima s podacima od 10 i 15 petabajta. Pa, ako imate podatkovno jezero koje je toliko veliko, vrlo je nepraktično da ga premještate i tako morate biti u mogućnosti da u njega unesete analitiku. Ali kad to učinite, do srži vašeg pitanja, mislim da to postavlja puno novih izazova svima da orkestriraju okoliš i primijene upravljanje i sigurnost, i razumiju što treba učiniti s tim podacima kako bi ga izliječili i iz nje izvući najveću vrijednost. I da budem iskren s vama - volio bih čuti vaše mišljenje ovdje - mislim da smo tamo rani dani i mislim da treba još puno toga dobrog posla obaviti. Mislim da se programi poput Statistice usredotočuju na to da više ljudi pristupi podacima. Definitivno smo usredotočeni na ove nove osobe poput znanstvenika podataka o građanima koji žele preusmjeriti analitičku analizu na mjesta u organizaciji koja možda nije bila prije. I mislim da su to neki rani dani oko toga, ali mislim da će luk zrelosti morati pokazati visoku razinu ili orkestraciju i usklađivanje između tih platformi, i razumijevanje onoga što je na njima i zašto. A to je prastari problem za sve nas ljude.

Dez Blanchfield: Zaista je tako i potpuno se slažem s tobom u vezi s tim i mislim da je sjajna stvar koju danas čujemo ovdje barem prednji kraj problema sa zapravo prikupljanjem podataka na, pretpostavljam, razini gatewaya na rubu mreže i mogućnost analize analitike u tom je trenutku u osnovi riješena. Sada nas oslobađa da zapravo počnemo razmišljati o sljedećem izazovu, koji je distribucija podatkovnih jezera. Hvala vam puno na tome, bila je to fantastična prezentacija. Zaista cijenim priliku da razgovaram s tobom o tome.

Sad ću proslijediti Robina jer znam da ga ima, a tada je i Rebecca dobila dugi popis sjajnih pitanja publike nakon Robina. Robin?

Dr. Robin Bloor: Dobro. Shawn, volio bih da kažete još malo i ne pokušavam vam pružiti priliku da to reklamirate, ali zapravo je jako važno. Zanima me znati u kojem je trenutku Statistica zapravo stvorila sposobnost izvoza modela. Ali isto tako, volio bih da kažete nešto o Boomi, jer sve što ste do sada rekli o Boomi je da je to ETL, a doista ETL. Ali to je zapravo prilično sposoban ETL i za vrstu vremena o kojem govorimo, a neke od situacija o kojima mi ovdje razgovaramo, to je vrlo važna stvar. Možete li razgovarati o te dvije stvari za mene?

Shawn Rogers: Naravno, da, apsolutno mogu. Znate, naš pokret u tom smjeru sigurno je bio iteravan i bio je svojevrsni korak po korak. Upravo se pripremamo da ovaj tjedan pokrenemo verziju 13.2 Statistice. A ima najnovija ažuriranja svih mogućnosti o kojima danas govorimo. No, vratimo se na verziju 13, prije godinu dana, listopad, najavili smo našu sposobnost izvoza modela s naše platforme i tada smo je nazvali NDAA. Akronim je označavao Native Distributed Analytics Architecture. Ono što smo učinili je da uložimo puno vremena, energije i usredotočenosti na otvaranje naše platforme s mogućnošću da je koristimo kao središnji zapovjedni centar za naprednu analitiku, ali i da se tamo rasporedimo. I prva mjesta, Robine, koje smo razmjestili napravili smo stvarno, stvarno sjajan dodatak platformi oko strojnog učenja. I tako smo imali mogućnost implementacije od Statistice do Microsoftovog Azure Clouda kako bi se snaga Azure iskoristila za strojno učenje, kao što znate, vrlo je intenzivno i to je sjajan način za korištenje oblačnih tehnologija. I tako je to bilo prvo zalogaj.

Sada smo izvozili naše modele u Azure i koristili Azure da bi ih pokrenuli, a zatim podatke ili rezultate poslali natrag na platformu Statistica. A onda smo prešli na druge jezike iz kojih smo željeli moći izvoziti, a jedan od njih je Java, otvara nam vrata da bismo sada počeli izvoziti naše modele prema drugim lokacijama poput Hadoopa, pa je tada dao i mi tamo igramo.

I na kraju, fokusirali smo se na to da naše modele s tim izdanjem možemo iznijeti u baze podataka. I tako, to je bila prva iteracija i da budem iskren s vama, krajnja igra je bila IoT, ali još nismo bili tamo s verzijom 13 prošlog listopada. Od tada smo stigli tamo i to ima veze sa svim mogućnostima koje sam upravo spomenuo, ali tada i s nekim transportnim uređajem. I kad se vratimo na Dezovo pitanje, znate, koji je izazov i kako to učiniti kad sve te analitike trčimo? Pa koristimo Boomi kao svojevrsno distribucijsko čvorište i zato jer je u oblaku i zato što je tako moćan, kao što sam već spomenuo, platforma za integraciju podataka, ali je i platforma za integraciju aplikacija i koristi JVM-ove koji nam omogućuju parkirati i raditi na bilo kojem mjestu na kojem možete spustiti Java virtualni stroj. To je ono što je doista otvorilo vrata za sve ove gateway i rubne računalne platforme i rubne poslužitelje, jer svi imaju računar i platformu koja je dostupna za pokretanje JVM-a. A zato što JVM možemo pokrenuti bilo gdje, Boomi je okrenuo biti divna distribucija i pomoću moje riječi iz ranijeg uređaja za orkestraciju.

I ovo postaje sve važnije, jer svi smo, znate, mislim da je avionski scenarij prije minutu bio sjajan, a spomenuo sam, znate, proizvođače poput Shirea koji u jednoj od svojih tvornica imaju deset tisuća senzora, moraju se početi baviti nekim središnjim pristupom naprednoj analitičari u nekom trenutku. Biti ad hoc u vezi s tim više ne djeluje. Nekada je volumen modela i algoritama koje smo izvodili bio minimalan, ali sada je na maksimumu. Tisuće ih je u organizaciji. Dakle, dio naše platforme je temeljen na poslužiteljima i kada imate naš poslovni softver također imate mogućnost podešavanja i ocjenjivanja i upravljanja svojim modelima u okruženju. I to je također dio te orkestracijske stvari. Trebali smo imati sloj, Robin, na mjestu koje ti ne samo da je prvo omogućilo da tamo dobiješ model, već ti je i dalo vodič za ugađanje modela i njihovu stalnu zamjenu, koliko god puta trebaš, jer to nije nešto što možete učiniti ručno. Ne možete hodati oko rafinerije s palčnim pogonom pokušavajući prenijeti modele na pristupnike. Između njega morate imati sustav prijevoza i upravljanja, pa tako kombinacija Statistice i Boomi-a daje to našim kupcima.

Dr. Robin Bloor: Da. Pa, bit ću vrlo kratak, ali, znate, ova izjava dana prije o jezeru podataka i ideji nakupljanja petabajta na bilo kojem mjestu i činjenici da ima gravitaciju. Znate, kada ste počeli razgovarati o orkestraciji, jednostavno me počelo razmišljati o vrlo jednostavnoj činjenici da, značenje, postavljanje podatkovnog jezera koje je na jednom mjestu vrlo veliko, vjerojatno znači da ga u stvari morate sigurnosno kopirati i to vjerojatno znači da ionako morate mnogo podataka premjestiti. Znate, stvarna arhitektura podataka je, po mom mišljenju, mnogo više u smjeru u kojem govorite. Ono što bih ga distribuirao na razumna mjesta, vjerojatno bih rekla stvar. I izgleda da imate vrlo dobru sposobnost za to. Mislim, dobro sam upoznat s Boomi-om, pa je nekako, na ovaj ili onaj način, gotovo nepošteno da to vidim, a možda i publika ne može. Ali Boomi je, po mom mišljenju, toliko bitan u odnosu na ono što radite jer ima mogućnosti aplikacije. I također zato što je stvarnost u tome što ove analitičke proračune ne radite bez da nešto želite iz nekog ili drugog razloga. I Boomi igra ulogu u tome, zar ne?

Shawn Rogers: Da, apsolutno. I kako vam je poznato iz prethodnih razgovora, Statistica u sebi ima potpuno razvijen motor za poslovna pravila. I mislim da je to zaista važno kada se spustimo zašto to radimo. Znate, šalio sam se unaprijed da doista nema razloga raditi IoT osim ako nećete analizirati, koristiti podatke za donošenje boljih odluka ili poduzimanje radnji. Dakle, ono na što smo se fokusirali nije samo mogućnost postavljanja modela vani, već mogućnost označavanja zajedno s njim, skup pravila. Budući da je Boomi toliko robustan u svojim sposobnostima da se stvari premještaju s jednog mjesta na drugo, u Boomi atomu možemo ugraditi i mogućnost aktiviranja, upozoravanja i poduzimanja akcija.

I tako počinjemo dobivati ​​takav sofisticirani prikaz IoT podataka gdje kažemo: "U redu, ove podatke vrijedi slušati." Ali stvarno, znate, znajući da je "svjetlo upaljeno, svjetlo je uključeno, svjetlo je uključeno, svjetlo je uključeno ”nije toliko zanimljivo kao kad se ugasi svjetlo ili kad se detektor dima ugasi ili kad se sve što se događa s našim proizvodnim postupkom ugasi u specifikaciji. Kad se to dogodi, želimo biti u mogućnosti odmah poduzeti korake. A podaci ovdje postaju gotovo sekundarni. Jer nije toliko važno da smo sve te spasili, "u redu je, u redu je, u redu je" signale, ono što je važno jest da primjetimo "Hej, loše je" i odmah smo poduzeli korake. Bilo da je nekome slanje e-pošte ili možemo uključiti stručnost domene ili jesmo li pokrenuli niz drugih postupaka da odmah poduzmemo mjere, bilo da su to korektivne ili kao odgovor na informacije. I mislim da zato morate imati orkestrirani pogled na to. Ne možete se samo fokusirati na algoritme posvuda. Morate ih biti u mogućnosti koordinirati i orkestrirati. Trebate biti u mogućnosti vidjeti kako rade. I stvarno, što je najvažnije, hoću reći, zašto bi dovraga to učinio ako ne možeš dodati priliku da odmah poduzeš nešto protiv podataka?

Dr. Robin Bloor: Dobro, Rebecca, vjerujem da imate pitanja od publike?

Rebecca Jozwiak: Znam. Imam tonu pitanja publike. Shawn, znam da se nisi htio predugo družiti u vrhu sata. Što misliš?

Shawn Rogers: Zadovoljan sam. Samo naprijed. Mogu odgovoriti na nekoliko.

Rebecca Jozwiak: Da vidimo. Znam da je jedna od stvari koju ste spomenuli bila da se IoT nalazi u ranim danima i da ima stupanj zrelosti koji će se trebati održati i to na neki način govori na ovo pitanje koje je jedan od sudionika pitao. Hoće li okvir IPv6 biti dovoljno čvrst, da bi omogućio rast IoT-a u narednih pet ili deset godina?

Shawn Rogers: Oh, pustit ću Deza da odjekne s mojim odgovorom, jer mislim da je on bliži ovoj vrsti informacija koje sam. No, oduvijek mi se činilo da smo na vrlo brzom putu da se sagnemo i razbijemo većinu okvira koji imamo na mjestu. I dok mislim da je dodavanje te nove specifikacije ili smjer u kojem idemo s okvirima IPv6 važno, i to otvara vrata da imamo puno više uređaja i da možemo dati sve što želite dati adresu. Mislim da će sve što čitam i vidim sa svojim kupcima, kao i broj potrebnih adresa, mislim da će u nekom trenutku to uzrokovati još jedan pomak u tom krajoliku. Ali nisam stručnjak za umrežavanje, pa ne mogu reći sto posto da ćemo ga u nekom trenutku slomiti. Ali moje iskustvo mi govori da ćemo u nekom trenutku taj model poremetiti.

Rebecca Jozwiak: Ne bih se iznenadila. Mislim da su okviri svojevrsno probijanje pod težinom svih vrsta stvari. I to je sasvim logično, zar ne? Mislim, ne možete poslati e-poštu pisaćim strojem. Drugi sudionik pita: "Možete li koristiti Hadoop okvir?", Ali pretpostavljam da bih to mogao promijeniti da kažem, kako biste koristili Hadoop okvir za distribuiranu analitiku?

Shawn Rogers: Pa, Robin mi je učinio uslugu postavljajući mi povijesno pitanje, tako da smo od Inačice 13 prije godinu dana za Statisticu imali mogućnost istjerivanja modela iz našeg sustava i u Hadoop. I usko surađujemo sa svim velikim Hadoop okusima. Imamo zaista sjajne priče o uspjehu oko mogućnosti rada s Clouderom kao jednom od glavnih distribucija Hadoopa s kojima radimo. Ali zato što možemo proizvoditi u Javi, to nam omogućava ovu sposobnost da budemo otvoreni i smještamo svoju analitiku bilo gdje. Stavljanje u Hadoop klaster nešto je što radimo na uobičajen i svakodnevan način za mnoge naše kupce. Kratak je odgovor da, apsolutno.

Rebecca Jozwiak: Izvrsno. I samo ću još jednom baciti na vas i pustiti vas da nastavite sa svojim odmorom. Drugi sudionik pita, uz IoT analitiku i strojno učenje, mislite li da se svi podaci trebaju pohraniti u povijesne svrhe i kako će to utjecati na arhitekturu rješenja?

Shawn Rogers: Pa, mislim da ne treba pohraniti sve podatke. Ali mislim da je vrlo zanimljivo imati mogućnost zabave, slušanja bilo kojeg izvora podataka koji želimo u našoj organizaciji, odakle god dolazili. I mislim da su nam promjene koje smo vidjeli na tržištu u posljednjih nekoliko godina omogućile takav pristup stvarnim podacima i čini se da se to zaista isplati. Ali to će biti drugačije za svaku tvrtku i svaki slučaj upotrebe. Znate, kada gledamo zdravstvene podatke, sada postoji puno regulatornih problema, puno pitanja vezanih uz poštivanje zakona zbog kojih trebamo spremiti podatke koje druge tvrtke možda ne razumiju zašto ih treba spremati, zar ne ? Za mnoge naše proizvodne kupce u proizvodnim je procesima naopako biti u stanju povijesno istražiti svoje procese i biti u mogućnosti gledati na velike količine tih podataka kako bi ih naučili i iz njih stvorili bolje modele.

Mislim da će trebati čuvati puno podataka i mislim da danas imamo rješenja koja to čine ekonomičnijim i skalabilnijim. Ali istovremeno mislim da će svaka tvrtka pronaći vrijednost u podacima koje ne moraju čuvati na atomskoj razini, ali oni će htjeti na pravi način analizirati i donositi odluke o tome kako bi potaknuli inovacije unutar njihovo društvo.

Rebecca Jozwiak: Dobro. Ne, publika, danas nisam stigao do svačijeg pitanja, ali proslijedit ću ih Shawnu kako bi vas mogao izravno kontaktirati i odgovoriti na ta pitanja. Ali hvala svima na sudjelovanju. Puno hvala Shawnu Rogersu iz tvrtke Dell Statistica i svim našim analitičarima, Dezu Blanchfieldu i dr. Robinu Blooru. Arhivu možete pronaći ovdje na adresi insideanalysis.com, SlideShare, mi smo ponovo počeli postavljati naše stvari tamo, a mi obnovimo naš YouTube, pa potražite i tamo. Hvala puno ljudi. I s tim ću se oprostiti i vidimo se sljedeći put.

Analiza ruba: napokon ekonomija jota