P:
Zašto je za znanstvenike podataka važno da traže transparentnost?
A:Transparentnost je u osnovi važna za znanstvene projekte i programe strojnog učenja, dijelom i zbog složenosti i sofisticiranosti koja ih pokreće - zato što ti programi „uče“ (generiraju vjerojatne rezultate), a ne slijede unaprijed zadane upute za linearno programiranje i zato što može biti teško razumjeti na koji način tehnologija donosi zaključke. Problem „crne kutije“ algoritama strojnog učenja koji nisu do kraja objasniti ljudima koji donose odluke velik je problem u ovom polju.
Imajući to na umu, mogućnost usvajanja eksplicitnog strojnog učenja ili „objašnjivi AI“ vjerojatno će biti glavni fokus u načinu na koji kompanije nastoje steći talente za znanstvenika podataka. Već DARPA, institucija koja nam je donijela internet, financira višemilijunsku studiju u objašnjavanju AI, nastojeći promovirati vještine i resurse potrebne za stvaranje strojnog učenja i tehnologija umjetne inteligencije, transparentne za ljude.
Jedan od načina da se razmisli je da često postoji „faza pismenosti“ razvoja talenta i „hiperliteracijska faza“. Za znanstvenika s podacima, tradicionalna faza pismenosti bila bi znanje o sastavljanju programa strojnog učenja i stvaranju algoritmi s jezicima kao što je Python; kako konstruirati neuronske mreže i raditi s njima. Stupanj hiperliteracije će biti sposobnost savladavanja AI koji se može objasniti, pružanja transparentnosti u korištenju algoritama strojnog učenja i očuvanja transparentnosti jer ovi programi rade prema svojim ciljevima i ciljevima svojih vodiča.
Drugi način da se objasni važnost transparentnosti u znanosti o podacima jest da skupovi podataka koji se koriste postaju sve sofisticiraniji, a samim tim i više upadljivi u život ljudi. Drugi glavni pokretač objasnjavanja strojnog učenja i znanosti o podacima je Europska opća uredba o zaštiti podataka koja je nedavno primijenjena kako bi se pokušala suzbiti neetička uporaba osobnih podataka. Koristeći GDPR kao testni slučaj, stručnjaci mogu vidjeti kako se potreba za objašnjenjem znanstvenih projekata uklapa u probleme privatnosti i sigurnosti, kao i poslovnu etiku.