Dom Razvoj Zašto je strojna pristranost problem u strojnom učenju?

Zašto je strojna pristranost problem u strojnom učenju?

Anonim

P:

Zašto je strojna pristranost problem u strojnom učenju?

A:

Na ovo pitanje se može odgovoriti na dva različita načina. Prvo, zašto je problem pristranosti strojeva, kao u, zašto postoji u procesima strojnog učenja?

Strojno učenje, iako sofisticirano i složeno, u određenoj je mjeri ograničeno na temelju podataka koje koristi. Izgradnja skupova podataka uključuje svojstvene pristranosti. Baš kao u medijima, gdje propusti i namjerni izbori uključivanja mogu pokazati određenu pristranost, pri strojnom učenju se skupovi podataka koji se koriste moraju ispitati kako bi se utvrdilo kakve pristranosti postoje.

Besplatno preuzimanje: Strojno učenje i zašto je to važno

Na primjer, čest je problem za testiranje tehnologije i procese dizajniranja kako bi ukazali na sklonost jednoj vrsti korisnika prema drugoj. Veliki primjer je nejednakost spolova u svijetu tehnologije.

Zašto se to razlikuje i zašto se to odnosi na strojno učenje?

Zbog nedostatka postojećih žena u okruženju za testiranje može se dovesti do proizvedene tehnologije koja ženskoj publici manje odgovara. Način na koji neki stručnjaci to opisuju jest da bez postojećeg testiranja na ženama krajnji proizvod možda neće prepoznati unos ženskih korisnika - možda neće imati alate za prepoznavanje ženskog identiteta ili za adekvatan rad sa unosom žena.

Isto vrijedi za različite etničke skupine, ljude različitih religija ili bilo koju drugu vrstu demografije. Bez pravih podataka algoritmi strojnog učenja neće raditi ispravno za određeni korisnički skup, tako da podaci uključivanja moraju biti namjerno dodani u tehnologiju. Umjesto da uzimaju samo primarne skupove podataka i pojačavaju inherentnu pristranost, ljudi koji se bave problemom moraju stvarno riješiti problem.

Drugi primjer je stroj za strojno učenje koji uzima podatke o poslu i plaćama i pljuje rezultate. Ako taj inherentni skup podataka nije analiziran, stroj će pojačati pristranost. Ako primijeti da muškarci drže veliku većinu izvršnih poslova, a proces strojnog učenja uključuje filtriranje kroz sirovi skup podataka i vraćanje odgovarajućih rezultata, vratit će se rezultati koji pokazuju mušku pristranost.

Drugi dio pitanja uključuje zašto je ta pristranost toliko štetna. Bez odgovarajućeg nadzora i testiranja, nove tehnologije mogu naškoditi, a ne pomoći našem osjećaju uključenosti i jednakosti. Ako se predstavi novi tehnološki proizvod koji prepoznaje lica sa svijetlijom kožom, ali ne tamnije kože, to može dovesti do eskalacije etničkih tenzija i osjećaja da predmetna tvrtka nije osjetljiva na različitost. Ako algoritam strojnog učenja reproducira i povećava pristranost u skupovima podataka, umjetna inteligencija će dodati svoj glas ljudskim glasovima i ljudskim tendencijama koje već postoje u društvenom sustavu i favoriziraju jednu skupinu ljudi nad drugom.

Najbolji način da se riješite toga je pažljivo pogledati temeljne skupove podataka, upotrijebiti odabir značajki, dodati varijabilni unos i sami manipulirati sirovim skupima podataka te povećati stvarnu snagu strojnog učenja s namjernim ljudskim izrađivanjem podataka kako bi dobili rezultat koji donosi veliku analitičku snagu, ali i neke od tih ljudskih uvida koji računala još ne mogu ponoviti.

Zašto je strojna pristranost problem u strojnom učenju?