P:
Zašto je bilježenje podataka važno u nekim projektima strojnog učenja?
A:Bilježenje podataka važno je u strojnom učenju jer u mnogim slučajevima olakšava rad programa strojnog učenja.
To ima veze s razlikom između strojnog učenja pod nadzorom i bez nadzora. Uz nadzirano strojno učenje, podaci o treningu već su označeni tako da stroj može razumjeti više o željenim rezultatima. Na primjer, ako je svrha programa prepoznati mačke na slikama, sustav već ima veliki broj fotografija označenih kao mačka ili ne. Zatim koristi te primjere za usporedbu novih podataka za dobivanje rezultata.
Besplatno preuzimanje: Strojno učenje i zašto je to važno |
Uz strojno učenje bez nadzora, ne postoje oznake, pa sustav mora koristiti atribute i druge tehnike za prepoznavanje mačaka. Inženjeri mogu trenirati program prepoznavanja vizualnih značajki mačaka poput vijuga ili repova, ali postupak gotovo nikada nije tako jednostavan kao što bi bio u nadzornom strojnom učenju gdje te naljepnice igraju vrlo važnu ulogu.
Bilježenje podataka postupak je postavljanja naljepnica u skupove podataka o treningu. One se mogu primijeniti na mnogo različitih načina - gore smo govorili o napomeni binarnih podataka - mačke ili ne mačke - ali su važne i druge vrste napomena. Na primjer, u medicinskom području, naznaka podataka može uključivati označavanje specifičnih bioloških slika s oznakama koje identificiraju patologiju ili markere drugih medicinskih svojstava.
Bilježenje podataka podrazumijeva posao - i to često rade timovi ljudi - ali to je temeljni dio onoga zbog čega mnogi projekti strojnog učenja funkcioniraju pravilno. Pruža početnu postavku za podučavanje programa onome što treba naučiti i kako razlučiti protiv različitih ulaza kako bi se došlo do točnih rezultata.