Dom trendovi Zašto pokrenuti ml trening na lokalnom stroju, a zatim pokrenuti redovito izvršavanje na poslužitelju?

Zašto pokrenuti ml trening na lokalnom stroju, a zatim pokrenuti redovito izvršavanje na poslužitelju?

Anonim

P:

Zašto pokrenuti obuku strojnog učenja (ML) na lokalnom stroju, a zatim pokretati redovnu izvedbu na poslužitelju?

A:

Pitanje kako strukturirati projekt strojnog učenja i njegove faze osposobljavanja i testiranja ima puno veze s načinom na koji se krećemo kroz ML „životni ciklus“ i program dovedemo iz okruženja u proizvodno okruženje.

Jedan od najjednostavnijih razloga za korištenje gornjeg modela stavljanja ML treninga na lokalni stroj i zatim prebacivanja izvršenja na sustav temeljen na poslužitelju je korist od presudne podjele dužnosti. Općenito, želite da set za trening bude izoliran, tako da imate jasnu sliku o mjestu gdje započinje i zaustavlja i gdje započinje testiranje. Ovaj članak o KDNuggets govori o principu na grubi način, a također prolazi kroz neke druge razloge za izoliranje seta za trening na lokalnom stroju. Drugi osnovni prijedlog za ovaj model je da se s nastavcima za testiranje i testiranje na vrlo različitim arhitekturama nikada nećete zbuniti oko zajedničkog izdvajanja vlaka / testa!

Još jedna zanimljivost odnosi se na cyber-sigurnost. Stručnjaci ističu da ako imate početne procese vlaka na lokalnom stroju, to ne mora biti povezano s internetom! To proširuje sigurnost na fundamentalni način, "inkubirajući" proces dok ne dosegne proizvodni svijet, gdje tada morate ugraditi odgovarajuću sigurnost u model poslužitelja.

Uz to, neki od ovih „izoliranih“ modela mogu pomoći u problemima kao što su pomicanje koncepta i skriveni konteksti - načelo „nestacionarnosti“ upozorava programere da podaci „ne ostaju isti“ tijekom vremena (ovisno o tome što se mjeri) i da bi bilo potrebno mnogo prilagodljivosti da bi se ispitna faza podudarala s fazom vlaka. Ili se, u nekim slučajevima, postupci vlaka i ispitivanja miješaju zajedno, stvarajući zbrku.

Primjena testne faze na poslužitelju po prvi put može olakšati različite modele „crne kutije“ gdje riješite problem prilagodljivosti podataka. U nekim slučajevima, eliminira se suvišan proces slanja naloga za promjenu na više platformi.

Tada, također, okruženje poslužitelja očito služi u stvarnom vremenu ili dinamičnim procesima u kojima će inženjeri željeti pristupiti modelima prijenosa podataka i kodovima koji najbolje rade za proizvodnju u ML-u. Na primjer, AWS Lambda može biti atraktivna opcija za rukovanje mikrofunkcijama proizvodnje (ili kombinacijom Lambda i S3 objekta za pohranu) i bez povezivanja (bez poslužitelja) koje postaje nemoguće.

Ovo su neka od pitanja o kojima bi programeri mogli razmišljati kada razmotre kako odvojiti faze obuke za ML u procesu testiranja i proizvodnje.

Zašto pokrenuti ml trening na lokalnom stroju, a zatim pokrenuti redovito izvršavanje na poslužitelju?