Dom zvučni Kako nove mogućnosti strojnog učenja mogu omogućiti iskopavanje dokumenata o zalihama radi financijskih podataka?

Kako nove mogućnosti strojnog učenja mogu omogućiti iskopavanje dokumenata o zalihama radi financijskih podataka?

Anonim

P:

Kako nove mogućnosti strojnog učenja mogu omogućiti iskopavanje dokumenata o zalihama radi financijskih podataka?

A:

Jedna od uzbudljivih novih granica strojnog učenja i AI je ta što se znanstvenici i inženjeri upuštaju u razne načine korištenja potpuno novih vrsta resursa za predviđanje kretanja dionica i ishoda ulaganja. Ovo je izvanredan izmjenjivač igara u financijskom svijetu i revolucionirat će investicione strategije na vrlo dubok način.

Jedna od osnovnih ideja za proširivanje ove vrste dionica je računalna lingvistika, koja uključuje modeliranje prirodnog jezika. Stručnjaci istražuju kako koristiti tekstualne dokumente, od podnošenja SEC-a do pisma dioničara do drugih perifernih izvora temeljenih na tekstu, kako bi se poboljšala ili precizirala analiza dionica ili razvile potpuno nove analize.

Besplatno preuzimanje: Strojno učenje i zašto je to važno

Važno odricanje od odgovornosti je da je sve to izvodljivo samo potpuno novim napretkom neuronskih mreža, strojnim učenjem i analizom prirodnog jezika. Prije pojave ML / AI, računalne su tehnologije uglavnom koristile linearno programiranje za "čitanje" ulaza. Tekstualni dokumenti bili su previše nestrukturirani da bi bili korisni. No, s napretkom postignutim u analizi prirodnog jezika u posljednjih nekoliko godina, znanstvenici otkrivaju da je moguće „minerati“ prirodni jezik za mjerljive rezultate ili, drugim riječima, rezultate koji se mogu izračunati na neki način.

Neki od najboljih dokaza i najkorisnijih primjera toga dolaze iz različitih disertacija i doktorskih radova dostupnih na internetu. U radu, "Primjene strojnog učenja i računske lingvistike u financijskoj ekonomiji", objavljenog u travnju 2016., Lili Gao je s razlogom objasnila relevantne procese specifične za iskopavanje korporativnih prijava SEC-a, poziva dioničara i društvenih medija.

"Izvlačenje smislenih signala iz nestrukturiranih i velikih dimenzija tekstualnih podataka nije lak zadatak", piše Gao. "Međutim, razvojem strojnog učenja i računalnih jezičnih tehnika, obrada i statistička analiza zadataka tekstualnih dokumenata može se postići, a mnoge primjene statističke analize teksta u društvenim znanostima pokazale su se uspješnima." Iz Gaove rasprave o modeliranju i umjeravanju u sažetak, čitav razvijeni dokument pokazuje kako neke od analiza ove vrste detaljno djeluju.

Ostali izvori za aktivne projekte uključuju stranice poput ovog kratkog GitHub projekta, a ovaj IEEE izvor govori upravo o dobivanju vrijednih financijskih informacija iz „analize raspoloženja na Twitteru“.

Suština je da upotreba ovih novih NLP modela potiče brzu inovaciju u korištenju svih vrsta tekstualnih dokumenata, ne samo za financijsku analizu, već i za druge vrste najsuvremenijih otkrića, zamaglivši tu tradicionalno uspostavljenu liniju između "jezika" i "podaci."

Kako nove mogućnosti strojnog učenja mogu omogućiti iskopavanje dokumenata o zalihama radi financijskih podataka?