Priljubljene Objave

Izbira Urednika - 2019

Računalnik po spletu preiskuje 24 ur, da bi analiziral slike in se naučil zdrave pameti

Anonim

Računalniški program, imenovan Never Ending Image Learner (NEIL), deluje na Univerzi Carnegie Mellon 24 ur na dan, išče splet za slike, po svojih najboljših močeh sami razume in gradi rastočo vizualno bazo, zbira skupne občutek v velikem obsegu.

oglas


NEIL uporablja nove dosežke v računalniškem vidu, ki računalniškim programom omogočajo prepoznavanje in označevanje predmetov na slikah, označevanje prizorov in prepoznavanje atributov, kot so barve, osvetlitev in materiali, vse z minimalnim nadzorom človeka. Po drugi strani pa bodo podatki, ki jih ustvarja, dodatno povečali sposobnost računalnikov, da razumejo vizualni svet.

Toda NEIL prav tako združuje med temi stvarmi, da pridobi informacije o zdravju, ki jih ljudje samo vedo, ne vedo nikoli - da so avtomobili pogosto najdeni na cestah, da so stavbe navidezno navpične in da so racje nekako podobne gosi. Na podlagi sklicevanja na besedilo se zdi, da je barva, povezana z ovco, črna, vendar ljudje - in NEIL - vseeno vedo, da so ovce običajno bele barve.

"Slike so najboljši način za učenje vizualnih lastnosti, " je povedala Abhinav Gupta, pomočnica profesorja na področju Robotics Institute Carnegie Mellon. "Slike vsebujejo tudi veliko razumnih informacij o svetu. Ljudje to učijo sami in z NEIL-om upamo, da bodo tudi računalniki to storili."

Računalniški grozd je že od konca julija izvajal program NEIL in že analiziral tri milijone slik, v katerih je na pol milijona slik in 1.200 vrst prizorov identificiral 1.500 vrst predmetov na več sto tisoč slik. Povezal je pike, da bi se naučil 2500 zvez iz več tisoč primerov.

Javnost si lahko sedaj ogleda ugotovitve NEIL na spletni strani projekta, //www.neil-kb.com.

Raziskovalna skupina, vključno z Xinlei Chen, doktorat znanosti. študent na Institutu za jezikovne tehnologije CMU in prof. dr. Abhinav Shrivastava študent v robotiki, bo svoje ugotovitve predstavil 4. decembra na IEEE International Conference on Computer Vision v Sydneyju v Avstraliji.

Ena motivacija za projekt NEIL je ustvariti največjo svetovno vizualno strukturirano bazo znanja, kjer so predmeti, prizori, dejanja, atributi in kontekstualni odnosi označeni in katalogizirani.

"Kaj smo se naučili v zadnjih 5-10 letih raziskav računalniške vizije je, da je več podatkov, ki jih imate, boljši računalniški vid, " je dejal Gupta.

Nekateri projekti, kot sta ImageNet in Visipedia, so skušali združiti te strukturirane podatke s pomočjo človeške pomoči. Vendar je obseg interneta tako velik - samo v Facebooku ima več kot 200 milijard slik -, da je edino upanje, ki ga je treba analizirati, naučiti računalnike, da to storijo v veliki meri sami.

Shrivastava je dejal, da lahko NEIL včasih naredi napačne predpostavke, da gre za napake, zato morajo biti ljudje del procesa. Iskanje Google slike na primer lahko prepriča NEIL, da je "roza" samo ime pevca in ne barve.

"Ljudje ne vedo, kako ali kaj učiti računalnikov, " je opozoril. "Toda ljudje so dobri, ko govorijo računalnike, ko se motijo."

Ljudje pravijo tudi NEIL, katere kategorije predmetov, prizorov itd., Da iščejo in analizirajo. Toda včasih, kar lahko najdemo v NEIL-u, lahko presenetijo tudi raziskovalce. Lahko se pričakuje, na primer, da iskanje "jabolka" lahko vrne slike sadja in prenosnih računalnikov. Toda Gupta in njegova skupina za izkrvavitev ni imela pojma, da bi iskanje F-18 opredelilo ne samo slike borec, ampak tudi katamarane razreda F18.

Kot nadaljevanje iskanja NEIL razvija podkategorije predmetov - tricikli so lahko za otroke, za odrasle in jih je mogoče motorizirati, ali avtomobili pridejo v različne blagovne znamke in modele. In začenja opazovati združenja - na primer, da so zebri v savanah ponavadi na voljo in da so talne obloge običajno gneče.

NEIL je računsko intenziven, je ugotovila raziskovalna skupina. Program deluje na dveh gručah računalnikov, ki vključujejo 200 procesnih jeder.

oglas



Story Source:

Gradivo, ki ga ponuja Univerza Carnegie Mellon . Opomba: Vsebino lahko uredite za slog in dolžino.