Да научим машините да виждат

Да научим машините да виждат

Две новоразработени системи за безпилотни коли могат да идентифицират местоположението и ориентацията на потребителя в места, където GPS не функционират, както и да идентифицират различни компоненти на пътната сцена в реално време с обикновен фотоапарат или смартфон, извършвайки същата работа като сензорите, струващи десетки хиляди евро.

Отделните, но допълващи се системи, са проектирани от изследователи от университета в Кеймбридж и демонстрациите са свободно достъпни онлайн. Въпреки че системите в момента не могат да контролират безпилотна кола, то способността им да направят така, че една машина да „вижда“ и точно да идентифицира къде е и какво „вижда“ е много важна част от развитието на автономните превозни средства и роботи.

Първата система, наречена SegNet, може да „види“ образ на улична сцена, която не е „виждала“ преди и да я класифицира, сортирайки обектите й в 12 различни категории – като пътища, улични знаци, пешеходци, сгради и велосипедисти – в реално време. Тя може да се справи със светли, сенчести и нощни среди, и в момента етикетира над 90% от пикселите правилно. Предишни системи, използващи скъпи лазерни или радарни сензори, не са били в състояние да достигнат това ниво на точност при работа в реално време.

machine see

Потребителите могат да посещават сайта на SegNet и качват снимка или да търсят всеки град или село в света, и системата ще поставя етикет на всички елементи от пътната сцена. Системата е била успешно тествана както на градски пътища, така и на магистрали.

Радарните и другите сензори за безпилотни автомобили, които се разработват в момента, са скъпи – в действителност, те често струват повече от самия автомобил. За разлика от скъпите сензори, които разпознават обектите чрез смес от радар и LIDAR (технология за дистанционно наблюдение), SegNet се обучава чрез пример – тя е „обучена“ от една група студенти бакалаври от Кеймбридж, които ръчно са отбелязали всеки пиксел във всяко edno от 5000 изображения, като всяко изображение е изисквало около 30 минути, за да бъде завършено. След като етикетирането е завършило, на учените са били необходими още два дни, за да „обучат“ системата, преди да бъде пусната в действие.

Създателите казват, че системата е толкова добра в разпознаването на  неща в едно изображение, защото има много практика, но може да се направи още много за настройването й, така че да продължава да става все по-добра.

SegNet е била обучена предимно в магистрални и градски условия, така че все още има да се учи по отношение на селските райони, заснежените или пустинните среди – въпреки че се е представила добре в началните тестове и в тези среди.

Системата все още не е готова да се използва за управление на автомобил или камион, но може да се използва като система за предупреждение, подобно на технологиите за предпазване от сблъскване, които в момента са налични в някои леки автомобили. Учените признават, че да се научи една система да вижда е по-трудно, отколкото изглежда.

Като деца, ние се учим да разпознаваме обекти чрез пример – ако са ни показали играчка кола няколко пъти, ние се научаваме да я разпознаваме както тази конкретна кола и други подобни автомобили като един и същ тип обекти. Но при една машина, това не е толкова просто, като да й покажете една-единствена кола и след това тя да бъде в състояние да разпознава всички различни видове автомобили. Машините днес се учат под наблюдение – понякога чрез хиляди етикирани примери.

traffic

Има три основни технологични въпроси, на които трябва да се отговори, за да се направят автономни превозни средства: къде съм, какво става около мен и какво да правя по-нататък. SegNet отговаря на втория въпрос, докато отделна, но допълваща система, отговаря на първия с помощта на изображения, за да определи както точното местонахождение, така и ориентацията.
Системата за локализация е проектирана да работи на подобна архитектура като SegNet и е в състояние да локализира потребител и да определи неговата ориентация от едно цветно изображение в оживена градска сцена. Системата е много по-точна от GPS и работи в места, където GPS не стига, като на закрито, в тунели, или в градове, където надежден GPS сигнал не е на разположение.

Тя е тествана по дълъг един километър път в центъра на Кеймбридж и е била в състояние да определи местоположението, както и ориентацията, в рамките на няколко метра и няколко градуса, което е далеч по-точно от GPS – жизненоважно за безпилотна кола. Потребителите могат да изпробват системата за себе си.

Системата за локализация използва геометрията на една сцена, за да научи точното й местонахождение, и е в състояние да определи, например, дали гледа на изток или запад от сграда, дори и ако двете страни изглеждат идентично.

В краткосрочен план е по-вероятно да видим тази система в домашен робот – например, като роботизирана прахосмукачка. Ще отнеме време преди водачите да могат да имат пълно доверие в автономната кола, но учените се надяват да направят системата по-ефективна и точна, за да може да се приближим към широкото приемане на коли без шофьори и други видове автономни роботи.

Източник: Университета на Кембродж

 

About Author

Write a Comment

Your e-mail address will not be published.
Required fields are marked*