Штучний інтелект і його вплив на машинний зір

10.10.2017

Штучний інтелект і його вплив на машинний зір

Багато функціональних можливостей для розвитку людського мозку можна використовувати при розробці обладнання. Впровадження штучного інтелекту в системи машинного зору і застосування більш сучасних методів навчання дозволять машині думати і бачити майже так само, як людині.

Коли в 1950-х рр. з’явилося поняття «думаюча машина» (обчислювальна машина з елементами штучного інтелекту), виник ажіотаж відносно можливостей і шляхів розвитку цієї нової області. З того часу в масовій культурі часто розігруються сцени повстання наділених інтелектом машин. Початок був покладений виходом культового фільму «Космічна одіссея 2001 року» Стенлі Кубрика, а одним із останніх фільмів на цю тему став «З машини» Алекса Гарленда.

Незважаючи на те, що штучний інтелект ще не охопив всі сфери нашого суспільства, досягнуті покращення в області зберігання і обробки даних вже дозволили розробити когнітивні системи, такі як IBM Watson, які покликані прибрати інтуїтивні здогади з дій людей, що приймають важливі рішення. Однак в більшості випадків штучний інтелект застосовують для виконання набагато більш скромних завдань, наприклад, для розпізнавання об’єктів і образів.

Використання штучного інтелекту в системах машинного зору передбачає, що машина зможе приймати більш складні рішення, що виходять за межі сучасних можливостей. Але виникає питання – чи готова сама технологія до появи таких систем в промисловості?

Можливості штучного інтелекту в системах машинного зору

Застосування штучного інтелекту в системах машинного зору вимагає глибокого навчання машин. В широкому розумінні штучний інтелект – це здатність комп’ютера імітувати людський інтелект. Глибоке машинне навчання дозволяє комп’ютерам діяти без явного програмування, тобто вони можуть вчитися на власному досвіді.

Завдяки кільком знаковим подіям, що сталися за останнє десятиліття, глибоке навчання систем машинного зору з можливості перетворилося в реальність. «Нові методи побудови нейронних мереж, наявність достатньої обчислювальної потужності в графічних процесорах, а також можливість використання «великих даних» відкрили нам шлях до застосування штучного інтелекту для обробки зображень (образів)», – каже Олів’є Деспонт, що відповідає за розвиток бізнесу в компанії ViDi Systems , швейцарського творця програмного забезпечення для глибокого навчання машин.

Глибоке навчання є вельми багатообіцяючою технологією в порівнянні з традиційними підходами, використовуваними в системах машинного зору. На відміну від традиційних методів із застосуванням програмного забезпечення для обробки зображень, в нових системах використовується підхід, заснований на правилах. «Штучний інтелект – це наступний крок, який ми робимо, коли маємо справу з тим, що нелегко охарактеризувати з достатньою точністю і однозначністю, або з нелінійним процесом. У таких випадках для досягнення наступного рівня повторюваності в прийнятті рішень ми повинні впровадити штучний інтелект в машини, – вважає Уоллес Латімер, директор з продажу спеціалізованих оптичних систем в компанії FISBA LLC. – У той час як лінійні алгоритми створюють дуже вузький простір для маневру, поєднання штучного інтелекту з глибоким навчанням розширює межі застосування, оскільки воно може надати нам набагато більше варіацій. Завдяки цьому можна ускладнити оцінку: здійснювати її не тільки за принципом «що таке добре або що таке погано», а й «чому це добре чи погано». З великими можливостями в області гнучкості ви зможете зосередитися на тому, що дає найбільш ефективний результат у прийнятті рішень, і зменшити число змін по вхідним параметрам».

В даний час на ринку систем машинного зору існує принаймні одна система з глибоким навчанням – ViDi Suite від компанії ViDi Systems. Ця система є першим комерційно доступним програмним забезпеченням, яке виконане на основі глибокого навчання, призначене для аналізу зображень та адаптоване для використання в промисловості. Програмне забезпечення, яке інтегрується зі стандартними бібліотеками обробки зображень, в частині «пізнання світу» діє так, як би це робила дитина.

«Ви не вчите дитину, використовуючи підхід, заснований на чітких правилах, поянюючи дитині, що таке будинок, – каже Деспонт. – Грунтуючись всього лише на кількох прикладах, наш мозок навіть в ранньому віці може отримати інформацію про те, що робить будинок саме будинком. Наша система працює так само, як і людський мозок».

Програмне забезпечення ViDi Suite складається з трьох інструментів. Перший, ViDi Blue, знаходить і виявляє окремий об’єкт або відразу кілька всередині загального зображення. Цей інструмент локалізує і ідентифікує складні і прості об’єкти, вивчаючи їх за допомогою наявних в його розпорядженні анотованих зображень. Інший інструмент, ViDi Red, виявляє аномалії, аналізуючи нормальний зовнішній вигляд об’єкта, включаючи його варіації, а також сегментує певні області в зображеннях. Нарешті, третій з них, ViDi Green, використовується для класифікації об’єктів. Він навчається розділяти об’єкти в різні класи на основі бази зібраних і вже описаних зображень.

Ще однією важливою перевагою використання технології глибокого навчання в порівнянні з традиційними рішеннями, застосовуваними в системах машинного зору, є те, що вона може скоротити час, необхідний для розробки програм машинного зору. «При використанні підходу з класичним баченням багато додатків потребують як мінімум в двох місцях розробки і налагодження їх програмного забезпечення, – зазначає Деспонт. – Використання продуктів ViDi дозволяє завершити всю розробку буквально за лічені години».

На відміну від систем штучного інтелекту, які використовують серверні ферми як основу для свого програмного забезпечення (наприклад, як системи, розроблені компаніями Facebook, Google і IBM), системи компанії ViDi навчаються за допомогою одного високопродуктивного графічного процесора компанії NVIDIA. Причому весь процес, за словами Олів’є Деспонта, займає лічені хвилини, а не дні або місяці, які потрібні для програмування і запису вихідної інформації в параметричної формі за допомогою програмного забезпечення IBM Watson.

«Замість того, щоб використовувати мільйони чи мільярди зображень для навчання системи, ми рекомендуємо починати з 30-50 репрезентативних зображень високої якості, – каже Деспонт. – При цьому для обробки інформації або навчання ми не відправляємо зображення в хмарну серверну ферму. Завдяки цьому можна запускати все на одному персональному комп’ютері з одним графічним процесором і зберігати інтелектуальні права власності на свої зображення».

Можливості і проблеми

Глибоке навчання дозволяє використовувати системи машинного зору для набагато більш широкого спектру застосувань. «Штучний інтелект добре підходить, наприклад, для аналізу продуктів харчування в загальній масі, коли ви хочете перевірити пончики або шматки м’яса, екземпляри яких істотно відрізняються один від одного», – зазначає Бруно Менар, менеджер по програмним продуктам в компанії Teledyne Dalsa.

При цьому процес ідентифікації можна буде зробити більш складним. Для пояснення Менар наводить як приклад традиційні додатки виявлення дефектів. «Важко запрограмувати комп’ютер з традиційними алгоритмами для визначення дефекту без необхідності повторювати настройки кожного разу, коли з’являється новий дефект, – сказав він. – Але використовуючи штучний інтелект при великій кількості зразків, ви можете отримати дійсно гарне визначення того, що є якісною деталлю або продуктом, а що браком».

Система машинного зору з впровадженим штучним інтелектом знайде застосування в додаткових завданнях контролю і в підсумку вийде за звичні рамки промислової автоматизації. За словами Латімера, глибоке навчання буде вигідно використовуватись на таких ринках, як медицина, медико-біологічні дослідження та продукти харчування, а також для перевірки продукції на справжність з метою виявлення контрафакту і для сортування пиломатеріалів.

«Це як раз ті галузі, в яких є багато сірих плям і умовностей в прийнятті рішень, – зазначає Латімер. – Наприклад, як оцінити, чи достатньо хороше це яблуко? Важко створити якесь лінійне правило, щоб відповісти на це питання. Глибоке навчання дозволить багатьом додаткам стати більш ефективними і мати високу повторюваність в результаті прийняття ними рішень».

Зі свого боку, Деспонт з компанії ViDi Systems передбачає, що глибоке навчання буде потрібним і в інших галузях: медичній діагностиці, системах відеоспостереження, автономних транспортних засобах, а також в «розумному» сільському господарстві (для перевірки або аналізу карт). «Штучний інтелект  – це наше майбутнє, і за допомогою цієї технології ми досить швидко і ефективно допоможемо людям вирішувати складні завдання, оскільки обчислювальні можливості процесорів подвоюються практично кожні півтора року», – говорить Деспонт.

Багато фахівців в області систем машинного зору визнають всі переваги і ясно розуміють перспективи, які штучний інтелект і глибоке навчання дають індустрії розпізнавання образів, але вважають, що повний потенціал штучного інтелекту не буде розкритий і реалізований в повній мірі протягом ще як мінімум трьох-п’яти років. Більш того, штучний інтелект не обов’язково буде єдиним універсальним рішенням для всього того, що вплине на традиційні системи машинного зору і обробку зображень.

Менар також відзначає два основних недоліки в системах штучного інтелекту. «По-перше, потрібно багато тренувань … і необхідно створити своєрідного експерта для досягнення наступного рівня класифікації. Другий недолік проявляється, коли система, виконана на базі шутчного інтелекту, вже навчена, але класифікація зазнає невдачі. Цю проблему важко вирішити. І у вас не буде іншої спроби виконати її перепідготовку з новим зразком».

Перш ніж штучний інтелект стане звичайним явищем для систем машинного зору, як вважають експерти, індустрія повинна дозволити набагато більшій кількості гравців зробити перші непрості кроки для впровадження цієї технології. «З нашого сегмента ринкової ніші ми будемо спостерігати, як такі світові лідери, як, наприклад, компанія Google, з її неймовірними можливостями в частині інвестицій, будуть справлятися з цією технологією, – підводить підсумок Латімер. – Наша галузь промисловості ще не настільки багата, щоб вкладати час і гроші в необхідних обсягах. Тому нам нічого не залишається, окрім як використовувати досвід великих гравців».

По матеріалам Control Engineering

 

Статьи

30.04.2018

Ринок індустрії 4.0, Internet of Things (IoT) і Industrial Internet of Things (IIoT) буде продовжувати розвиватися в 2018 році, як прогнозують аналітики ринку галузевої (читать далее)

27.04.2018

Всесвітня торгова ярмарка Embedded World відбулася в 15-й раз з 27 лютого по 1 березня 2018 року в Нюрнберзі. Як завжди, не обійшлося без (читать далее)