Від коду до м’язів: Alibaba представила ШІ-дескриптори, що вчать роботів виконувати складні фізичні завдання

Від коду до м’язів: Alibaba представила ШІ-дескриптори, що вчать роботів виконувати складні фізичні завдання

Alibaba Cloud презентувала інноваційний програмний комплекс Qwen-Robot, що знаменує собою перехід від віртуального інтелекту до «фізичного». Китайський техногігант, який раніше зосереджувався переважно на великих мовних моделях (LLM) для створення текстів та зображень, тепер прагне надати цифровому розуму можливості керувати складними механізмами у реальному просторі.

Проєкт базується на концепції втіленого інтелекту (Embodied AI), де штучний інтелект не просто генерує відповіді, а безпосередньо взаємодіє з матеріальним світом. Для цього інженери розробили трирівневу систему, кожна складова якої відповідає за окремий аспект життєдіяльності робота.

## Архітектура «розумного заліза»: навігація та маніпулятори

Перший модуль системи спеціалізується на автономній навігації. Його особливість полягає в здатності орієнтуватися «з чистого аркуша» — роботові не потрібна детальна цифрова мапа приміщення, він створює маршрути в режимі реального часу, миттєво реагуючи на перешкоди. Друга модель орієнтована на дрібну моторику та маніпуляції з об’єктами. Вона дозволяє машинам розпізнавати предмети за формою та вагою, правильно розраховувати силу стискання та виконувати господарські доручення. Третя частина системи виступає в ролі предиктивного аналізатора: вона прогнозує фізичні наслідки кожної дії, що дозволяє роботу працювати безпечно та передбачувано.

Це досягнення стало результатом колосальної роботи з даними. Основною проблемою розробки втіленого ШІ завжди був дефіцит навчального матеріалу. Якщо для чат-ботів достатньо просканувати мільярди текстових документів з інтернету, то для роботизації потрібні специфічні дані про крутний момент двигунів, сенсорний опір та просторову геометрію. Щоб навчити Qwen-Robot, спеціалісти Alibaba опрацювали понад 38 тисяч годин відео та сенсорних записів, що демонструють взаємодію з різними типами об’єктів у побутових і промислових умовах.

Під час випробувань чотириногий робот Unitree Go2, оснащений новим програмним забезпеченням, продемонстрував високу адаптивність. Машина змогла самостійно орієнтуватися в незнайомій квартирі та виконувати усні команди, зокрема знаходити та переносити посуд.

## Глобальна гонка за «фізичний ШІ»

Вихід Alibaba на ринок роботизованих систем відбувається на тлі загострення світової конкуренції за технологічне лідерство наступного покоління. Сьогодні ми спостерігаємо трансформацію всієї галузі штучного інтелекту. Якщо 2023 рік був роком чат-ботів, то нині вектор змістився у бік автономних систем. Google активно інтегрує свої напрацювання Gemini у проєкти Robotics Transformer, а корпорація NVIDIA перетворює свою платформу Omniverse на глобальний полігон для навчання промислових роботів.

Китай, дотримуючись стратегії «розумного виробництва», має значну перевагу у цій гонці завдяки потужній промисловій базі. Alibaba намагається об’єднати свій досвід у хмарних обчисленнях із доступними апаратними рішеннями місцевих виробників, як-от Unitree. Це може значно здешевити впровадження роботів у повсякденне життя та на виробництва.

Історично розвиток робототехніки проходив через кілька етапів: від жорстко запрограмованих маніпуляторів на заводах до сучасних адаптивних систем. Проте саме зараз відбувається найбільш критичний зсув — перехід від навчання на основі правил до навчання на основі досвіду. Qwen-Robot є прикладом системи, що здатна до самонавчання через імітацію людських дій, що в перспективі дозволить створювати універсальних помічників, здатних працювати поруч із людиною без спеціальних захисних загороджень. Наразі програмний набір доступний для корпоративного тестування, що свідчить про близьку перспективу комерційної експлуатації технології.

Website information support by poshuk.info | Created and Supporting by Gramatorik