От кода до мышц: Alibaba представила ИИ-дескрипторы, которые учат роботов выполнять сложные физические задачи

Від коду до м’язів: Alibaba представила ШІ-дескриптори, що вчать роботів виконувати складні фізичні завдання

Alibaba Cloud представила инновационный программный комплекс Qwen-Robot, который знаменует собой переход от виртуального интеллекта к «физическому». Китайский техногигант, который ранее сосредоточивался преимущественно на больших языковых моделях (LLM) для создания текстов и изображений, теперь стремится предоставить цифровому разуму возможности управлять сложными механизмами в реальном пространстве.

Проект основан на концепции воплощенного интеллекта (Embodied AI), где искусственный интеллект не просто генерирует ответы, а непосредственно взаимодействует с материальным миром. Для этого инженеры разработали трехуровневую систему, каждая составляющая которой отвечает за отдельный аспект жизнедеятельности робота.

## Архитектура «умного железа»: навигация и манипуляторы

Первый модуль системы специализируется на автономной навигации. Его особенность заключается в способности ориентироваться «с чистого листа» — роботу не нужна детальная цифровая карта помещения, он создает маршруты в режиме реального времени, мгновенно реагируя на препятствия. Вторая модель ориентирована на мелкую моторику и манипуляции с объектами. Она позволяет машинам распознавать предметы по форме и весу, правильно рассчитывать силу сжатия и выполнять хозяйственные поручения. Третья часть системы выступает в роли предиктивного анализатора: она прогнозирует физические последствия каждого действия, что позволяет роботу работать безопасно и предсказуемо.

Это достижение стало результатом колоссальной работы с данными. Основной проблемой разработки воплощенного ИИ всегда был дефицит учебного материала. Если для чат-ботов достаточно просканировать миллиарды текстовых документов из интернета, то для роботизации нужны специфические данные о крутящем моменте двигателей, сенсорном сопротивлении и пространственной геометрии. Чтобы обучить Qwen-Robot, специалисты Alibaba обработали более 38 тысяч часов видео и сенсорных записей, демонстрирующих взаимодействие с различными типами объектов в бытовых и промышленных условиях.

Во время испытаний четвероногий робот Unitree Go2, оснащенный новым программным обеспечением, продемонстрировал высокую адаптивность. Машина смогла самостоятельно ориентироваться в незнакомой квартире и выполнять устные команды, в частности находить и переносить посуду.

## Глобальная гонка за «физический ИИ»

Выход Alibaba на рынок роботизированных систем происходит на фоне обострения мировой конкуренции за технологическое лидерство следующего поколения. Сегодня мы наблюдаем трансформацию всей отрасли искусственного интеллекта. Если 2023 год был годом чат-ботов, то ныне вектор сместился в сторону автономных систем. Google активно интегрирует свои наработки Gemini в проекты Robotics Transformer, а корпорация NVIDIA превращает свою платформу Omniverse в глобальный полигон для обучения промышленных роботов.

Китай, придерживаясь стратегии «умного производства», имеет значительное преимущество в этой гонке благодаря мощной промышленной базе. Alibaba пытается объединить свой опыт в облачных вычислениях с доступными аппаратными решениями местных производителей, таких как Unitree. Это может значительно удешевить внедрение роботов в повседневную жизнь и на производства.

Исторически развитие робототехники проходило через несколько этапов: от жестко запрограммированных манипуляторов на заводах до современных адаптивных систем. Однако именно сейчас происходит наиболее критический сдвиг — переход от обучения на основе правил к обучению на основе опыта. Qwen-Robot является примером системы, способной к самообучению через имитацию человеческих действий, что в перспективе позволит создавать универсальных помощников, способных работать рядом с человеком без специальных защитных заграждений. В настоящее время программный набор доступен для корпоративного тестирования, что свидетельствует о близкой перспективе коммерческой эксплуатации технологии.

Website information support by poshuk.info | Created and Supporting by Gramatorik