XPeng хочет научить автопилот «думать наперед»: что известно о системе X-Mind

XPeng хочет научить автопилот «думать наперед»: что известно о системе X-Mind
B. Naumkin

XPeng представила X-Mind для автономного вождения с прогнозной моделью мира

Дмитрий Якин
Обновлено:

XPeng представила X-Mind — технологическую основу для автономного вождения. Система должна заранее просчитывать развитие дорожной ситуации и быстрее планировать траекторию.

XPeng представила новую технологическую архитектуру X-Mind, которая должна сделать автономное вождение более предсказательным и «мыслящим наперед». Компания описывает систему как встроенную в автомобильный ИИ прогнозную модель мира, способную заранее оценивать развитие дорожной сцены. Идея X-Mind в том, чтобы автопилот не просто распознавал объекты перед машиной, а строил короткий прогноз будущего.

По логике XPeng, такой подход ближе к поведению опытного водителя: он видит не только текущую картинку, но и понимает, что может произойти через несколько секунд — кто перестроится, где возникнет конфликт, как изменится поток на перекрестке или при въезде с рампы.

Ключевой элемент системы — Visual CoT, то есть визуальная цепочка рассуждений. Перед выбором траектории автомобиль выполняет явное пространственно-временное моделирование. Это должно помогать системе заранее учитывать изменения трафика и выбирать более защитную, безопасную линию движения.

XPeng подчеркивает, что X-Mind не гонится за сверхдетальной картинкой с высокими текстурами. Вместо этого система строит так называемое «когнитивное полотно», где важнее не реалистичность изображения, а смысловые элементы: разметка, препятствия, сигналы светофоров, навигационное намерение и допустимый скоростной профиль. Такой подход снижает вычислительную нагрузку.

По данным XPeng, 12 кадров будущего сценария сжимаются всего до 96 токенов с помощью глубоко сжатого автоэнкодера DC-AE. Проще говоря, система отбрасывает лишнюю визуальную «красоту» и оставляет то, что действительно нужно для планирования движения. Это особенно важно для серийных автомобилей.

Автопилот должен работать не на лабораторном сервере, а на автомобильном чипе с ограниченными ресурсами, в реальном времени и без задержек, опасных на дороге. Поэтому XPeng делает акцент не только на точности, но и на низкой задержке вывода.

Компания заявляет, что X-Mind обучали на массиве из сотен миллионов кадров реального мира. Система должна лучше справляться с резким торможением впереди идущей машины, слиянием потоков на съездах и сложными перекрестками, где нужно учитывать не один объект, а цепочку причин и последствий.

По внутренним сравнительным данным XPeng, X-Mind снижает ошибки прогнозирования траектории по продольной и поперечной осям относительно традиционных VLA-моделей. Особенно сильный эффект заявлен в сложных редких сценариях, где безопасность и соблюдение правил важнее красивой демонстрации.

Отдельный контекст — регулирование. Глава XPeng Хэ Сяопэн ранее заявил, что VLA 2.0 выходит на глобальную траекторию, а принятые на уровне WP29 нормы DCAS UNR 171 series 02 и UNR ADS должны упростить легализацию продвинутых систем помощи и автоматизированного вождения на мировых рынках.

Пока X-Mind — это не обещание полностью беспилотного автомобиля завтра утром. Но направление понятно: XPeng хочет, чтобы машина не только распознавала дорогу, а строила краткий прогноз ее развития. Для водителя реальная ценность появится тогда, когда такие алгоритмы снизят резкие маневры, улучшат поведение в плотном городе и будут работать стабильно не в презентации, а в обычной пробке, на мокрой дороге и на сложном перекрестке.

Подпишись на
"Tarantas News":

Свежие материалы