Как AI превратил текст в инструмент архитектора
Долгое время архитектор создавал пространство через чертежи и макеты. Сегодня текст становится новым инструментом: слова, описывающие форму, функцию и атмосферу, превращаются в трехмерные модели с помощью AI. Алина Черейская, куратор программы «Нейросети в архитектуре» и партнер SA lab, прослеживает эту эволюцию и подробно разбирает программы — показывая, как нейросети открывают новые возможности для архитекторов.
Алгоритмы, чертежи, нейросети: длинная история короткого AI‑хайпа

Mark Garcia and Steven Hutt, распространенность вычислительных технологий в архитектурном проектировании, 2023.
В Древнем Египте основным инструментом был рабочий макет, а один из первых известных чертежей на папирусе считается скорее исключением, чем нормой. Появление понятия «алгоритм» связывают с трактатом Аль‑Хорезми 825 года, где пошаговые вычисления закладывают фундамент, который позднее станет базой компьютерного мышления.
Средневековье и Ренессанс дали архитектору новый инструмент — перспективу и систему проекций. Альберти формализовал перспективу как метод, и теперь архитекторы показывают трехмерные пространства. В начале XIX века трактат Жана-Батиста Ронделе и других теоретиков закрепил чертеж как главный инструмент: детализированные планы, разрезы, узлы, масштабные линейки и расчеты нагрузок стали стандартом.
В XX веке эволюция ускорилась: в 1950—1960‑х годах появились компьютеры и Sketchpad, который впервые перенес ручную графику в цифровую среду, а в 1950—1960‑е архитекторы начали смотреть на искусственный интеллект через оптику «мыслящих» машин, которые могли становиться соавторами в проектировании. Николас Негропонте в MIT сформулировал идею машины‑партнера, которая вступает с архитектором в диалог, учится у него и генерирует ответы. Эти ранние гипотезы стали провалом и оставались на уровне идей, самые мощные компьютеры весили тонны, интернета еще не существовало, а до современных AI‑моделей оставалось более полувека. Однако идеи середины XX века задали ключевой сюжет: переход компьютеров и алгоритмов от инструментов к соавторам.
В 1970‑х Чарльз Истмен сформулировал идею Building Description System, которая позже переросла в BIM‑подход: единую информационную модель здания, объединяющую архитекторов, конструкторов и инженеров в одном файле. В 1982 году AutoCAD сделали двумерное и трехмерное компьютерное черчение массовым, позволив повторять на компьютере всю логику традиционных чертежей, но быстрее и точнее.
С 1990‑х и особенно в начале 2000‑х развилось алгоритмическое проектирование (Digital Project, Rhinoceros, Grasshopper, манифест параметризма Патрика Шумахера 2008 года), где архитектор все больше работает с кодом и данными, а проектирование смещается от статичного чертежа к динамической модели и управляемому алгоритму. В начале 2000‑х «второй цифровой поворот» сместил акцент от формы к процессу: web 2.0 и большие данные сделали архитектуру более открытой, вариативной и проникающей в виртуальный мир.
Современный AI и машинное обучение, опираясь на возросшие мощности и память компьютеров, наконец начали выполнять задачи, которые ранний AI не мог, — от создания формы, геометрии и чертежей к прогнозированию и новому архитектурному языку. Это логичная эволюция архитектурного проектирования. 2022 год стал важным в связи с появлением Midjourney и ChatGPT, которые показали, что теперь AI — это несложная технология, доступная единицам, а находящаяся у нас на кончиках пальцев.
Методы создания формы с AI
Text-to-3D
Превращает описание в геометрию за секунды. Результатом становится не финальная 3D-модель, а быстрый черновой слой, с которым можно работать дальше. Существующие модели подходят к этой задаче по-разному: одни собирают форму из облаков точек, другие реконструируют ее на основе «насмотренности», третьи интегрируются в софт, а четвертые — создают редактируемую форму на основе алгоритмической логики. На этом уровне AI проявляет пространственный интеллект, интерпретируя взаимосвязи отдельных элементов, пропорции и другие параметры.
Point-E (2022)
Модель OpenAI расставляет множество точек в пространстве, а потом соединяет их в сплошную поверхность. Сначала текст преобразуется в изображение, на его основе создает тысячи цветных точек в трехмерном пространстве — получается облако точек, которое соединяется в поверхность. Нейросеть справляется с простой геометрией, а получить корректную сложную геометрию практически невозможно: при построении поверхности часть сегментов может теряться, сама модель получается тяжелой и практически не редактируемой.
Tripo AI (2024)

Обучена на миллионах примерах 3D-моделей. Работает по принципу image‑to‑3D и при работе с текстом опирается на промежуточное изображение (text‑to‑image‑to‑3D). За счет этой «насмотренности» Tripo хорошо справляется с привычными объектами, но дает артефакты на тонких элементах — колоннах или ножках мебели. Удобно для быстрого прототипирования отдельных объектов и простой архитектуры.
Hunyuan3D (2024)

Сначала модель создает ракурсы объекта с разных сторон (multi-view generation), чтобы они были согласованы между собой через специальную архитектуру — в итоге генерирует высокополигональную поверхность и добавляет текстуры.
Проблемы современных text-to-3D: ограниченное понимание формы и трудности редактирования

Все перечисленные выше модели (Point-E, Tripo, Hunyuan) рассматривают объект снаружи — смотрят на него как на картинку и пытаются воссоздать. У этого подхода есть общие ограничения: они слабо понимают логику создания формы, пропорции. Если мы моделируем табурет Stool 60 Алвара Аалто, архитектор по описанию «круглое сиденье и три гнутые ножки» сразу представляет высоту, диаметр, расстояние между ножками, их положение относительно сиденья. Модель, работающая с одной картинкой, видит лишь проекцию. Если ракурс неточный, ножки слипаются или перекрывают сиденье, финальная геометрия будет с ошибками. Несколько объектов в сцене создают еще больше проблем: расстояния, глубина, иерархия читаются плохо. Вторая проблема — редактируемость. Большинство text‑to‑3D‑решений возвращают геометрию как финальный продукт. Изменить высоту ножек, их форму или размер без ручной доработки невозможно. Чем точнее результат, тем сложнее (а иногда и просто невозможно) его редактировать.
Хотите увидеть, как слова действительно превращаются в формы? На модуле «От текста к форме» программы «Нейросети в дизайне» мы разберем это шаг за шагом и покажем, как работать с AI напрямую в проектном процессе.
Параллельно с этим развивается другой путь: не создавать отдельное text‑to‑3D-решение, а встраиваться в существующий софт через своего рода «мосты», плагины или MCP-протокол.
Raven (2025)

Это плагин для Rhino + Grasshopper, который по тексту или изображению генерирует параметрический скрипт. Raven распознает установленные плагины (Lunchbox, Pufferfish и др.) и использует их компоненты для построения скрипта. В отличие от mesh‑генераторов, здесь результатом становится не геометрия как таковая, а логика ее построения. Архитектор получает редактируемый скрипт и форму или пространство. Raven позиционируется как инструмент для ускорения существующего Grasshopper-workflow, а не его замена. Подходит для архитекторов, уже работающих в Rhino+Grasshopper, которые хотят быстро прототипировать идеи и обладают алгоритмическим мышлением.
Форма следует вайбу
В 2025 году Андрей Карпатый ввел термин vibe coding — процесс, в котором код пишет AI, а управляет им человек. В SA lab мы ввели понятие vibe modeling. Архитектор описывает вайб — пространственный, функциональный, эстетический, AI создает параметрическую форму. Форма следует вайбу. Это следующий слой — тот, где архитектор говорит с моделью на человеческом языке (natural language), а модель отвечает редактируемой формой.
Spellshape (2025)


В отличие от решений, которые восстанавливают поверхность по картинке, Spellshape разбирает текст на элементы и связи между ними. Промпт вроде «табурет Аалто, три гнутые ножки из фанеры, сиденье 350 мм» интерпретируется как набор параметрических сущностей: сиденье‑цилиндр с определенной высотой и диаметром, ножка как кривая с заданным радиусом изгиба и шагом по окружности, узел крепления как пересечение тел. На выходе — параметрическая модель, где можно менять размеры, количество элементов, радиусы, не разрушая общую структуру. Spellshape работает с логикой: с тем, как форма рождается из набора взаимосвязанных параметров. Работает без привязки к Rhino+Grasshopper, но обучен на сложных алгоритмах.
Что дальше и роль текста
Текст всегда присутствовал в архитектуре, но его роль менялась. Сегодня он выходит на передний план: мы общаемся с AI на естественном языке и получаем исследования, скрипты, изображения, видео и форму. Путь от идеи до архитектурного проекта становится более бесшовным: то, что раньше приходилось долго «перекодировать» в скетчи, чертежи и скрипты, сейчас можно сразу формулировать словами, а AI-cофт берет на себя превращение текста в форму. Пространственный интеллект (spatial intelligence) становится следующим этапом развития AI как способность воспринимать, рассуждать и действовать в трехмерном мире.
На программе «Нейросети в архитектуре» вы научитесь превращать текст и изображения в 3D-модели и интегрировать AI с параметрическими инструментами в Rhino + Grasshopper. А вместе с практикой это позволит включить нейросети в свой собственный проектный процесс и создавать формы, которые отражают ваши идеи.