▍前言——AI建筑学
我们在讨论AI,也在讨论建筑学。
最近随着AI Generated Content(AIGC)(人工智能自动生成内容)的兴起,我们可以将AI和建筑学放在一起讨论,形成一门新的学问:AI建筑学。其中,建筑师使用Diffusion等AI模型,通过提示语(Prompt)的输入,来生成设计方案。
下文将从我们建筑智能研究组(AIG)在AIGC领域的尝试为切入,为大家介绍AI建筑学中的几种模式,聊聊AI如何和设计师一起参与到建筑创作中。也希望本文能给读者们一些灵感,启发后续的研究和设计。
▍模式一:从“低信息量”到“高信息量”的生成
首先,我们可以使用Stable Diffusion或Midjourney之类的图像生成类模型来提升建筑设计方案的细节。我们输入信息量较低的初步设计,AI可以帮助我们在初步设计的框架控制下,生成信息量较高的进一步设计方案,以此来深化设计。
例如,下图展示了一种AI和SketchUp结合的场景,设计师可以在SketchUp中简单建立一个体块,然后驱动AI生成对应的建筑细节。在观察角度不同的情况下,AI生成的方案也会不同,因此提供更多的选择。
从SketchUp体块模型生成方案细节
同样的,在Rhino中,我们可以输入多个体块形成的简单建筑形态,然后嵌入AI程序来生成细节丰富的设计方案。同时我们可以控制AI的提示语,例如指定不同设计师的风格,然后对同一个体块模型生成多种风格的设计方案。
从Rhino体块模型生成不同风格的建筑
除了数字模型,实体模型也可以作为AI生成的目标。对于习惯手工搭模型来推敲方案的设计师,也可以使用体块模型的照片作为输入,指导AI生成方案细节。这种工作流程在后期可以开发为手机APP植入相机应用,方便设计师调用。
从实体模型生成建筑
另一种信息升维的方式是,由手绘草图来生成方案。这种工作流程尤其适用于喜欢通过草图来推敲方案的设计师。例如下面这个案例,我们可以随手绘制一个非常潦草的建筑场景线图,让AI来生成对应的建筑实景图。可以看到,随着手绘信息的增加,AI生成的信息也越来越稳定。
从手绘草图生成建筑实景图
而且,生成信息的风格同样是可控的。对于手绘图,如果我们倾向于生成的是类似风格的建筑彩绘图,可以通过提示语和权重来控制输入和输出的相似度。例如下面这个案例,随着提示语权重的增加,一张建筑草图逐渐变成写实风格的建筑表现图。而设计师可以选择中间任何的一个状态作为其理想的输出。
从草图生成建筑表现图
总的来说,第一种模式更接近建筑师原本的工作流程。AI在设计的某个阶段介入,帮助将设计深化到下一个阶段。这种模式下,建筑师提供的“低信息量”作为控制要素,指导AI生成“高信息量”,以此在可控的情况下丰富设计细节。
▍模式二:从“非建筑信息”到“建筑信息”的迁移
在第二种模式中,AI同样作为信息的生成者,但更像是“翻译”,将用户提供的与建筑无关的信息转化为建筑信息。这种流程常见于各类建筑研究中,例如对空间关联的探讨,或是对形态演变的研究。
在下面这个案例中,我们拿取了一些手边的物件,随意摆放在桌面上。虽然这些物件和建筑没有关系,摆放的位置也是随意的,但我们仍然可以用描述建筑的提示语来让AI生成对应的建筑场景。和手绘的情况相同,我们对物件摆放的越详细,AI生成的结果也就越相似。但即便是在摆放不完整的情况下,AI也可以生成完整的建筑场景。
从物件摆放生成建筑场景
另外,从不同角度对物件的拍摄,也能生成略微不同的建筑方案。这种区别性,益处在于能提供更多种可能,为之后的建筑创作提供灵感。而不利点就在于,方案之间无法在空间上统一,使得后续的三维建模需要人工的参与,而无法直接得到三维模型。因此,这种流程更适用于设计前期或研究阶段。
从物件摆放生成建筑形态
除此之外,输入的非建筑信息也可以是来自非人类的信息,比如自然界。下面这个研究案例展示的是,AI根据菌类在培养皿中的生长来生成城市的平面图。我们希望类比菌类和人类的活动规律,通过AI的眼睛来分析他们在有限空间内的扩张模式,进而得到有助于人类城市发展的结论。
从自然菌类生成人类城市
综上,第二种模式常被用于设计初期,或是灵感阶段。通过AI将“非建筑信息”迁移到“建筑信息”,或许本身也是一种对建筑设计理论的延伸。
▍模式三:从“一个方案”到“多个方案”的扩展
第三种模式在技术上区别于前两种,它利用AI模型的隐空间(latent space)中参数的连续性,生成多种建筑方案,而且前后方案之间具有一定的联系。借此对隐空间的控制,设计师可以自由决定提示语的权重,进而选取合适的结果。
例如,我们可以将一张柯布西耶的建筑草图作为输入,将“传统建筑”和“未来建筑”作为提示语,生成柯布西耶版本的各种建筑草图。其中的隐空间参数决定“传统”与“未来”的提示语权重,而生成的建筑草图也具有符合权重变化的特征。
从单张草图生成多张草图
同理,我们可以在家具设计领域采用同样的方法,将设计师风格作为隐空间调控的变量,生成不同的椅子设计。这些生成的椅子具有相似性的同时,也在设计风格上产生渐变。
隐空间中的一百张椅子
因此,对于提示语的隐空间操作,可以给设计带来定量的变化,并生成一系列的方案。
▍模式四:从“二维图像评估”到“三维模型生成”的转变
在最后一种模式中,我们将从生成“二维图像”转变为“三维模型”。技术上,我们采用了Stable Diffusion中的核心部分——CLIP,作为一种评估生成结果和提示语之间相似度的工具。结合相应的生成式算法,CLIP可以帮助算法的走向朝着提示语的描述上倾斜,并优化得到符合提示语描述的最终结果。在生成式算法是三维的情况下,得到的结果也就是三维的模型。
这套逻辑特别适合和已有的生成式算法结合。例如在下面的案例中,我们将城市中的建筑作为基本元素进行城市填空。算法将建筑放入城市空地后,CLIP对结果和提示语的相似度进行评估,随后算法根据评估结果优化建筑的摆放位置。使用不同的提示语来描述城市,最后建筑摆放的位置也会和描述接近。
CLIP指导下的城市填空
另外,下面这个案例展示了CLIP和图解静力学的结合。作为一种结构设计算法,图解静力学以图形量化的形式进行非标准桁架结构的设计。对于生成的结构,CLIP一样可以参照用户输入的提示语,提供给算法优化的方向。
CLIP指导下的结构设计
因此,第四种模式将Stable Diffusion保留了CLIP的部分,而原有的二维图像生成被替换为了三维模型生成,提供了一种更贴合建筑设计需求的工具。
▍结语:致迷途的建筑师们
我们在这里提出的AI建筑学,通过以上几种模式和案例已经介绍完毕。本质上,AI建筑学和传统建筑学的区别在于,设计工具本身是否能产生创造性。从墨线到尺规再到CAD,传统的设计工具只能记录设计师的创造性。而AI这种新的设计工具使得创造性不再是人类的专长,因此建筑学将在AI的影响下发生转变。
建筑师的工作内容也在逐渐发生变化。从两千年前的工匠,经历文艺复兴的绘图者,到近现代的建筑师,一种职业发生的变迁可能是悄无声息的。而最近的一个世纪,我们正在经历着技术爆炸。在历史上看来很短的一个时期,一种职业或许也会发生剧烈的变化。很难想象,“建筑师”这个称谓,在AI影响下的未来十年、二十年,是否会快速演变成另一种职业。
或许我们会从内心里喊出:建筑学不存在了!但我相信,如果建筑师能跳出自己的舒适圈,让自己成为那个让建筑学不存在的“农场主”,那将会是革命性的维度提升,一场彻底的新生。
领取专属 10元无门槛券
私享最新 技术干货