摘要


深度学习技术已被应用于随机生成图像,例如在时装、家具设计领域。然而迄今为止,在设计过程中起关键作用的人因要素尚未在深度学习方法中得到充分重视。本文报道了一种人机协同设计方法的研究成果,该方法通过脑电图(EEG)信号捕捉用户偏好的设计特征。在所开发的框架中:首先训练编码器从受试者观看ImageNet图像时记录的原始EEG信号中提取特征;其次构建以编码EEG特征为条件的生成对抗网络(GAN)模型来生成设计图像;最后利用训练好的模型,根据个体在设计构思认知过程中测量的脑电活动生成设计图像。为验证该方法,研究按照所述流程进行了案例实证。结果表明,该方法能够根据与偏好相关的脑电信号生成符合用户喜好的设计风格。此外,当客户难以清晰表达设计需求时,该方法也有助于改善设计师与客户之间的沟通效率。


研究领域:机器学习,脑电信号(EEG),人机协同设计(Human-in-the-Loop Design),生成对抗网络(GAN),设计认知

论文题目:Human-in-the-loop design with machine learning

发表时间:2019年7月26日

论文地址:https://doi.org/10.1017/dsi.2019.264

会议名称:ICED19


近年来,深度学习技术已在图像生成设计中崭露锋芒,但人类认知在设计中扮演的关键角色却长期被忽视。2019年国际工程设计大会(ICED19)上,一篇研究提出了一种脑电信号(EEG)驱动的人机协同设计框架,通过捕捉人类对设计偏好的脑信号,生成符合用户心理预期的产品图像。这项研究不仅为AI生成设计注入“人性化”的考量,更打开了设计师与客户之间“以脑为媒”的全新交流范式。





从“随机生成”到“认知驱动”:

AI设计的范式突破




传统AI生成设计依赖图像风格迁移(Style Transfer)或生物仿生设计(Generative Bionics),但结果往往随机且缺乏用户偏好引导。研究团队指出,人类对设计的偏好具有直觉性和模糊性,而脑电信号能捕捉视觉认知中的潜在特征。他们提出三阶段框架:首先,通过记录受试者观看不同物品图片时的脑电信号,建立“视觉刺激-脑电特征”的编码模型;其次,训练根据脑电特征还原视觉刺激的生成对抗网络(Conditional GAN);最后,利用用户想象设计时的脑信号生成个体偏好的个性化产品。这种“编码-生成”的双网络架构,使AI从被动生成转向主动理解人类认知。


图 1. 基于脑信号的设计图生成流程图。


图 2. 实验设计:上图是图像呈现实验流程,受试者被要求观看图像,并在观看重复图像时按下板子上的按钮,以保证注意力集中;下图是偏好设计想象流程,受试者需要按照屏幕上的提示,想象他们偏好的物品外观。实验过程中,记录受试者的EEG脑电信号。





脑电信号如何参与外观设计?




实验过程中,采用64导联脑电设备,记录6名受试者观看ImageNet中5类产品(手提包、吉他、马克杯、耳机、手表)时的脑电信号。脑电信号分析的创新点之一在于LSTM-EEG编码器的设计:通过长短期记忆网络(LSTM)提取脑电信号的时序特征,再经全连接层映射为64维特征向量。测试显示,该模型对耳机、手提包等产品的分类准确率达84.2%和79.2%。


这些特征向量随后被输入到改进的ACGAN模型(带辅助分类器的生成对抗网络)。生成器由5个上采样层组成。首先,输入64导脑电信号特征与随机高斯噪声逐元乘积的脑电信号表示,然后输入向量通过第一个转置卷积层在空间上采样四次,并输出512个特征映射。之后,在每个剩余的转置卷积层之后,特征映射的数量减半,特征映射的大小翻倍。最后,输出的是rgb形式的64 × 64像素图像。辨别器由两个模块组成:用于提取图像特征的卷积模块和用于区分生成图像并识别图像类别的分类模块。因此,在训练中同时能够学习到图像类别和风格特征,确保输出既符合产品类型,又包含脑电信号中的审美偏好。


图 3. EEG信号编码器。





从实验室到设计台:生成效果验证




在“想象偏好”实验中,受试者闭目构想理想产品时的脑电信号被输入训练好的模型。如下图结果显示,生成图像不仅还原了基本形态,还融合了多品类设计特征——例如一款手提包同时包含撞色拼接与极简轮廓,暗示用户偏好“活力感与功能性的平衡”。定量评估中,57.6%的生成图像被用户选中为“心仪设计”,其中包类产品认可度更是高达73%。研究者认为,形状主导型产品(如手提包)的生成效果优于功能复杂型(如吉他),可能因为脑电信号对形态特征的编码更敏感。


图 4. 左侧灰色边框中是根据脑电信号,重建所看图像的结果;右侧红色边框是根据脑电信号,重建偏好物品外观的结果。





设计认知的“读心术”:跨界应用前景




这项技术突破了三重边界:其一,将神经科学实验范式引入设计领域,通过脑电信号量化主观偏好;其二,建立“认知特征-设计语义”的跨模态映射,使AI能解析人类难以言明的审美倾向;其三,为设计师提供“可视化脑洞”工具——当客户无法准确描述需求时,生成图像可成为沟通的“认知翻译器”。研究团队展望,该框架可拓展至材料选择、品牌策略等领域,例如在服装设计中,捕捉用户对布料纹理的脑电反应,生成融合舒适性与美观性的面料图案。





挑战与未来:通向真正的“心流设计”




尽管当前模型局限于5类产品的训练数据,生成分辨率也待提升,但方法论的价值显著。研究揭示了两个关键认知:首先,脑电信号中的低频成分(如δ波和θ波)可能承载更多设计偏好信息;其次,GAN的隐空间(Latent Space)能够将神经特征转化为可解释的设计元素。未来,结合fMRI等高精度脑成像技术,或可实现从“风格生成”到“功能创新”的跨越。


这项研究为AI辅助设计开辟了神经认知的新维度,或许在不远的未来,设计师的“灵光一现”将直接转化为屏幕上的创意雏形,而客户的一句“我想要这种感觉”,也能被AI解码为精确的设计语言。



彭晨| 编译



脑机接口读书会


脑机接口是通过读取大脑神经信号来实现人脑与外部设备交流与控制的前沿技术。作为一个前沿交叉领域,脑机接口技术是跨学科研究的典型代表,融合了控制科学、神经科学、计算机科学、工程学等多个学科领域。针对相关领域,集智已经举办了多个系列读书会与课程,追踪计算神经科学、NeuroAI、神经动力学模型、控制科学等进展。


为了进一步梳理脑机接口相关理论与技术前沿,集智俱乐部联合清华大学高小榕、中科院自动化所刘冰、中科院深圳先进院李骁健、清华大学眭亚楠四位老师,发起「脑机接口」读书会。读书会已完结,现在报名可加入社群并解锁回放视频权限。


图片


详情请见:
从科幻到现实,从发现到应用:脑机接口读书会启动


推荐阅读
1. AlphaFold3开源了,诺奖AI工具人人可用,开启生物分子设计新时代
2. DeepMind 新作:AI 系统实现以人为中心的分配机制设计
3. 如何让AI自我迭代,完成深度学习中最关键的架构设计工作?
4. 涌现动力学如何用来分析复杂系统? | 新课上线
5. AI时代的学习:共探人类学习的复杂性

6. 探索者计划 | 集智俱乐部2025内容团队招募(全职&兼职)



点击“阅读原文”,报名读书会