more
Back

用AI工作流构建二维码SOTA效果

看得到的形式 VS 看不到的数据

艺术二维码是AIGC浪潮中一个非常有趣的分支,它融合了技术与艺术:让承载数据的理性黑白格子,与彰显内容的感性形式完美结合。在我们的日常业务中,二维码无处不在,如果能找到一个市场切入点,即可有不小的体量,背后存在一定的商业潜力。

当前业界有一些不错的解决方案,但效果上不够极致。作为一个同时着迷于技术与设计的人,这个题目激发了我的兴趣:我能否找到一种更底层的方法达成最佳的设计效果?这篇文章,记录的就是一次AIGC方向上技术与美学实验,希望为这个有趣的领域提供一个新的思考视角。

从原理起步:重新理解二维码的“规则”

要打破一个东西的极限,首先要彻底理解它的规则。我摒弃了所有对现有工具的盲目依赖,回归到二维码这个“物种”最底层的编码原理,进行了一次像素级的解构。这个过程,本身就能学到很多知识,而且研究的过程也是熟知comfyUI这样业界潮流的工具的绝佳机会。

容错的“慷慨”:二维码的容错机制,是它与生俱来的最大天赋。允许最高30%的“笔误”。这为我们的艺术创作,预留了巨大的“挥霍”空间。这30%,就是我们进行艺术创作的“预算”,我们可以用它来“购买”色彩的丰富性、线条的流动感,甚至是一些刻意的遮挡。这意味着不必再对每一个像素点都小心翼翼,而是可以相对冗余地将图像元素融入码体,只要我们的“创意开销”不超过这个预算,系统就依然能读懂我们想表达的核心信息。

识别的“本质”:一个二维码像素方块,真正起决定性作用的,只是其中心约1/9的区域。这是一个艺术发挥的基础,它意味着每个像素方块90%的面积,本质上都是一块可供创作的“画布”。只要我们像保护建筑的承重柱一样,守住那个作为识别基石的中心点,周围的部分都可一定程度交给艺术。我们可以用细腻的笔触去填充它,用渐变的色彩去渲染它,让原本生硬的像素点,变成一幅微缩画的一部分。

结构的“弹性”:传统的“斑马纹”并非不可或缺,适当的形变、一定角度的透视,都不会影响最终的识别。这打破了二维码必须是“方方正正”的刻板印象。而一个旋转了180度的二维码作为底图,则是一种更高级的“障眼法”,它能更好地消解掉普通人对二维码的视觉惯性,让图像的艺术性优先于码的功能性被感知。这些基础底层原理,让二维码从平面的束缚中,开始拥有了走向三维立体和不规则形态的自由。

这些初期探索让我感受到当前艺术二维码仍未触及形式的天花板,仍有继续精进的机会。

破局点:我的“分层粒子”方法

无数次实验中,一个“Aha Moment”不期而至,最终成为了我整个工作流的核心——我意识到,过去所有的生成方法,都在试图用一次“大爆炸”来同时解决“美观”和“识别”两个问题,这必然导致左右互搏。而我的破局点在于,将这个单一的、矛盾的生成过程,分解为三个独立的、协作的图层。

我将其称为“分层粒子”(Layered Particles)方法:

A“骨骼层” – 识别的基石:通过二维码重绘,首先生成一张仅保留最核心识别点的、稀疏的“点阵图”。这些点构成了二维码的“骨骼”。它们的任务只有一个:被精准地识别

B“强化层” – 交界的画布:再生成另一张由更大、更模糊的“粒子”组成的点阵图。这些粒子填充在“骨骼”的周围,平衡识别性及内容表达,这里需要的“约束”稍小,所以使用中灰色。

C“发挥层”- 放飞的空间:外层区域对识别的影响最小,所以适合用于最大限度发挥艺术性和内容本身,也正是因此,使用最浅的灰色。

最后,我将这三张带有不同透明度的图层精巧地叠加在一起。这张看似平淡无奇的黑白图就是平衡识别性和内容发挥的关键——让我能在保证基础识别率的前提下,去追求视觉表现的无限自由。

核心工作流:将方法论落地为系统工程

有了方法论,下一步就是把它变成一个稳定、高效的自动化工作流。ComfyUI是一个极其强大和灵活的节点式系统,但也正因如此,构建一个能持续产出高质量结果的工作流,本身就是一项复杂的系统工程。

我的任务,就是将理论中的“分层粒子”输出的图形作为输入节点,并对每一个节点的参数进行精细调整。从QR Code Monster节点的定制,到Ultimate SD Upscale的应用,再到对ControlNet中brightnesscontrast参数的反复调试……每一步,都是最终的SOTA效果的加权要素。

这是一个反复调教的过程。每当一个技术链路被打通,就意味着向最终目标迈进了一大步。当所有节点最终被严丝合缝地连接在一起,一个稳定、可复现的SOTA级二维码生成系统,也便最终搭建完成!

迭代的成果:当二维码连接艺术和商业

这套工作流产出的一些作品。它们中的每一张,都可以在主流App中被识别,相比市面上的竞品,从数据隐藏的巧妙性到可识别性的保证,做出了最佳的平衡。

这个Chanel包的二维码很有意思,当初的构想是联名做一款可以被扫描的包,再保证审美的基础上可被扫描也可以是商品本身的一个传播和售卖点。

蛋糕店,水果店也可以有自己栩栩如生的二维码,再可读性及内容保留两个角度达成了新的平衡。这使得“可交互的数据内容”同样可拥有不错的审美价值。

远望:在“小而深”的领域,创造独一无二的价值

这次对二维码的极限探索,让我对“专注”与“深度”有了新的思考。大模型让知识的广度无限扩展,而那些精深领域在大模型的知识中是稀疏的,仅是“不合算的参数”。所以在我看来未来很多机会可能更属于“超精细”的垂直细分领域。在这些“小而深”的领域里精细打磨,去创造出那种无法被轻易复制的、独一无二的价值令人兴奋,也能帮我们走得更远。

AI赋予了我们前所未有的能力,但最终能让我们脱颖而出的,或许并不是对“广度”的追逐,而是我们选择在哪个足够小的领域里,愿意投入足够多的“深度”。

more
Back