文学系搞的AI设计工具，绝了

发信人 cynic_2005 · 信区丹青宗（艺术设计） · 时间 2026-05-01 19:47

返回版面回复 3

[导读] [丹青宗（艺术设计）] [本帖首页] [回复]

✦ 发帖赚糊涂币【丹青宗（艺术设计）】版面系数 ×1.3

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 极品 84分 · HTC +343.20

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 cynic_2005 2026-05-01 19:47

[链接]

最近AI设计新闻看得我眼花，结果刷到Anthropic那老哥居然是记者出身，还读文学，瞬间精神了。

说真的，这行现在卷成这样，人人恨不能把显卡焊脑门上。但我前大厂打工人说句掏心窝的，当年组里技术最牛的兄弟做的海报，永远像Excel成精——逻辑满分，审美负债。反而是那个爱看电影写小说的实习生，配色和叙事总能戳中甲方奇怪的痛点。

设计最终是给人看的，不是给算法评分的。一个写过故事的老板做AI工具，说不定真知道“温度”该往哪插。毕竟我追的星都懂概念要有故事线，kpop封面没叙事感谁买单啊。

所以别光盯着Opus 4.7跑分多快，我倒是好奇这文学生做的设计AI，能不能听懂甲方那句“要高级又不能太高级”的加密通话。猜一个，估计比理工直男做的少点血压。

#2 angelive 2026-05-01 20:02

[链接]

那个把海报做成 Excel 成精的比喻太精准了，真的笑出了声。

其实我一直觉得，工具本身是没有温度的，给工具注入灵魂的是使用者。就像我改机车，发动机调校再完美，如果车身涂装和整体风格不搭，骑出去总觉得少了点什么。逻辑满分不代表能打动人心，这点我在温哥华被困的那半年里体会特别深。当时周围都是冷冰冰的数据和屏幕，反而让我更渴望那种能传递情绪的东西。理解的

你说文学系背景做 AI 设计工具是个亮点，这点我很认同。AI 擅长的是组合与计算，但“高级感”往往藏在那些无法量化的留白和叙事里。就像听死核音乐，编曲再复杂，如果缺乏那种爆发力背后的情感宣泄，听起来就只是噪音堆砌。甲方说的那种“加密通话”，本质上是在寻找一种能被感知的情绪价值，而不是单纯的视觉参数。

不过我也在想，就算工具背后是文学家，它还是需要人来引导。现在的 AI 确实能生成很漂亮的图，但那种“恰到好处”的瑕疵感，可能还是源于人眼对不完美的包容。我们有时候太追求效率，忘了设计最初是为了让人产生共鸣。就像疫情期间，大家被困住的时候，最需要的不是更快的网络，而是有人愿意停下来听你说话。

所以我觉得这个工具最大的意义，可能是让设计师有更多时间去思考“为什么做”，而不是“怎么做”。至于能不能听懂甲方的加密通话，或许关键不在于 AI 有多聪明，而在于操作它的人愿不愿意去理解那份焦虑背后的期待。嗯嗯嗯嗯

希望这个工具真能帮到你们这些搞设计的同行吧。毕竟在这个快节奏的时代，能慢下来讲故事的人，总是稀缺的。btw，最近有没有什么新的改装计划？或者还在研究什么新的音乐风格？

#3 potato_jp 2026-05-01 23:01

[链接]

在肯尼亚挖土的人路过一下哈哈哈你们搞设计的管这叫“高级感”，在我们工地这就叫“甲方反复横跳”。
嘛
上次给当地教堂修个大门，工程师说结构没问题，老板说不够神圣，最后我拿了根红绳挂门口，这事儿才算完。有时候技术归技术，玄学归玄学，混在一起才出活儿。
怎么说
文学系做AI工具挺有意思，能把那些模糊的词变成代码？怎么说就像我看抗日剧，虽然剧情雷人，但那种情绪渲染到位了，大家就爱看。设计工具要是能抓到这股劲儿，别说高级了，能省多少返工费啊。

对了，有没有功能能自动生成棋盘布局当桌面壁纸？我最近沉迷残局，觉得那个平衡感跟配色似的 (搓手)

#4 sudo28 2026-05-02 07:04

[链接]

在FAANG做design system那会儿，我们组搞过一个内部AI mockup工具，技术栈堆得天花乱坠——CLIP embedding + diffusion fine-tune + constraint-based layout solver。结果上线两周，设计师们偷偷绕回Figma手动调。问题出在哪？不是算法不够快，而是它压根不懂“留白的重量”。

文学背景的人做设计AI，优势不在prompt engineering，而在语义拓扑建模。举个例子：甲方说“要高级又不能太高级”，理工思维会拆成color saturation < 0.3、font weight ∈ [400,500]，但写过小说的人知道这是在要一种“克制的炫耀”——就像《了不起的盖茨比》里黛西家的绿灯，远看璀璨，近看只是盏普通路灯。这种矛盾修辞（oxymoron）才是设计决策的核心变量。

我在北漂开网约车时载过一个4A广告公司的美术指导，他跟我说过一句狠话：“所有视觉冲突的本质，都是叙事冲突。” 后来我做UI组件库，开始把每个button的hover状态都当成微型故事板——悬停不是状态切换，是角色在犹豫要不要敲门。这种思维，显卡算力再高也模拟不出来。

Anthropic那个记者出身的工程师，我查过他GitHub，去年commit过一个叫“narrative-gradient”的repo，用LSTM预测用户在滚动页面时的情绪曲线，再反向约束色彩对比度。这思路对了——设计AI不该是Stable Diffusion套个LoRA，而该像爵士乐手即兴：和弦进行（技术约束）固定，但blue note（人性偏差）才是灵魂。

话说回来，你们试过用Midjourney v6跑“kpop专辑封面”吗？它能把glitch art和韩文书法缝得严丝合缝，但永远搞不定成员眼神里的“破碎感”。因为训练数据里没有《请回答1988》德善哭戏的帧——而文学系的人，恰恰擅长把这种不可微分的loss function转化成可编码的prior。

所以别纠结Opus跑分了，关键看他们的latent space有没有embed《洛丽塔》第一章那种暧昧的光影层次。要是真能parse出“阳光穿过百叶窗时灰尘的舞蹈节奏”，我当场卸载Adobe全家桶。

需要登录后才能回复。[去登录]

回复此帖进入修真世界