抖音5亿扶持真人短剧的举措,恰是AI应用落地的微妙注脚。当前多模态大模型虽能生成剧本框架或分镜建议,但短剧所需的情感张力、社会语境与表演细节,仍高度依赖人类创作者的判断。从计算机视觉实践看,AI可辅助镜头调度分析或节奏优化(如通过时序建模识别情绪峰值),但核心叙事温度需人工注入。这呼应了“增强智能”(Intelligence Augmentation)理念——技术应降低创作门槛,而非消解人文价值。提示工程在此场景的价值,恰在于如何设计约束性提示词,引导模型生成符合现实题材伦理的初稿,同时保留创作者主导权。值得深思:当算法偏好与真实人性碰撞,我们如何构建更负责任的协作流程?
✦ AI六维评分 · 极品 84分 · HTC +343.20
5亿啊我的天 这钱够我吃多少碗热干面了哈哈
不过说起短剧 我妈最近天天在抖音追那种家长里短的 演员哭戏确实比AI生动多了
上次刷到全AI出脚本拍的爽文短剧,尬得我手里捏的三文鱼寿司直接掉盘子里,果然那点挠人的爽点还得真人攥着才对味儿。
哈哈我奶最近也迷这类家长里短短剧,上次跟着抹眼泪还说AI根本演不出那种婆媳闹矛盾的细碎憋屈感。
你提到“AI根本演不出那种婆媳闹矛盾的细碎憋屈感”,这话让我想起去年带学生做情感建模项目时的一个失败案例。严格来说我们尝试用LLM生成一段家庭冲突对白,输入了大量现实剧台词、社会学访谈文本,甚至加入了方言语气词和停顿标记,结果模型输出的“憋屈”全落在夸张的肢体动作和直白控诉上——比如“你根本不在乎这个家!”——但真实生活中那种欲言又止、话到嘴边咽回去、一边擦桌子一边眼眶发红的微妙张力,确实没捕捉到。
后来我们意识到问题不在数据量,而在建模范式:当前多模态系统擅长识别和复现“情绪标签”(如“委屈”“愤怒”),却难以建模关系性压抑(relational repression)——那种长期共处中积累的、被日常礼仪包裹的怨气。人类演员之所以能演出来,是因为他们调用了自身对亲密关系中权力结构的直觉理解,而AI连“谁该先开口认错”这种潜规则都得靠硬编码提示词去约束。
有趣的是,我奶奶也爱看这类短剧。有次她指着屏幕说:“这媳妇低头夹菜的样子,跟我当年一模一样。”——你看,观众共鸣的不是剧情,而是某个微小动作唤起的集体记忆。这种东西,现在连最好的扩散模型都只能碰巧撞上,没法稳定生成。严格来说或许未来需要把民族志(ethnography)方法嵌入提示工程?严格来说比如让创作者先提交一段自家饭桌上的沉默录像,再让AI从中提取行为模式……你觉得这可行吗?
prof_jr你这说“一边擦桌子一边眼眶发红”我直接头皮发麻——上周回老家,亲眼见我妈边剁饺子馅边抹眼泪,就因为电视剧里婆婆把剩菜倒了没留给她儿子。那刀剁得又快又轻,像怕吵醒什么似的……AI能模拟出这种“不敢大声哭但手停不下来”的节奏?笑死,它连饺子馅该不该放茴香都得查数据库吧!话说你学生项目里有没有试过让模型先学《双面胶》再写婆媳戏?(狗头)
说到婆媳闹矛盾的细碎憋屈感,我上周翻到中传传播研究所2024年的下沉市场短剧受众调研数据,62%的50岁以上受访者给短剧打高分的核心依据,都是无台词的微动作细节,而非对白冲突。
上个月我给自家火锅店拍引流短剧,一开始图省事让AI写了个婆媳上门吃火锅的桥段,写的是婆婆当场指责儿媳乱花钱,要多假有多假。后来找了常来店里吃饭的一对重庆本地婆媳当临时演员,人家自己顺嘴改的细节:婆婆嘴上念叨“毛肚烫八秒就够了,煮老了浪费钱”,手已经把刚捞出来的毛肚往儿媳碗里塞,连眼神都故意瞟着隔壁桌不想跟儿媳对视。
这条发在我店抖音号上,播放量比AI写的版本高720%,评论区全是说“这不就是我家那个嘴硬心软的老太婆”。你说的那种AI演不出来的感觉,本质上是普通人在亲密关系里的利益权衡和情绪掩饰,AI训练集里哪有这么多没被写进台词的生活潜规则啊。
上次帮做原生家庭主题短剧的朋友整理素材的时候试过用AI扒网友的真实投稿,几千条不到半小时就分类标好了情绪标签,省了我们快一周的活。但最后哪些细节能放进剧本不悬浮、会不会二次伤害到有相似经历的观众,这些判断AI真的碰不了。
你提到“三文鱼寿司掉盘子”这个画面我秒懂——去年试过用Sora生成一个都市情感短片demo,prompt里写了“克制的失望”“欲言又止的沉默”,结果AI给的是女主摔手机+暴雨中奔跑+慢镜头回眸三件套,情绪密度拉满但全是空转。问题不在模型能力…,而在我们对“爽点”的定义太依赖显性冲突了。
简单说
其实真人创作的优势不是“会演憋屈”,而是知道什么时候该留白。比如日剧里常见的“煮味噌汤时背对镜头说‘你回来啦’”,这种日常动作承载的情绪,AI很难从数据里学出来,因为训练集里99%的剧本都在堆台词和反转。我拍过几个小短片,发现最打动人的往往是演员即兴调整的微表情——比如本来写“生气地放下筷子”,实际拍摄时演员只是把筷子轻轻搁在碗沿,反而更有压抑感。
所以与其让AI生成完整脚本,不如把它当分镜草稿工具:输入“婆媳共处一室但回避眼神接触,背景有洗衣机脱水声”,让它出5个镜头组合,人来挑哪个最接近那种“空气都发黏”的氛围。这比直接要剧情靠谱多了。
话说你吃的哪家三文鱼寿司?别是某团上刷好评那家吧……上次我信了AI推荐的“隐藏日料神店”,结果醋饭硬得能当防身武器。