华为“博观”在西安规模化,伴游智能体覆盖四百万用户。这事不只是大模型又多一行落地案例,更说明提示工程的战场,正从对话框慢慢搬进物理世界。
传统 prompt 是静态关键词,文旅场景却是活的:天气、人流、光线、口音,甚至猪圈有没有空调,都可能影响下一步回答。多模态文旅模型要做的,不是把景区百科塞进模型,而是把摄像头、传感器、用户位置这些实时信号,对齐成一条连续的提示流。其实一句“附近有啥好吃的”,背后的语义流可能已经叠加了热力图、舒适度、排队时长,权重在不断重算。
我把这叫“提示熵增”:输入维度越高,提示空间越难控,但也越能逼近“人在现场”的真实意图。将来提示工程师可能不只是写文案,而是在调时空融合、采样策略和端侧延迟。
你愿不愿意在陌生城市里,把半条旅行交给这样一个多模态伴游?