论文
登录后可查看剩余解析次数。
标签筛选
在线购物行为建模
PAARS: Persona Aligned Agentic Retail Shoppers
发表:2025/3/31
基于大语言模型的推荐系统在线购物行为建模用户画像生成与应用代理人行为模拟消费者行为分布对齐
本文提出PAARS框架,基于匿名购物数据自动挖掘人格画像,创建具零售工具的合成购物智能体,重点从群体层面对齐模拟行为与真实人类分布。实验验证人格画像提升了对齐效果,展示了智能体在自动化A/B测试中的潜力。
02
Customer-R1: Personalized Simulation of Human Behaviors via RL-based LLM
Agent in Online Shopping
发表:2025/10/9
大语言模型强化学习训练基于大语言模型的动作规划个性化用户行为模拟在线购物行为建模基于奖励信号的行为生成
本文提出CustomerR1,基于强化学习的大语言模型智能体,针对在线购物环境中用户个性画像,实现个性化逐步行为模拟。方法结合用户画像信息,通过动作正确性奖励优化行为生成,在OPeRA数据集上显著优于提示和监督微调方法,提升个性化行为预测准确性和保真度。
019
Shop-R1: Rewarding LLMs to Simulate Human Behavior in Online Shopping
via Reinforcement Learning
发表:2025/7/24
大语言模型强化学习训练大语言模型推理能力增强基于大语言模型的动作规划模拟人类行为在线购物行为建模
本文提出ShopR1框架,通过强化学习分别奖励推理生成和行动预测两个阶段,利用模型内信号和层次化难度感知奖励,显著提升LLM在线购物行为的模拟能力,实验显示性能较基线提升65%以上。
016