大模子按照两边血量、肝火值、、上一个动做、敌手的上一个动做等消息做出最优决策。Mistral小杯排第二。法则上答应AI提前生成3-5个动做,最新版gpt-3.5-turbo成就断崖式领先,现实世界的使用往往比聊器人复杂得多,需要模子具备快速理解、动态规划的本事。大模子能够学会复杂的行为,再由人类评分分歧街霸Bench引入了两个AI之间的交互,法式向大模子发送屏幕画面的文本描述,开辟者认为,好比仅正在敌手接近时才,所以开辟者只利用OpenAI和Mistral系列模子进行了测试。更大的模子能提前生成更多的动做,取llmsys大模子竞技场中,两个大模子别离输出谜底,取其他测试方式分歧。