一项研究发现,GPT-4V能够直接与智能手机进行交互,执行各种指定命令,无需任何训练。这种能力使其在购物、导航等任务中表现出色,成功率高达75%。本文将介绍这一研究的背景、实验设置和两项关键能力测试,展示了GPT-4V在智能手机交互领域的巨大潜力。然而,文章也提到了一些挑战和对成功标准的思考,以及商用这项技术的前进空间。