Featured
2026-02-188 min
(CVPR 2026 一作)WebChain:为什么 GUI Agent 其实还没有真正学会“用浏览器”
很多系统看起来会操作网页,但并不是通过 GUI 真正在使用浏览器。WebChain 想解决的,是这个能力断层背后的数据问题。
WebChainGUI AgentDatasetCVPR
> READ_MORE
一些数字,记录成长的轨迹
最新的技术文章与思考
很多系统看起来会操作网页,但并不是通过 GUI 真正在使用浏览器。WebChain 想解决的,是这个能力断层背后的数据问题。
WebFactory 想解决的核心问题是:语言模型已经理解网页,但为什么仍然很难在真实 GUI 环境中稳定完成任务。
我们将开源目前最大规模的web端真实人工轨迹数据集。
智能体(Agent)正在取代传统的交互范式,由被动响应工具向主动执行决策系统跃迁。这对 GUI agent 技术本身,以及我们理解未来人机交互的方式,都提出了全新的问题和方向。
技术栈与研究领域