Cursor AI 编程平台对其核心的 Tab 自动补全模型完成升级,此次优化的关键在于引入强化学习技术,对代码建议机制进行了全面革新。
该模型能根据开发者的实时反馈动态调整:当代码建议被开发者接受时,模型会获得正向奖励;若建议被拒绝,则会受到反向惩罚,通过这种 “反馈 – 奖惩” 的循环持续优化建议的精准度。升级后成效明显,不仅代码建议数量减少 21%(有效剔除无效建议),建议接受率还大幅提高 28%,极大降低了开发者的修改成本,显著提升了编码效率。
目前,Cursor 的 Tab 模型每日需处理超过 4 亿次代码建议请求,平台方面表示,未来将继续对这一强化学习优化机制进行迭代,进一步提升模型性能。

.
.
