Author image

发布者Sualeh

我们的问题

我们期待在 2023-2024 年为 Cursor 解决的一系列问题。

更新:我们写了一些关于更多问题的内容。

一个无序的简短、具体问题列表

  • 更好的上下文:代码编辑器中存在许多信息来源:打开的文件、语义上类似的代码片段、符号连接的类、lint 输出、执行跟踪、git 历史记录、输入历史记录、外部文档等等。我们希望模型能够立即理解与用户问题最相关的内容,并且目前正在训练一个自定义且快速的重新排序模型来解决此问题。对于每个请求,我们将从所有不同的来源收集 500k 个标记,并使用我们的重新排序器将其过滤为最相关的 8k 个标记。这既是模型问题,也越来越成为基础设施问题。
  • “编辑的副驾驶”:虽然 Github Copilot 在编写新代码时极大地有助于消除低熵击键,但它并不能帮助你在需要对现有代码块进行小的、简单的更改时节省低熵击键。想想你需要进行的导航、删除和输入击键,以便进行比符号 F2 重命名稍微复杂一点的重命名。我们需要在 UX(在你编码时向你显示的非侵入式差异)和模型端(提示不起作用,因为存在成本、延迟和智能问题)方面进行创新。
  • 受限的、流程中的代理:想想 OpenAI 的代码解释器,但适用于大型代码库中的工程。你告诉一个受限的、几步操作的代理要做什么,它会为你搜索、编写和运行代码,同时每隔一段时间会向你咨询反馈。我们现在正在努力实现的第一步是创建一个这样的代理,它可以处理几个几十万个标记的文件夹。如果成功,我们将将其扩展到适用于整个代码库。
  • 错误查找:这里有两种模式:(1)在后台,Cursor 将始终被动地扫描你的文件以为你查找潜在的错误,以及(2)当你在深度调试会话中时,Cursor 将在你帮助下主动查找错误。这里有很多有趣的数据收集工作要做。
  • 更大的编辑:Cursor 应该能够为你修改整个文件,甚至整个目录。这是一个功能和 UX 的挑战。为了提高速度,模型需要足够智能地选择要修改的部分,而无需重写所有内容。为了获得良好的体验,更改需要以可解析的、实时的形式显示。
  • 规模:截至 2023 年 10 月 12 日,我们已建立索引 14 亿个向量和 15 万个代码库。到今年年底,这可能会增长 10 倍。我们已经用 Rust 构建了一个非常快速的基于 Merkle 树的代码库同步引擎,并且可能很快需要构建一个自定义索引系统。

未来想法

  • 时间扭曲:预测并显示你在未来 15 分钟内将进行的跨文件代码更改。一个关键命令来接受所有插入/删除操作。
  • 理解:我们的模型应该深刻理解任何代码库中的所有概念,体现在权重中。
  • 阅读模式:通过任何级别的特定文档和引导你完成相关代码路径的机器人,根据需要进行解释,使代码理解变得轻松。
  • 伪代码模式:编辑代码的“大纲”表示形式,并自动将更改应用于源代码级别。
  • 永远不必再担心堆栈跟踪:IDE 应该能够理解并自动为你修复代码。

我们试图收集我们现在正在考虑的所有问题,但——这是构建自己每天使用 12 小时的产品的奇妙之处之一——我们不断产生新想法并重新确定优先级,因此这不能被视为最终路线图。也就是说,我们希望它能让你了解我们每天都在思考什么。

此外,你已经阅读了相当长的时间,所以你可能对我们感兴趣的问题也有一些兴趣:)。如果是这样,你应该考虑加入我们!以下是一些我们认为你会喜欢与我们一起工作的原因

  • 人们喜欢使用 Cursor。我们对最初的增长感到非常高兴。

  • 你会与非常聪明的人一起工作。我们深信人才密度。你在这里合作的每一个人都会非常优秀。

  • AI 编码是一个巨大的市场。并且我们可以赢得它。

  • 很有趣。这对我们来说非常重要!与你喜欢的人一起工作很有趣,构建一个产品很有趣,在这个产品中,你点击 Cmd-Shift-R 并获得即时的用户反馈,因为你自己在编码时就是目标用户,并且每天朝着自动化编程所有无聊部分的方向取得一点进展也很有趣。

  • 我们努力工作。我们很幸运能够解决这些问题,并且乐于倾注所有精力去解决它们。

Anysphere制作
SOC 2 认证