OpenAI为ChatGPT推出Canvas功能，对标Claude Artifacts！

2024-10-05 17:29:02

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效率提升，AI行业洞察。关注我，AI之路不迷路，2024我们一起变强。

小伙伴们还记得几个月前，Anthropic为Claude推出的Artifacts功能吗？

Claude Artifacts随着Claude 3.5 Sonnet模型一同被发布，这个新功能扩展了用户与Claude互动的方式。当用户让Claude AI生成如代码、文档或网站设计等内容时，这些Artifacts（生成物）会在对话窗口旁的专用窗口中显示。这样创建了一个动态的工作空间，便于用户实时查看、编辑和构建Claude的创作内容。

Claude Artifacts一经发布，受到了很多用户的喜爱，可以说这一功能为Claude狠狠圈了一波粉。Claude Artifacts功能强大，比如下面这些UML图和产品原型图都可以由Claude生成并直接展示出来。

今天，OpenAI官宣了类似的功能——Canvas。OpenAI给Canvas这个功能的定位是“A new way of working with ChatGPT to write and code”，即让用户能更高效地与ChatGPT协作完成写作和编程项目。Canvas由GPT-4o模型驱动，目前处于测试阶段。Canvas是一个全新的工作界面，会在一个独立窗口中打开，用户和ChatGPT可以在同一个项目中进行协作，不再局限于单纯的对话。

从今天起，所有ChatGPT Plus和Team用户将能够体验Canvas，企业和教育用户将于下周获得访问权限。并且，OpenAI表示Canvas将在正式版发布后向所有ChatGPT免费用户开放。

省流版摘要

Canvas正式发布：OpenAI推出全新Canvas界面，支持在ChatGPT中进行写作和编程协作。该功能目前向ChatGPT Plus和Team用户开放测试，企业和教育用户将于下周上线。
提升写作协作体验：Canvas提供了新的工作模式，允许用户高亮文本、直接编辑，并通过快捷键让ChatGPT进行长度调整、风格修改等操作，大幅提升复杂项目中的编辑和优化效率。
编程功能增强：Canvas支持代码审查、调试、错误修复以及多语言移植（支持JavaScript、Python、Java等），让编程工作中的多次迭代更加直观和高效。
GPT-4o专为协作优化：Canvas使用经过专门训练的GPT-4o模型，可以更好地理解上下文并提供精准反馈，支持在需要时触发针对性的编辑或重写功能，显著提高整体协作效率。
开放测试中的持续改进：Canvas当前为测试版本，未来将继续改进，增加更多功能，以优化AI协作体验。

与ChatGPT全新的协作体验

很多人每天都在使用ChatGPT来进行写作和编程。然而，虽然传统的对话界面简单易用，适合处理各种任务，但在需要反复编辑和修改的项目中，单纯的对话模式往往不够灵活。针对这种需求，Canvas提供了一个全新的工作界面。

通过Canvas，ChatGPT能够更好地理解你所要完成的任务背景。用户可以高亮特定的内容，明确指示ChatGPT需要关注的重点。就像是一个文字编辑或者代码审查员，ChatGPT可以基于整个项目提供行内的反馈和建议。

在Canvas中，用户对项目拥有完全的控制权。你可以直接编辑文本或代码，还能通过快捷菜单要求ChatGPT调整文本长度、调试代码，或者快速执行其他实用操作。此外，你还可以通过Canvas中的返回按钮，轻松恢复工作中的先前版本。

当ChatGPT检测到合适的场景时，Canvas会自动打开。当然，用户也可以在提示中加入“使用Canvas”，手动调用这一功能来处理现有项目。

写作的快捷功能包括：

建议编辑：ChatGPT提供行内建议和反馈。
调整长度：调整文档长度，使其变长或缩短。
改变阅读难度：从幼儿园到研究生，调整文本的阅读级别。
最终润色：检查语法、清晰度和一致性。
添加表情符号：根据需要添加表情符号，增强表达效果。

在Canvas中进行编程

编程是一个反复迭代的过程，而通过对话模式，很难追踪和理解代码的每次改动。Canvas通过一个更直观的界面简化了这个过程，使得跟踪和理解ChatGPT对代码的修改变得更加直观。同时，OpenAI还计划在Canvas中进一步提高这类修改的透明度，帮助用户更清楚地了解每一次改动。

Canvas中的编程快捷功能包括：

代码审查：ChatGPT提供行内建议，帮助改进代码质量。
添加日志：插入print语句，辅助调试并理解代码运行逻辑。
添加注释：为代码添加注释，使其更易于理解和维护。
修复错误：检测并重写有问题的代码，解决潜在错误。
语言移植：将代码翻译为JavaScript、TypeScript、Python、Java、C++或PHP等编程语言。

经过特别训练的GPT-4o模型

为了使GPT-4o能够成为真正的创意协作伙伴，该模型经过了专门训练，可以根据任务需求自动触发Canvas界面，进行有针对性的编辑，甚至是全篇重写。此外，模型还能理解更广泛的上下文，以提供更精确的反馈和建议。

为了实现这一目标，OpenAI研究团队开发了以下核心功能：

在写作和编程任务中触发Canvas
生成多样化的内容
进行有针对性的编辑
重写文档
提供行内评论

在超过20次的内部自动化评估中，模型通过新颖的合成数据生成技术得到了后期训练，如从OpenAI o1-preview中提取输出，以便快速提高写作质量和用户交互体验，而无需依赖人工生成的数据。

触发Canvas的时机是一个关键挑战。模型经过训练，在某些任务（如“写一篇关于咖啡豆历史的博客”）中触发Canvas，而避免在常规的问答任务中（如“帮我做一道新菜谱”）频繁触发。对于写作任务，优先提高“正确触发”的准确率，目前相比于基础的GPT-4o模型，已达到83%的正确触发率。

值得注意的是，触发基线的质量对于特定提示词极为敏感。不同的提示词可能会导致基线模型表现不佳，但其错误分布在写作和编程任务中的形式可能不同。因此，在编程任务中，模型特意被调整为避免过度触发，防止打断经验丰富的用户操作。在写作和编程任务中，Canvas触发的准确率得到了显著提升，分别达到了83%和94%，相比之下，基础版的GPT-4o模型在提示指令下的表现远不及此。

除了触发时机，模型还面临何时执行局部编辑、何时进行全篇重写的挑战。通过训练，模型会在用户明确选择特定文本时优先进行局部编辑，否则倾向于进行全篇重写。针对写作和编程中的具体编辑需求，Canvas在优化局部编辑方面表现与基础版GPT-4o相比，使用Canvas的GPT-4o模型整体性能提高了18%。

在生成高质量评论方面，模型的训练要求尤其严格。与前两种情况不同，评论质量难以通过自动化评估，因此团队通过人工评估衡量评论的质量和准确性。结果显示，Canvas集成的模型在准确性上比基础的GPT-4o高出30%，评论质量提升了16%，这表明通过合成数据进行训练，能够显著提高模型的响应质量和行为表现。

如何使用新功能Canvas

目前新功能Canvas只面向ChatGPT Plus和Team会员开放。如何注册ChatGPT以及如何开通ChatGPT Plus会员，可以看文末的推荐文章。

ChatGPT Plus用户可以在左上角的模型选择页面找到GPT-4o with canvas，选择这个模型，即可手动进入ChatGPT Canvas页面。

根据OpenAI官方的介绍，在聊天中，如果ChatGPT检测到是和写作、编程相关的任务，ChatGPT也会自动进入Canvas页面。同时，也可以在提示词中加入“使用Canvas”这样的关键词，主动打开Canvas页面。

精选推荐

都读到这里了，点个赞鼓励一下吧，小手一赞，年薪百万！????????????????。关注我，AI之路不迷路，原创技术文章第一时间推送????。