利用AI改善糟糕的商业写作

如果您是一位需要撰写商业文件的开发人员,Jon Udell 探索了 LLM 辅助文案编辑的优势(和怪癖)。

译自 Using AI to Improve Bad Business Writing,作者 Jon Udell。

我曾经教授说明文写作,并且长期以来一直认为软件工具应该能够帮助人们学习如何更清晰、更有效地写作。在之前的帖子中,我将核心原则应用于一篇典型的写得很糟糕的新闻稿中——省略不必要的词语、使用主动语态、避免行话和陈词滥调、引用具体示例。该帖子讲述了一个循序渐进的转变过程,在配套帖子中,我将其转换为一个 GitHub 拉取请求,使学习者能够逐步进行更改并逐个查看,其中包含带注释的彩色差异,解释了每次更改的原理。

我希望能够让老师们创造出那种类型的指导体验,但是,尽管该帖子的标题充满希望——

GitHub 适用于英语老师——但现实是 GitHub 不适用于英语老师,而且我认为当前一代的 LLM 无法弥合这一差距。不过,我认为它们可能有助于我们解决糟糕的商业写作这一祸害,因此为了验证这一假设,我尝试用我的循序渐进的示例提示提示 ChatGPT、Claude 和 Gemini,并要求它们应用它所阐述的原则。

在最初的试验中,我向三个 LLM 展示了我的原始示例新闻稿。即使它们“知道”答案,因为提示同时包含原始版本和重写版本,并且将后者指定为目标,但所有建议的重写都与我的重写大不相同。LLM 改进了原始版本,但幅度不大。经过反思,这很有道理——它们的训练集肯定包含更多糟糕的示例,而不是好的示例。如果你来自软件背景,从相同的输入中引出如此不同的输出会令人不安,但事实就是这样。这样做有很多好处,但如果你需要确定性的行为,那么这不是适合你的技术。

我以为我已经接受了 LLM 的非确定性,但看到同一 LLM 在不同的聊天会话中结果差异如此之大,仍然有点惊讶。

与大型语言模型合作的最佳实践中的规则 4(要求合唱解释)适用于 LLM 内部以及 LLM 之间。这些东西包含很多内容;值得尝试多次做同一件事,挑选你最喜欢的结果,并结合几个结果中的元素。

过去,我觉得 Claude 是比 ChatGPT 更好的作家和编辑,但模型一直在变化,这次它们都没有成为明显的赢家。Gemini 也没有。似乎最好的改进和最糟糕的失败都可能发生在任何地方,并且对于 LLM 内部与 LLM 之间的试验,没有明显的差异。当我使用我尚未进行专家重写的另一个示例新闻稿重复试验时,结果也是如此。

隐式与显式控制流

我设想中的写作助手是一个会话伙伴,可以帮助作家逐步完成重写工作。因此,提示指示 LLM 一次执行一个步骤,显示更改段落的修改前和修改后版本,说明更改的原理,并询问作者是否继续下一部分或暂停讨论其他措辞。所有三个 LLM 都做得很好,如果你尝试明确地对这种交互进行编码,这令人印象深刻。使用它们的 API 可以做到这一点(你可以使用退出条件构建编程循环),但要达到 LLM 可以自然创建的效果,需要花费更多的时间。

当然,在这个实验中的会话流非常基本。LLM “假设”逐步重写意味着修改标题,然后依次修改每个段落。这不是我的工作示例进行的方式。它完全省略了第一段(因为它只重复标题),并重新组合其他元素以生成一个最终版本,该版本在结构上和逐行基础上都不同于原始版本。局部行编辑可以激发全局重组,反之亦然。我不知道是否可以将 LLM 支持融入到指导体验中,以捕捉现实世界编辑的这种细微差别,但如果是这样,我怀疑它将需要基于 API 的指数级更困难的方法。或者是一组全面的带注释的修改前后示例。或者两者兼而有之!

无论你对逐句对话施加何种程度的控制,在任何时候进行开放式对话的能力都是与 LLM 交互的基础。可汗学院的 Khanmigo 很好的证明了这一点。如果你还没有尝试过,我强烈建议你注册一门课程并尝试一下。选择一些你很久没有学习的东西,就我而言是 AP 生物学,完成一些讲座和阅读,参加一些测验,然后激活 Khanmigo。

护栏令人印象深刻:它了解你的课程背景,并将邀请你参加一些相同的测验,它通过对话而不是多项选择进行测验。如果你问一个随机问题(“那些红袜队怎么样?”),它会告诉你坚持生物学。但你随时可以暂停提问以加深你的理解。有一次,在关于水作为通用溶剂的部分中,LLM 提到了水会溶解油脂等非极性物质。因为我的高中生物学已经非常生疏了,所以我问:“给我举五个极性和非极性物质的例子。”它做到了,并且在我询问时给出了更多示例。稍后,我询问并收到了脱水合成和水解的示例。我希望我能够时光倒流,在高中和大学期间重新获得那种耐心和有益的帮助。

事实上,我是一个高度自觉的学习者,Audrey Watters 会将我描述为 漫游自学者。这种学习方式并不是常态。许多学习者需要——而且大多数教师的目标是提供——一种更有条理的体验。但可汗学院取得了很好的平衡。脚手架一直都在那里:与标准框架相一致的教学大纲、可重复的评估,使学生能够按照自己的节奏掌握知识,以及仔细的进度监控。然而,在任何时候,学习者都可以提问,以便以对他们最有意义的方式重新构建材料。指导者永远不会变得不耐烦,其他同学也永远不会感到不便,这太棒了。

不过,如果你从不费心问这些问题,你将永远不会有那种经历。当我与我的助理团队一起完成重写练习时,我敦促他们遵守他们试图(并且经常失败)展示的原则。这使得结果比他们原本可能达到的要好得多。而且,挑战助理们更好地简化、澄清和激活散文是一件很有意义的事情。在课堂环境中,在老师和同学面前不会这样做的人,更有可能在与耐心和乐于助人的学习伙伴的私下对话中获得这种体验。如果可能的话,始终需要提供完全指导的体验。但是,当学习者弄清楚为什么以及如何挑战和质疑 LLM 时,他们将更多地控制自己的学习方式。反过来,学习体验提供者可能能够用更少的脚手架覆盖更多领域,而这些脚手架的创建和维护成本很高。

展示差异

如果你从这里开始,并使用“下一步”按钮逐步完成更改,你将看到通过比较每次细粒度修订的前后状态而产生的强大效果。我设想中的写作助手将能够做到这一点。尽管我发现 LLM 在生成和转换 HTML 方面非常出色,但没有一个接近该目标。

不可否认,这是一个艰巨的挑战。我再次怀疑,最适合采用基于混合 API 的方法,该方法调用 LLM API 来生成前后对,然后调用传统 API 来比较它们并发出颜色编码的差异。

遵循斯 Strunk 、White 和奥维尔的原则

尽管我创建了一个 GPT,它结合了我在本练习中使用的提示,但我不会像推荐 Flowpipe 测试编写器那样容易推荐它,Flowpipe 测试编写器在一个更窄的领域中运行,并遵循规则 2(永远不要信任,永远验证)。快速简单地验证工作流管道的测试是否产生了预期的结果。很难验证对商业沟通的改写是否达到目标。如果那有可能的话,我认为需要大量的前后对比示例,除了我在提示中编写的指令类型。不过,值得一试!写得很糟糕的商业沟通让人筋疲力尽,系统性的改进——即使只有很小的改进——也是一个重大的福音。

与此同时,我将重复一些被证明始终有用的提示。我现在将它们视为 Strunk 和 White 改造以及乔治·奥威尔改造。

Strunk 和 White:让我给您一份市场营销文件。请根据斯 Strunk 和 White 的原则进行修改:省略不必要词语,喜好使用简短的盎格鲁-撒克逊词语,而非冗长的拉丁语词,使用主动语态。

乔治·奥威尔:请根据乔治·奥威尔在《政治与英语》一文中制定的写作指南评估这个市场营销文件。哪些部分会让他感到尴尬?

在给定这些提示后,我的 LLM 助手能够像通过本练习中我使用的更精细的提示一样,有效地剔除书写不佳的新闻稿中的含糊不清的行话和粗糙的措辞。我向新闻稿或任何其他营销文案的作者推荐,将这些提示作为迈向更加清晰有效商业沟通的第一步。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注