导 读
自从ChatGPT爆火之后,美国国防采办专业人员一直在尝试使用它和其他生成式人工智能系统,来帮助应对国防采办的工作。
一、应用方向
美国空军研究实验室首席信息官兼数字能力局局长Alexis Bonnell表示,生成式人工智能允许国防采办人员组织非结构化信息,如行动后报告、研究、白皮书、规章制度和合同。曾任美国国防部长办公室作战测试和评估主任的Douglas Schmidt表示,尽管生成式人工智能已经公开两年多了,但采购人员仍然不熟悉它,即使是那些熟悉它的人也往往没有尽可能有效地使用它。
2025年1月下旬,OpenAI推出了ChatGPT-Gov,这是ChatGPT的一个新的定制版本,旨在为美国政府机构提供访问该公司前沿模型的额外方式。Open AI的一份新闻稿称,“我们相信,美国政府采用人工智能可以提高效率和生产力,对于保持和加强美国在这项技术方面的全球领导地位至关重要。”
从供应商识别和合同撰写到定价和成本合理性分析,以及过去的表现分析甚至提案评估,人工智能在采购领域不乏用例。像ChatGPT这样的生成式人工智能工具可以在以下几个方面帮助加快国防采办系统的速度。
1、成为原型制作等领域的“加速器”
生成式人工智能可以很快帮助加速软件原型或软件模型的创建。该技术可以验证软件是否可以执行某些任务,并帮助将其连接到其他系统。
2、软件验证
软件验证非常繁琐耗时,涉及大量的测试,生成式人工智能在帮助“创建”测试用例方面非常出色,它也有助于创建建模和进行与软件验证相关的一些数据分析。
3、监管和政策合规
国防采购领域有很多监管文件、PDF文件、各种形式的Word文件,很多人力密集型活动都是将当前系统或采购的结果与这些监管文件进行比较,看看是否存在一致性或不一致性。生成式人工智能非常擅长处理“信息技术”信息,例如提供一份监管文件和相关项目信息,然后要求它突出不一致或可能存在漏洞的地方。
4、市场调研
生成式人工智能可以在开发全新技术之前了解其他替代方案,也可应用于年度报告,以评估趋势或值得关注的领域。
5、测试和评估
如今的趋势是尽早将使用武器系统的作战人员纳入所谓“接触点 ”流程,而生成式人工智能模型可以帮助操作人员了解他们将遇到的实际界面是什么样子的,可以更早地开始进行用户测试。开发人员不需要等到采办过程的后期才拥有完全实际的界面,他们可以更快地开始创建这些模型,并对其进行迭代。美军已经开始在业务测试中看到这样的情况。
6、供应商识别和审查
生成式人工智能可以快速从大量来源中提取信息。潜在的国防供应商——从提供制服的供应商到开发下一代武器系统或提供运营支持服务的供应商——代表着一个独立的世界。未来人工智能工具可以挖掘出之前与该组织合作过的公司的综合能力,并根据其满足需求的潜力缩小名单。通过生成一份可能在北约供应商数据库中,也可能不在的供应商名单,以最少的员工努力扩大潜在供应商的范围。
风险是供应商审查的主要组成部分,而人工智能在这方面也大有可为。它可以评估供应商及其分包商,以确保他们没有与受制裁国家合作、没有被空壳公司控制、没有被禁止或暂停资格等。
它的功能可扩展到帮助员工评估业务风险,例如供应商是否有按时、按预算交付的历史,以及他们的财务状况是否稳定。这是北约等将通用人工智能纳入其整体人工智能战略的原因之一。
7、编写国防合同
即使使用合同编写软件,采购专业人员也会花费大量时间起草工作说明并审查条款和条件。但出于安全和其他原因,目前无法在 ChatGPT 中输入“为主要武器系统创建征求建议书(RFP)草案”。
美军采办系统的愿景是,通过访问大量法规库和现有招标和合同,以国防为重点的新一代人工智能工具可以为专家生成征求建议书(RFP)和合同草案,然后根据特定的业务需求进行定制。
使用人工智能编写合同将提高生产率并加快采购速度。另一方面,新一代人工智能还需要几个版本才能实现许多所需的功能。例如,目前,通用大语言模型仍然无法根据国际协议为单一来源采购起草论证和批准书(J&A)。
二、典型应用案例
美国陆军CalibrateAI试点项目旨在探索生成式人工智能在该军种采购活动中的潜在应用。与此同时,官员和专家表示,整个国防部正在齐心协力,不仅将先进能力交到作战人员手中,还将交到购买其装备的人手中。
CalibrateAI项目由陆军采购、后勤和技术助理部长领导,负责数据、工程和软件的陆军副助理部长负责,将利用管理咨询公司LMI开发的生成式人工智能解决方案LIGER,该解决方案“旨在提供与特定主题高度相关的定制响应,提高信息检索和分析的效率和有效性”。LMI 发布的消息称,该部门将使用 LIGER 来简化复杂的任务;查找和综合来自陆军政策、市场研究和采购文件的信息;并更快、更高效地开发高质量的产品。
美国陆军发言人在一封电子邮件中表示,该部门打算通过CalibrateAI试行的一项任务是汇总和总结对信息请求的回应。试点将持续到2025财年第二季度,陆军希望该项目能够为陆军更广泛地采用人工智能找到一条经济有效的途径。
新闻稿指出,LIGER可以处理受控的非机密信息数据,“确保敏感信息以最高安全级别进行管理”,并且还包括可定制的用户访问控制以保护“需要知道”的信息。
使用生成式人工智能的一个潜在风险是出现“幻觉”的可能性,即包含虚假或误导性信息的反应。
陆军发言人表示,CalibrateAI将帮助陆军“开发出识别幻觉的正确方法。该工具本身将包括引用所有来源,以确保我们的人员能够根据需要限定和验证信息,并指出答案何时可能是幻觉。”
美国国防部首席数字和人工智能办公室(CDAO)主任拉达·普拉姆博士表示,该办公室也在投资采购人工智能工具。AcqBot大语言模型,可以帮助合同官员更快地撰写合同。AcqBot吸收合同语言,“它可以做的是采用合同语言和合同工作流程,并为合同官员完成流程的一些初始创建和生成部分”,将合同书写速度提高约400%。
“在合同撰写过程的每个阶段,仍然有专门的人工监督和验证文本内容——我们不会将合同撰写工作外包给机器——但合同撰写者不必查看数千页文件来撰写这些合同,”她说。“他们可以从实际的 AcqBot 工具中获得潜在的选择。”
工作组确定了生成式人工智能可以发挥作用的一个领域是项目管理,“其中算法可以查看历史绩效信息、成本数据、销售单据中的信息”以及供应链,“并将所有这些集中在一个地方,以便项目经理能够更好地监督他们的环境。”
此外,人工智能正在帮助该部门在预测性维护方面取得重大进展,预测性维护是一种持续监测平台状况的做法。人工智能可以帮助操作员评估更多不同的信息源,例如天气影响和系统的运行节奏,以根据当前的运行条件和特定平台的当前风险,真正了解他们可以或应该在哪些维护方面承担风险。Govini 开发了一套名为Ark的AI工具,一个项目办公室利用该工具主动监控其管理的700多万个零件,将寻找替代零件的时间缩短了98%。
美国国防部首席数字和人工智能办公室(CDAO)与国防采办大学和新成立的国防民事训练团合作,提供以人工智能为中心的培训和教育活动,重点关注人工智能在采办中的应用。
三、应用挑战
关于生成式人工智能可能出现的“幻觉”错误,美国国防部目前从小规模开始,然后再扩大规模。先在低风险、不太关键的领域使用生成式人工智能。虽然人工智能通常能很好地一次处理一份或几份文件,但还无法真正对过去30或40年的所有年度报告进行分析,因为这项技术还不具备这样的能力。这是一个需要更多研发的领域。美军测试与评估界将与各部门一起,学习生成式人工智能、如何测试它以及如何描述它的性能。
另一个潜在隐患是安全问题,美国国防部不希望自己的信息外泄。当生成式人工智能能够对大量、多样化的数据进行训练时,它的效果会最好。军事数据系统往往是孤立的,尤其是在北约这样的多国背景下,机密数据和非机密数据的环境是分开的。
此外,必要的数据池化通常涉及云环境,而安全性和数据主权可能是数据池化和数据环境方面的问题。此外,还需要考虑在拒绝、降级、间歇或受限通信环境中运行。
小结
与商业领域相比,将生成式人工智能融入军事采购需要更长的时间。但考虑到该技术的潜力、军事系统日益复杂、和人员配备挑战,在国防采办领域正确使用生成式人工智能将显著优化流程提升效率。但同时也要防范潜在的AI“幻觉”与数据安全问题。