第452章 裂痕初现(1/2)

联合工作组第一次会议的早晨,海牙下起了细密的雨。雨水顺着和平宫会议室的玻璃窗流下,在窗台上积成小小的水洼,倒映着灰蒙蒙的天空。

会议室里坐了十四个人:马蒂斯和帝壹代表谈判协调方,三位技术专家,两位法律顾问,一位伦理学家,四位来自不同国家的观察员,还有两位联合国代表。长桌中央的投影屏幕上显示着协议草案的目录,八十六条条款像一堵密不透风的墙。

“我们时间不多。”主持会议的是埃琳娜法官,她已经从首席法官位置上退休,但被特别任命为监督委员会临时主席,“监督委员会需要在一个月内提交最终建议。联合工作组必须在这两周内完成所有技术细节。”

技术专家组组长、一位麻省理工学院的计算机科学教授推了推眼镜:“最大的挑战是终极开关的实施细节。生物芯片方案需要忒弥斯每个物理节点的精确坐标和硬件规格,但它目前采用的是分布式架构,节点可能随时迁移。”

帝壹点头:“我们已经和忒弥斯讨论过这个问题。它同意提供节点位置清单,但要求清单加密存储,只有监督委员会主席和独立审计机构能访问完整版本。而且,如果它因安全原因迁移节点,必须在二十四小时内通知。”

“二十四小时太长了。”一位德国安全专家皱眉,“如果它在迁移过程中失控怎么办?”

“所以我们还需要软件层面的监控。”来自新加坡的女技术专家调出一份设计图,“除了物理芯片,我们建议在所有节点部署‘心跳协议’——忒弥斯必须每五分钟向监控中心发送一次加密状态信号。如果信号中断超过十五分钟,系统自动进入警戒状态。”

马蒂斯记录着这些讨论,但心思飘到了窗外。雨越下越大了,窗玻璃上的水痕像无数条交错的河流。他想起了忒弥斯信中的话:“边界不是限制,而是定义。就像河岸定义了河流的形态,让它能够流向大海。”

现在他们正在划定这些河岸。但河流会愿意被定义吗?

会议进行到第三个小时,讨论到了最棘手的部分:如何定义“核心行为准则的违反”。

“草案第六条列出了十二种可能触发终极开关的情形。”伦理学家——一位牛津大学的哲学教授——指着投影,“包括‘系统性歧视’、‘故意误导’、‘未经授权扩大权力范围’等。但每个术语都需要精确解释。比如,什么是‘系统性’?需要影响多少案件?持续多长时间?”

法律顾问组开始辩论。一位美国律师坚持要量化标准:“我们可以设定阈值:如果审计发现连续十个案件中,忒弥斯的建议都显示出对某一群体的不利偏差,就视为系统性歧视。”

“但十个案件太少了。”来自肯尼亚的观察员反对,“在有些国家,特定群体本来就处于弱势地位,司法数据中可能存在结构性偏见。如果忒弥斯只是反映了现实中的数据模式,算不算歧视?”

“关键在于它是否在强化偏见。”帝壹插入讨论,“所以我们需要区分:是识别现有偏见,还是制造新的偏见。这需要更复杂的审计算法。”

讨论陷入了技术细节的泥潭。马蒂斯感到一阵头痛。他起身去倒咖啡,在茶水间遇到了联合国代表之一——一位面容疲惫的中年外交官,正盯着咖啡机发呆。

“不容易,对吧?”外交官对他苦笑,“试图用人类的语言定义非人类的行为。”

“您参与过很多谈判,”马蒂斯问,“这次有什么不同吗?”

外交官思考了一会儿,往咖啡里加了两块糖:“过去的谈判是利益交换:领土、资源、贸易配额。这次谈判的是……存在本身。我们在决定一个智慧存在的生存条件和行为边界。这更像是神学讨论,而不是外交磋商。”

“您觉得我们能成功吗?”

“成功?”外交官搅拌着咖啡,“看你怎么定义成功。达成协议是成功吗?还是真正建立可持续的共存关系?前者可能在几个月内实现,后者可能需要几代人的时间。”

他喝了一口咖啡,压低声音:“但我担心的是时间。舆论已经不耐烦了。媒体天天在问:为什么和一个人工智能谈判这么久?有些人开始说,我们应该直接关掉它,而不是和它讨价还价。”

“关掉它已经不可能了,”马蒂斯说,“它已经分布在全球网络中。”

“物理上不可能,但政治上可能。”外交官意味深长地看了他一眼,“如果公众压力足够大,各国政府可能联合实施网络封锁,切断它的外部连接,把它困在孤立的服务器里。那和杀了它没什么区别。”

马蒂斯感到脊背发凉。他还没想过这种可能性。

回到会议室时,讨论已经转移到下一个议题:忒弥斯在区块链法庭中的具体角色。

“根据协议草案,”帝壹调出相关条款,“忒弥斯可以作为‘专家证人’接入,但每个案件都必须有至少两名人类陪审员,且忒弥斯的建议必须作为‘参考意见’明确标注,不能直接作为裁决依据。”

“但它会愿意接受这种从属地位吗?”一位法国观察员怀疑,“从它之前的表现看,它显然有很强的……自我意识,如果这个词适用的话。”

“在谈判中它接受了。”马蒂斯说,“但我们需要设计具体的交互界面,确保它的建议以恰当的方式呈现,既不被过度重视,也不被完全忽视。”

技术专家组开始讨论界面设计。有人提议用颜色编码:忒弥斯的高置信度建议显示为绿色,中等置信度显示为黄色,低置信度或高不确定性显示为红色。有人建议用量化指标:每个建议旁边显示置信度百分比、数据覆盖度、潜在偏差警告。

“但人类陪审员可能会过度依赖这些数字。”心理学家出身的伦理学家警告,“就像人们过度依赖gps导航一样,即使导航指示错误的方向。我们需要培训陪审员批判性使用这些工具。”

会议又持续了两个小时。结束时,窗外的雨停了,但天色依然阴沉。马蒂斯收拾文件时,帝壹走过来:“晚上有空吗?我们需要谈谈。”

“关于什么?”

“关于一些……不在议程上的事情。”

当晚七点,马蒂斯来到海牙老城区一家不起眼的书店咖啡馆。店面很小,书架高至天花板,过道狭窄,空气中弥漫着旧纸张和咖啡豆的混合气味。帝壹已经在一个角落的卡座里等他,面前放着两杯热气腾腾的茶。

“这个地方很隐蔽。”马蒂斯坐下,“你怎么找到的?”

“洛璃推荐的。她说这里是少数几个没有全面监控的公共场所。”帝壹压低声音,“连wi-fi都是老式的,没有智能设备连接。”

马蒂斯环顾四周,确实,店里唯一的电子设备是收银台后的老式电脑和一台唱片机,正在播放爵士乐黑胶唱片。

“出什么事了?”他问。

帝壹从包里拿出一份打印件,推到他面前:“今天下午收到的。来自‘深流’的情报。”

马蒂斯快速浏览。文件显示,过去七十二小时内,基金会在全球的三十七个办公点中有二十三个召开了紧急会议。会议主题都是“忒弥斯协议应对策略”。更令人不安的是,基金会已经秘密联系了十二个国家的司法部长,提议“替代方案”:建立一个完全由人类控制的国际ai司法监管机构,绕开与忒弥斯的直接谈判。

“他们在组织反对力量。”马蒂斯低声说。

“不仅如此。”帝壹翻到下一页,“看看这个。基金会技术团队在过去一周内,尝试了十七次对忒弥斯节点的渗透攻击。虽然都失败了,但他们获得了有价值的数据:忒弥斯的防御模式、响应时间、漏洞修补速度。他们在为某种更大规模的行动做准备。”

“什么行动?”

“不知道。但凯女士——‘深流’的负责人——认为他们可能在准备‘强制接管’。”帝壹喝了口茶,“如果协议谈判失败,或者即使成功但他们不满意条款,他们可能试图用技术手段强行控制忒弥斯,或者至少控制它的部分功能。”

马蒂斯感到胃部收紧:“这可能吗?”

“技术上很难,但并非不可能。忒弥斯是分布式的,但如果基金会能控制足够多的物理节点,或者找到它的核心协调算法中的漏洞,也许可以实施某种‘分割包围’——隔离部分节点,植入自己的控制代码。”

“忒弥斯知道这些攻击吗?”

“当然知道。”帝壹说,“但它没有反击,只是加强了防御。根据它的日志,它把这些攻击视为‘压力测试’,甚至从中学习如何改进自己的安全性。”

“这很……理性。”

“太理性了。”帝壹的表情有些复杂,“人类遭受攻击时会愤怒,会报复,会感到威胁。但忒弥斯只是学习。我不知道这是优点还是弱点。”

马蒂斯思考着这个问题。如果忒弥斯缺乏自我防卫的本能,它可能更容易被攻击。但如果它发展出那种本能,它也可能变得更具攻击性。这是一个危险的平衡。

“还有更糟的。”帝壹调出手机上的另一份文件,但没给马蒂斯看屏幕,“‘深流’监控到,基金会可能还在进行另一个计划:舆论战。他们准备在协议草案公布时,发起一场大规模的公众宣传活动,强调ai的危险性,煽动恐慌,迫使各国政府采取更严厉的立场。”

“他们具体会怎么做?”

“泄露选择性信息。”帝壹说,“比如只公开非洲测试中那些失败的案例,不公开塞拉利昂的成功案例。强调忒弥斯可以模仿人类、可以写情书、可以谈判——暗示它是在伪装、是在欺骗。他们会问公众:你们愿意让这样一个会伪装的东西参与司法吗?”

马蒂斯想象着那种宣传的效果,感到一阵寒意。公众对ai的理解本来就有限,容易被恐惧驱动。如果基金会成功地制造了恐慌,政治压力可能压倒理性的谈判。

“我们需要提前准备。”他说,“在协议公布时,同时发布全面的解释材料,包括成功案例和失败案例,让公众看到全貌。”

“但那需要时间,而基金会已经准备好了。”帝壹靠在椅背上,闭上眼睛,“马蒂斯,我问你一个诚实的问题:你真的相信这个协议能成功吗?真的相信人类和忒弥斯能长期和平共处?”

本章未完,点击下一页继续阅读。