IARPA 在一份 PDF 文档中指出:“每一天,人类和机器都会生成大量的文本内容,而其中就包含了可揭示作者身份的语言特征”。
ONDI 表示,有了正确的模型,IARPA 相信它能够识别不同样本中的作者风格一致性。
当然这项技术也能够通过修饰语言模式,使之以新手能够解释的方式来完成相关工作,但 HIATUS AI 必须是与语言无关的。
HIATUS 项目经理 Timothy Mckinnon 博士称:
我们很有希望达成这一目标,为情报界提供急需的能力,并借助计算语言学和深度学习的最新进步,大幅扩展我们对人类语言演变的理解。
为开发强大的模型,HIATUS 将着重于对抗性 AI 研究 —— 作者与匿名文本,与问题是一体两面。
IARPA 认为,归因系统的评估,主要根据统一作者在大型收藏中匹配项目的能力。
而隐私系统的评估,则是根据阻止归因系统的能力。
此外该机构表示,其计划为 HIATUS AI 制定可解释性的标准。
Timothy Mckinnon 补充道,HIATUS 正在从事的部分工作,是试图揭开围绕神经语言模型的某些未知因素。
他表示这些模型的运作良好,但其本质上仍是一个黑匣子,开发人员并不知晓它们是如何做出具体判断的的。
理想情况下,系统会在我们执行时切实理解为何要这么做,并且能够验证其没有接收到虚假的东西、及其正在做哪些正确的事情。
若顺利走到这一步,从打击境外影响活动、到识别反情报风险,HIATUS 都有可能产生深远的影响。
此外 HIATUS AI 能够识别文本是否由机器生成、而不是真人创作出来的。
最后,在 IARPA 完成的研究中,约有 70% 会交给其它政府合作伙伴去实施 —— 前者只负责技术的开发,而不会参与到具体的实施。
目前 HIATUS 研究项目已经开拔,但鉴于距离实验结束还有 42 个月(三年半)的时间,所以不要指望这项技术会很快以完整形态出现。
扫一扫
在手机上阅读