你们很多人可能都不认识我的公司 Ribbon Communications。我们最著名的是为通信服务提供商 (也被称为电话公司) 建立和保护大型电信网络。然而,很有可能在接下来的一两天里,你会在世界上的某个地方拨打我们的电话。除了服务提供商,我们还与大型企业有大量的合作经验,这些企业需要电信级服务,无论是因为它们的规模或其通信的关键性质。这包括大学、医疗机构、金融服务机构、政府机构等等。 不久前,我们的一位客户,世界上最大的投资银行之一,向 Ribbon 提出了一个问题。他们希望使用先进的 AI 来实时分析他们的呼叫中心,这样他们就可以根据基于 AI 的观察立即做出商业决策。他们希望能够提取音频流,立即将其转录为文本,然后立即分析文本以寻找诸如客户满意度、威胁行为和欺诈企图等问题。文本越早被转录,就越容易存储和搜索。我们的客户还可以使用它进行其他形式的趋势分析,可以发现即将出现的问题,例如,与某个代理的客户情绪。 任何尝试过搜索录音的人都能理解,为什么一家每天有数千个电话的银行宁愿存储抄写而不是音频,也宁愿使用 AI 工具来搜索问题,而不是传统的搜索工具。不幸的是,这家银行被几个常见的技术问题所阻碍: ▶ 银行需要一个安全元件,它可以位于数千个呼叫中心的中间,并复制所有的呼叫媒体流,以便将这些流发送到 AI 引擎。 ▶ 因为元素处于这些调用的中间,所以它永远不会失败,也不能降级调用。它还必须非常安全,这样第三方就无法找到拦截信息流的方法。它也不能被破坏或超载使用 DoS 攻击。 ▶ 电话网络使用一种不同于 AI 引擎接受的媒体格式:实时传输协议 (RTP)。银行不能仅仅将所有电话的原始音频流发送给 AI 引擎。 ▶ 该银行希望使用实时音频流同时执行多个基于 AI 的服务。这意味着,他们需要同时向不同的AI服务发送多个实时音频副本,以使银行的不同用户能够分析数据,并将结果用于自己的目的。 由于银行无法克服这些问题,他们被迫以另一种格式录制呼叫,存储它们,然后将录音发送给 AI 引擎进行分析。录音不被接受,因为它带来了两个缺点: ▶ 转录和分析不是实时的,所以没有办法利用 AI 来应对现在发生的问题。这大大降低了它的价值。 ▶ 录音会降低音频质量。众所周知,较低的音频质量会降低AI平台的转录精度。 ▶ Ribbon 与 NVIDIA 合作开发了一个解决方案。我们利用我们在管理电话网络音频和信令方面的丰富经验,并将其与由 GPU 技术驱动的 NVIDIA Jarvis 高级对话 AI 平台相结合。