小猪号 3 月 7 日消息,据外媒报道,谷歌近日公布了去年 11 月投入使用的通用语言模型研究结果。结果显示,谷歌语言模型现在已经可对 100 多种语言进行识别。在部分通用语言识别上,谷歌语言模型的语意理解表现更是亮眼。相较 OpenAI 推出的大型语言模型 Whisper,语意识别错误率更低。
图源 Pixabay根据谷歌官方介绍,谷歌语言模型可进行持续自我学习,并可在 BEST-RQ 算法的加持下不断修改语言模型整体架构,从而完成持续分析、学习语言结构等操作。除此之外,谷歌语言模型在进行语意理解时,还会调动 text injection 以及监督式 loss 函数,从而让语言模型语意理解更加精准。目前,谷歌语言模型在处理 70 多种语言翻译时,错误率已经可以保持在 30% 以下。
值得一提的是,小猪号获取到的信息表明,谷歌语言模型在处理非裔美籍人士所使用的英语口语 CORAAL、混合口音的 SpeechStew 以及其他多种语言的 FLEURS 测试中,其正确率要在 Whisper 之上。