世界短讯！Google生成式AI新进展：推出新LaMDA语言工具 Wordcraft

【TechWeb】11月3日消息，Google在2日举办的年度AI活动中集中介绍了Google AI目前取得的成果，以及在解决人类挑战方面的创新，重点包括Google AI目前在3个变革性领域取得了突出成果。

这些新成果包括Google 用AI技术，预测洪水和野火、提升人类的健康等解决人类面临的挑战；Google 再次扩充所支持语言，宣布“一千种语言计划”，将支持全球1000种最常用语言的模型；同时Google 集中展示生成式AI取得的进展，包括推出新的LaMDA语言工具 Wordcraft等，更好地帮助创作者提升创意能力。

用AI技术应对气候变化和健康挑战

【资料图】

Google使用改造后的卫星图像来训练AI模型，使其能识别和实时跟踪野火，从而帮助预测火势演变和蔓延趋势，帮助消防队和救援人员及时了解野火事件。Google介绍，目前这一野火追踪系统已在美国、加拿大、墨西哥和澳大利亚的部分地区推出，自7月以来，报道了美国和加拿大的30多起大型野火事件，在Google Search和Maps中触达超700多万次展示，有效帮助用户和消防人员了解了火势情况。

2021年，Google AI洪水预测系统通过Google Search和Maps向2300万人发送了1.15亿条洪水警报通知，让无数生命免遭洪灾。Google还宣布在全球范围内推出新的模型Google Flood Hub，该模型在Google Search和Maps上线，通过显示洪水可能发生的时间和地点，来帮助更多的人在洪灾侵袭时转移到安全地点。

Google的自动视网膜疾病评估工具（ARDA）已经在印度、泰国、德国、美国和英国等国家部署使用和前瞻性研究中，成功筛查了超过15万名患者，其中一半以上发生在2022年，Google透露之后还将继续这一合作项目。此外，Google Health 团队目前正积极探索如何使用AI让用户通过手机就能检测呼吸和心率。

AI模型赋能创作者和艺术家

在生成式AI方面，Imagen和Parti由Google研发、在质量方面领先业内的两款图像生成模型。Imagen是视频序列的扩散模型；Phenaki则是为文本提示序列，可以生成长且连贯视频的模型。这两款模型的研发团体一直在合作使用这两种模型制作视频，在Google AI@的的活动上，Google首次分享了由AI技术生成的超分辨率视频。接下来，Google将把这一技术带到AI Test Kitchen（一个为人们提供了解、体验和反馈新兴AI技术的渠道）。在第二代AI Test Kitchen中，用户能使用 "城市梦想家（City Dreamer） "建造主题城市，用 "Wobble"设计能够移动、跳舞和跳跃的友好怪物角色。所有这些都能通过文本提示（text prompts）来实现。

二维图像外，文字转3D现在也已经成为现实。Google的DreamFusion可以生成一个能从任何角度观看，并合成到任何三维环境中的三维模型。音频生成领域，Google AudioLM模型仅通过聆听音频样本就能学习生成逼真语音和钢琴音乐，并预测在音频提示几秒钟后应该有哪些声音。通过与使用Wordcraft的作家们合作，Google测试了由AI驱动的，建立在Google最先进对话系统LaMDA上的文本生成系统。“当我们开发这些工具时，我们与全球的创作者群体合作。用户现在就可以在Wordcraft作家研讨会上阅读到这些故事的第一卷”Jeff Dean表示。

一千种语言计划

语言，是人们与技术互动的最自然的方式，然而，随着传统的语言训练模型方法不再适应全球交流方式的多样性，大量的语言无法在互联网上得到良好体现，为全球信息互联互通造成了巨大阻碍。为了解决这一难题，Google宣布了“一千种语言计划”，该计划承诺去构建一个可支持1000种最常用语言的AI模型，为世界各地边缘化社区的数十亿人带去更大的包容性。

作为该计划的一部分，Google目前开发了一个支持超400种语言的通用语音模型(USM)，据了解，这是迄今为止覆盖范围最大的语音模型。同时，随着项目扩展，Google与世界各地的社区合作，以获取有代表性的语音数据。通过与非洲的研究人员和组织密切合作，Google近期宣布在Gboard上为另外9种非洲语言输入语音，以创建和发布数据。在南亚，Google携手当地政府、非政府组织和学术机构，成功收集了来自所有地区方言和语言中有代表性的音频样本。

关键词： Google