2023年09月26日 17:37
9月26日消息,OpenAI宣布,在接下来的两周内将在ChatGPT中向Plus和Enterprise使用者推出语音和图像。语音将在iOS和Android上推出,图像将在所有平台上提供。
据OpenAI介绍,新的语音功能由一个新的文本到语音模型提供支援,该模型能够从文本和几秒钟的语音样本生成“类似人类的音讯”。OpenAI似乎还认为该模型的潜力不止於此,其正在与流媒体音乐服务平台Spotify合作,将播客翻译成其他语言,同时保持播音者的声音。合成语音有许多有趣的用途,而OpenAI可能会成为该行业的重要组成部分。
图像搜索方面,有点类似於Google Lens的功能,用户拍摄自己感兴趣的任何东西的照片,ChatGPT去尝试了解用户在询问什麽,并做出相应的回应。使用者还可以使用应用程式的绘图工具説明明晰自己的诉求,或配合图像进行说话或写入问题。
除OpenAI之外,8月31日起,百度文心一言、讯飞星火等大模型正式向公众开放。9月5日,WPS AI正式面向社会开放,率先应用在WPS智慧文档。9月21日,微软举行了秋季发布会,宣布将发布Windows 11的下一个大更新23H2,据介绍本次系统更新将会有超过150项新功能,包括新的人工智慧驱动的Windows Copilot功能。