OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容 – 蓝点网
发布时间:2025-05-04 23:04:22 作者:玩站小弟
我要评论

OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,该功能仅限于 Android 和 iOS 版 ChatGPT,并且可以上传图片由 ChatGPT 进行分析、识别并给出回答。当这个功能可用后
。
OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,推出态版该功能仅限于 Android 和 iOS 版 ChatGPT,多模对话点网并且可以上传图片由 ChatGPT 进行分析、本可别图识别并给出回答。语音
当这个功能可用后,及识用户转到 ChatGPT 设置里点击新功能,像内然后就可以开启语音对话功能,容蓝还可以从 5 个声音里选择一个。推出态版
OPENAI 表示:
新的多模对话点网语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的本可别图样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,语音我们还使用我们的及识开源语音识别系统 Whisper 将您的声音转录为文本。
第二个功能是像内图像识别功能,用户可以使用移动端 ChatGPT 拍照或选择照片发送给 AI,容蓝然后 ChatGPT 会像素级分析图片内容并按照用户提问给出详细的推出态版回答,例如分析工作图表、在设备工作异常时进行故障排除等等。
OPENAI 表示:
图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。
新功能将在接下来几周推出,首先获得该功能的是 ChatGPT Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。
最后,OPENAI 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 ChatGPT 集成,将在 10 月份推出。
相关文章
- 育碧总监最近公布了2018年游戏走向,据官方表示今年的射击游戏都会加入大逃杀模式,玩家们也可以从中体验到一些互动乐趣,作为目前比较热门的游戏玩法,大逃杀会带来什么样的新体验呢,大家可以关注一下育碧的新2025-05-04
- 随着互联网技术的迅猛发展,电子商务行业蓬勃发展,许多人开始担心电商是否会打败传统的实体店。本文将探讨这个问题,并分析电商与实体店的竞争关系。一、电商会打败实体吗会电商在某些方面具备打败实体店的潜力,如2025-05-04
- 提到边牧,想必大家都不会感到陌生。它是一种非常聪明的狗狗,而且智商也非常高。所以,很多人在饲养边牧的时候都会比较担心它的智商问题,害怕自己家的狗狗会听不懂人话。那么,边牧听得懂人话吗?3岁边牧智商为72025-05-04
- 如果你计划开设一个玩具摆摊生意,那么找到合适的供应商和进货渠道是非常重要的。玩具市场非常庞大,有许多不同类型和品牌的玩具可供选择。那么,摆摊玩具批发去哪里进货呢?让我们来了解一下。一、摆摊玩具批发去哪2025-05-04
- 流浪汉模拟器是款第一人称沙盒游戏,最近关于游戏登陆steam的消息放出,玩家在游戏中扮演的是一个流浪汉,但随时都会遇到各种突发的事情,如果喜欢这类高自由度的游戏,不妨了解一下流浪汉模拟器。最近一款叫做2025-05-04
- 法斗是一种很常见的狗狗,它们性格活泼、聪明、可爱,而且非常粘人哦!很多主人都会选择饲养法斗,但是很多新手铲屎官不知道1岁法斗一天喝几次奶最好。那么,1岁法斗可以喝牛奶吗?下面就一起来看看相关的内容吧。2025-05-04
最新评论