ChatGPT现在可以说话、听和看图片了
ChatGPT现在具备语言、听觉和图像识别功能
在开放AI推出了具备视觉能力的GPT-4V模型和ChatGPT系统的多模态对话模式之后,生成式人工智能(AI)领域继续升温。
根据9月25日宣布的新升级,ChatGPT用户将能够与聊天机器人进行对话。ChatGPT的模型GPT-3.5和GPT-4现在可以理解口语查询并以五种不同的声音回答。
ChatGPT现在可以看、听和说话。在接下来的两周内,Plus用户将能够与ChatGPT进行语音对话(iOS和安卓),并在对话中添加图片(所有平台)。 https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
根据OpenAI的博客文章,这种新的多模态界面将允许用户以新颖的方式与ChatGPT进行交互:
“在旅行时拍摄一个地标的照片,并进行关于它有趣之处的实时对话。当你回家时,拍摄冰箱和储藏室的照片,以找出晚餐的菜单(并针对逐步配方提问以获取跟进)。晚餐后,通过拍照,圈出问题集,并让模型与你们两个分享提示,帮助你的孩子解决数学问题。”
ChatGPT的升级版本将在接下来的两周内向移动平台的Plus和企业用户推出,随后将为开发人员和其他用户提供访问权限。
ChatGPT的多模态升级刚刚在OpenAI推出最先进的图像生成系统DALL-E 3之后进行。
根据OpenAI的说法,DALL-E 3还集成了自然语言处理。这使用户可以与模型交流,以微调结果,并在创建图像提示时获得ChatGPT的帮助。
在其他人工智能新闻中,OpenAI竞争对手Anthropic于9月25日宣布与亚马逊合作。正如Cointelegraph所报道的,亚马逊将投资多达40亿美元,以包括云服务和硬件访问。作为回报,Anthropic表示将为亚马逊的基础AI模型Bedrock提供增强的支持,以及“用于企业的安全模型定制和微调”。
相关:Coinbase首席执行官警告不要对人工智能进行监管,呼吁去中心化
We will continue to update 算娘; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles





