ChatGPT现在可以说话、听和看图片了

ChatGPT现在具备语言、听觉和图像识别功能

在开放AI推出了具备视觉能力的GPT-4V模型和ChatGPT系统的多模态对话模式之后，生成式人工智能（AI）领域继续升温。

根据9月25日宣布的新升级，ChatGPT用户将能够与聊天机器人进行对话。ChatGPT的模型GPT-3.5和GPT-4现在可以理解口语查询并以五种不同的声音回答。

ChatGPT现在可以看、听和说话。在接下来的两周内，Plus用户将能够与ChatGPT进行语音对话（iOS和安卓），并在对话中添加图片（所有平台）。 https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023
印度加密投资平台Mudrex扩展至意大利
Coinbase成功在西班牙中央银行注册
“2亿美元Mixin网络被黑客攻击引发争议”

根据OpenAI的博客文章，这种新的多模态界面将允许用户以新颖的方式与ChatGPT进行交互：

“在旅行时拍摄一个地标的照片，并进行关于它有趣之处的实时对话。当你回家时，拍摄冰箱和储藏室的照片，以找出晚餐的菜单（并针对逐步配方提问以获取跟进）。晚餐后，通过拍照，圈出问题集，并让模型与你们两个分享提示，帮助你的孩子解决数学问题。”

ChatGPT的升级版本将在接下来的两周内向移动平台的Plus和企业用户推出，随后将为开发人员和其他用户提供访问权限。

ChatGPT的多模态升级刚刚在OpenAI推出最先进的图像生成系统DALL-E 3之后进行。

根据OpenAI的说法，DALL-E 3还集成了自然语言处理。这使用户可以与模型交流，以微调结果，并在创建图像提示时获得ChatGPT的帮助。

在其他人工智能新闻中，OpenAI竞争对手Anthropic于9月25日宣布与亚马逊合作。正如Cointelegraph所报道的，亚马逊将投资多达40亿美元，以包括云服务和硬件访问。作为回报，Anthropic表示将为亚马逊的基础AI模型Bedrock提供增强的支持，以及“用于企业的安全模型定制和微调”。

相关：Coinbase首席执行官警告不要对人工智能进行监管，呼吁去中心化

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

AIChatGPTOpenAI

Was this article helpful?

93 out of 132 found this helpful

ChatGPT现在可以说话、听和看图片了

Was this article helpful?

印度加密投资平台Mudrex扩展至意大利

密码朋克偶像亚当·贝克：比特币是“下一个千年的数字黄金”

区块链

比特币的主导地位达到了30个月以来的新高，而以太币和其他替代币在此次涨势中落后

Polygon基金会否认在币安上进行MATIC倾销，声称钱包被错误标记

Arbitrum DAO在空投截止日期结束时获取了价值5600万美元的未领取的ARB

SatoshiVM的SAVM：争议、时髦词汇与代币倾销🚀💣

Hashdex预计比特币ETF将在第二季度交易，接着是以太坊

价格分析11/8：BTC，ETH，BNB，XRP，SOL，ADA，DOGE，TON，LINK，MATIC