ChatGPT现在可以说话、听和看图片了

ChatGPT现在具备语言、听觉和图像识别功能

在开放AI推出了具备视觉能力的GPT-4V模型和ChatGPT系统的多模态对话模式之后,生成式人工智能(AI)领域继续升温。

根据9月25日宣布的新升级,ChatGPT用户将能够与聊天机器人进行对话。ChatGPT的模型GPT-3.5和GPT-4现在可以理解口语查询并以五种不同的声音回答。

ChatGPT现在可以看、听和说话。在接下来的两周内,Plus用户将能够与ChatGPT进行语音对话(iOS和安卓),并在对话中添加图片(所有平台)。 https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

根据OpenAI的博客文章,这种新的多模态界面将允许用户以新颖的方式与ChatGPT进行交互:

“在旅行时拍摄一个地标的照片,并进行关于它有趣之处的实时对话。当你回家时,拍摄冰箱和储藏室的照片,以找出晚餐的菜单(并针对逐步配方提问以获取跟进)。晚餐后,通过拍照,圈出问题集,并让模型与你们两个分享提示,帮助你的孩子解决数学问题。”

ChatGPT的升级版本将在接下来的两周内向移动平台的Plus和企业用户推出,随后将为开发人员和其他用户提供访问权限。

ChatGPT的多模态升级刚刚在OpenAI推出最先进的图像生成系统DALL-E 3之后进行。

根据OpenAI的说法,DALL-E 3还集成了自然语言处理。这使用户可以与模型交流,以微调结果,并在创建图像提示时获得ChatGPT的帮助。

在其他人工智能新闻中,OpenAI竞争对手Anthropic于9月25日宣布与亚马逊合作。正如Cointelegraph所报道的,亚马逊将投资多达40亿美元,以包括云服务和硬件访问。作为回报,Anthropic表示将为亚马逊的基础AI模型Bedrock提供增强的支持,以及“用于企业的安全模型定制和微调”。

相关:Coinbase首席执行官警告不要对人工智能进行监管,呼吁去中心化

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

市场行情

比特币的主导地位达到了30个月以来的新高,而以太币和其他替代币在此次涨势中落后

比特币的牛市势头可能预示着山寨币的一轮上涨,一名分析师指出

区块链

Polygon基金会否认在币安上进行MATIC倾销,声称钱包被错误标记

Nansen回应称,在给这些钱包贴上标签之前,他们会经过严格的流程,并解释称这两个有问题的钱包与Polygon的关键成员有着密切的...

区块链

Arbitrum DAO在空投截止日期结束时获取了价值5600万美元的未领取的ARB

Arbitrum基金会已正式将未认领的Arbitrum空投ARB代币添加到其财库中

市场行情

SatoshiVM的SAVM:争议、时髦词汇与代币倾销🚀💣

SAVM经历了数千倍的显著增长,仅在发行几个小时内就达到了9千万美元的市值,展示了其强大的潜力和价值

比特币

Hashdex预计比特币ETF将在第二季度交易,接着是以太坊

Hashdex表示,美国的比特币现货交易所交易基金(ETF)将于2024年第二季度开始交易,紧接着将推出以太坊(ETH)ETF”

市场行情

价格分析11/8:BTC,ETH,BNB,XRP,SOL,ADA,DOGE,TON,LINK,MATIC

比特币在36,000美元遇到了障碍,但阻力水平是否足以引发替代货币的回调?