ChatGPT现在可以说话、听和看图片了

ChatGPT现在具备语言、听觉和图像识别功能

在开放AI推出了具备视觉能力的GPT-4V模型和ChatGPT系统的多模态对话模式之后,生成式人工智能(AI)领域继续升温。

根据9月25日宣布的新升级,ChatGPT用户将能够与聊天机器人进行对话。ChatGPT的模型GPT-3.5和GPT-4现在可以理解口语查询并以五种不同的声音回答。

ChatGPT现在可以看、听和说话。在接下来的两周内,Plus用户将能够与ChatGPT进行语音对话(iOS和安卓),并在对话中添加图片(所有平台)。 https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

根据OpenAI的博客文章,这种新的多模态界面将允许用户以新颖的方式与ChatGPT进行交互:

“在旅行时拍摄一个地标的照片,并进行关于它有趣之处的实时对话。当你回家时,拍摄冰箱和储藏室的照片,以找出晚餐的菜单(并针对逐步配方提问以获取跟进)。晚餐后,通过拍照,圈出问题集,并让模型与你们两个分享提示,帮助你的孩子解决数学问题。”

ChatGPT的升级版本将在接下来的两周内向移动平台的Plus和企业用户推出,随后将为开发人员和其他用户提供访问权限。

ChatGPT的多模态升级刚刚在OpenAI推出最先进的图像生成系统DALL-E 3之后进行。

根据OpenAI的说法,DALL-E 3还集成了自然语言处理。这使用户可以与模型交流,以微调结果,并在创建图像提示时获得ChatGPT的帮助。

在其他人工智能新闻中,OpenAI竞争对手Anthropic于9月25日宣布与亚马逊合作。正如Cointelegraph所报道的,亚马逊将投资多达40亿美元,以包括云服务和硬件访问。作为回报,Anthropic表示将为亚马逊的基础AI模型Bedrock提供增强的支持,以及“用于企业的安全模型定制和微调”。

相关:Coinbase首席执行官警告不要对人工智能进行监管,呼吁去中心化

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

比特币

Tezos发布Nairobi,XTZ牛市不动,熊市占主导地位

Tezos最近通过Nairobi实施了最新的升级,但XTZ价格仍然承受着压力,较二月份的高点下跌了45%

市场行情

黑石基金以太坊ETF新闻发布后,Coinbase、以太坊流动抵押代币Lido以及RocketPool暴涨

iShares以太坊信托周四早些时候在特拉华州注册成为一家公司实体

区块链

价格分析7月14日:BTC、ETH、BNB、XRP、ADA、SOL、DOGE、LTC、MATIC、DOT

比特币和一些选择的替代币在最近的上涨恢复之前,可能会经历小幅回调或整理

区块链

8年后,价值1.16亿美元的预挖以太坊开始流动:价格大跌在即吗?

一个预挖的以太坊储备,沉寂了近八年,现在价值约为1.16亿美元,突然被转移...

区块链

加密赌场Stake在4100万美元被黑客攻击后仅仅5小时就重新开放提现功能

加密博彩平台Stake在遭受约4130万美元的黑客攻击后仅五小时就重新开放了所有服务,包括提款

NFT

Protocol Village:Metagood,OnChainMonkey的NFT背后,筹集了500万美元的种子轮融资

关于区块链技术的最新更新、融资公告和商业动态覆盖12月14日至12月20日期间,持续更新,涵盖各地实时动态