Anthropic在持续的人工智能争议中推出Claude 2

Anthropic发布了Claude 2,这是在持续的人工智能争议中的一项重要举措

Anthropic是一家人工智能(AI)和“公益”公司,于7月11日推出了Claude 2,标志着这个蓬勃发展的生成AI领域在充满看似不间断的进展的一年中又迈出了一大步。

介绍Claude 2!我们最新的模型在编码、数学和推理方面有了更好的性能。它可以产生更长的回答,并且在美国和英国的一个新的公开测试版网站上提供。链接:https://t.co/uLbS2JNczH。图源:@AnthropicAI,2023年7月11日

根据公司的博客文章,Claude 2在几乎每个可衡量的类别上都有所改进。在与其前身之间的差异中,最值得注意的是研究人员对自己的工作的讨论方式。

在宣布Claude 2的博客文章中,并没有提到传统机器学习基准测试或与类似模型的计算分数。相反,Anthropic在许多旨在代表现实世界知识、技能和问题解决测试的测试中,对Claude和Claude 2进行了头对头的测试。

Anthropic表示,Claude 2在知识、编码和其他考试中都击败了其前身,并且甚至在人类平均水平上也表现良好:

“与申请研究生的大学生相比,Claude 2在GRE阅读和写作考试上的得分超过了90%的百分位数,并且在定量推理方面与中位数申请者相当。”

值得注意的是,许多专家认为,由于人类认知推理的性质以及大型语言模型的训练数据集可能包含测试信息,人类与AI参加者之间的比较并不有效。实际上,为人类设计的测试可能并不能真正“测试”AI的推理能力,也无法提供对实际知识或技能的适当演示。

除了推出Claude 2之外,Anthropic还推出了基于Web的“与Claude交谈”界面的测试版,为美国和英国的用户提供了普遍访问聊天机器人的功能。

相关: 如何成为一名高薪的AI提示工程师

Cointelegraph对新版本进行了简要测试,并且从个人经验来看,改进效果立竿见影。Claude 2对Cointelegraph的提示几乎立即作出了明确、简明的回答。

与Claude 2聊天。图片来源:Anthropic

根据Anthropic的说法,新模型的提示限制为100,000个标记,相当于75000个单词。该网站的用户界面显示用户可以上传PDF、TXT、CSV和类似的文件进行解析;然而,在Cointelegraph发布本文之前的有限测试中,此功能无法正常工作。

将本文作为NFT收藏,以保留历史时刻,并展示对加密领域独立新闻报道的支持。

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

区块链

为何纳斯达克的最新举措对于申请以太坊ETF的基金经理至关重要

最近的纳斯达克申请表明,资产管理公司Hashdex在以太坊ETF竞争中采取了不同的方法

区块链

不可变的zkEVM开始测试网阶段,有12个Web3游戏正在开发中

在2021年推出其Immutable X网络之前,为以太坊发布了不可更改的游戏

DeFi

路由协议推出Nitro:闪电般快速的跨链解决方案

了解最新的区块链技术进展、投资和合作伙伴关系发现1月25日至31日的激动人心的发展

资讯

以太坊用户的双重胜利:Dencun 升级和 Starknet 费用降低 🚀💰

史塔克网络基金会宣布了旨在降低费用的新计划,体现了他们致力于与以太坊Duncun硬分叉一起为用户和开发者提供价值和支持的承诺

区块链

Invesco Galaxy申请现货Ether ETF

据称,英富时和银河数字于9月29日提交了现货以太坊交易所交易基金(ETF)申请

资讯

Fireblocks与UniPass Wallet共同解决以太坊ERC-4337账户抽象漏洞

Fireblocks识别并协助修补UniPass ERC-4337智能合约钱包中的以太坊账户抽象漏洞