Anthropic在持续的人工智能争议中推出Claude 2

Anthropic发布了Claude 2,这是在持续的人工智能争议中的一项重要举措

Anthropic是一家人工智能(AI)和“公益”公司,于7月11日推出了Claude 2,标志着这个蓬勃发展的生成AI领域在充满看似不间断的进展的一年中又迈出了一大步。

介绍Claude 2!我们最新的模型在编码、数学和推理方面有了更好的性能。它可以产生更长的回答,并且在美国和英国的一个新的公开测试版网站上提供。链接:https://t.co/uLbS2JNczH。图源:@AnthropicAI,2023年7月11日

根据公司的博客文章,Claude 2在几乎每个可衡量的类别上都有所改进。在与其前身之间的差异中,最值得注意的是研究人员对自己的工作的讨论方式。

在宣布Claude 2的博客文章中,并没有提到传统机器学习基准测试或与类似模型的计算分数。相反,Anthropic在许多旨在代表现实世界知识、技能和问题解决测试的测试中,对Claude和Claude 2进行了头对头的测试。

Anthropic表示,Claude 2在知识、编码和其他考试中都击败了其前身,并且甚至在人类平均水平上也表现良好:

“与申请研究生的大学生相比,Claude 2在GRE阅读和写作考试上的得分超过了90%的百分位数,并且在定量推理方面与中位数申请者相当。”

值得注意的是,许多专家认为,由于人类认知推理的性质以及大型语言模型的训练数据集可能包含测试信息,人类与AI参加者之间的比较并不有效。实际上,为人类设计的测试可能并不能真正“测试”AI的推理能力,也无法提供对实际知识或技能的适当演示。

除了推出Claude 2之外,Anthropic还推出了基于Web的“与Claude交谈”界面的测试版,为美国和英国的用户提供了普遍访问聊天机器人的功能。

相关: 如何成为一名高薪的AI提示工程师

Cointelegraph对新版本进行了简要测试,并且从个人经验来看,改进效果立竿见影。Claude 2对Cointelegraph的提示几乎立即作出了明确、简明的回答。

与Claude 2聊天。图片来源:Anthropic

根据Anthropic的说法,新模型的提示限制为100,000个标记,相当于75000个单词。该网站的用户界面显示用户可以上传PDF、TXT、CSV和类似的文件进行解析;然而,在Cointelegraph发布本文之前的有限测试中,此功能无法正常工作。

将本文作为NFT收藏,以保留历史时刻,并展示对加密领域独立新闻报道的支持。

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

资讯

Ethena Labs的稳定币高收益引发加密社区的关注

伊腾娜实验室发布具有令人印象深刻的27.6%收益率的USDe稳定币,引发了加密社区的兴奋,甚至有些人将其与过去成功的高收益项目...

资讯

“乐观网为了安全测试暂停以太坊的提款”

为了实施和完善更新的安全响应系统,提高所有用户的安全保护,乐观网络将于2月15日暂停ETH代币提取这一举措有助于保障用户权...

NFT

「Square Enix宣布Symbiogenesis NFT的拍卖日期」

“Symbiogenesis角色拍卖的第一阶段将于11月27日开始,而第二阶段将于11月30日开始”

区块链

以太坊价格刚刚反转,1,920美元将很快到来,以下是原因

以太坊价格正在美元1,770美元以上显示积极信号如果ETH清除了1,820美元的阻力区,可能会获得牛市动能

区块链

Lido的质押以太币代币很快可以在Cosmos、IBC区块链上使用

Lido是领先的流动抵押解决方案提供商,其抵押代币stETH市值达到138亿美元

市场行情

随着监管压力加剧,Coinbase在以太坊质押市场份额下降

交易所在ETH质押份额下降至9.7%,这是自2021年5月以来的最低水平美国证券交易委员会在6月起诉该公司提供未注册的证券