Anthropic在持续的人工智能争议中推出Claude 2

Anthropic发布了Claude 2,这是在持续的人工智能争议中的一项重要举措

Anthropic是一家人工智能(AI)和“公益”公司,于7月11日推出了Claude 2,标志着这个蓬勃发展的生成AI领域在充满看似不间断的进展的一年中又迈出了一大步。

介绍Claude 2!我们最新的模型在编码、数学和推理方面有了更好的性能。它可以产生更长的回答,并且在美国和英国的一个新的公开测试版网站上提供。链接:https://t.co/uLbS2JNczH。图源:@AnthropicAI,2023年7月11日

根据公司的博客文章,Claude 2在几乎每个可衡量的类别上都有所改进。在与其前身之间的差异中,最值得注意的是研究人员对自己的工作的讨论方式。

在宣布Claude 2的博客文章中,并没有提到传统机器学习基准测试或与类似模型的计算分数。相反,Anthropic在许多旨在代表现实世界知识、技能和问题解决测试的测试中,对Claude和Claude 2进行了头对头的测试。

Anthropic表示,Claude 2在知识、编码和其他考试中都击败了其前身,并且甚至在人类平均水平上也表现良好:

“与申请研究生的大学生相比,Claude 2在GRE阅读和写作考试上的得分超过了90%的百分位数,并且在定量推理方面与中位数申请者相当。”

值得注意的是,许多专家认为,由于人类认知推理的性质以及大型语言模型的训练数据集可能包含测试信息,人类与AI参加者之间的比较并不有效。实际上,为人类设计的测试可能并不能真正“测试”AI的推理能力,也无法提供对实际知识或技能的适当演示。

除了推出Claude 2之外,Anthropic还推出了基于Web的“与Claude交谈”界面的测试版,为美国和英国的用户提供了普遍访问聊天机器人的功能。

相关: 如何成为一名高薪的AI提示工程师

Cointelegraph对新版本进行了简要测试,并且从个人经验来看,改进效果立竿见影。Claude 2对Cointelegraph的提示几乎立即作出了明确、简明的回答。

与Claude 2聊天。图片来源:Anthropic

根据Anthropic的说法,新模型的提示限制为100,000个标记,相当于75000个单词。该网站的用户界面显示用户可以上传PDF、TXT、CSV和类似的文件进行解析;然而,在Cointelegraph发布本文之前的有限测试中,此功能无法正常工作。

将本文作为NFT收藏,以保留历史时刻,并展示对加密领域独立新闻报道的支持。

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

市场行情

比特币更新:看涨信号持续存在,GBTC外流速度放缓

经过高度期待的4月比特币减半后,预计将吸引热情的买家,并为潜在的价格飙升创造可能性,为投资者带来令人兴奋的时刻,将可能...

区块链

Friend.tech随着NBA球员和FaZe Clan的加入成为了一个庞大的以以太币为媒介的赚钱机器

该应用程序在仅仅两周多的时间内迅速成为加密协议中第二大收入来源

区块链

Invesco Galaxy申请现货Ether ETF

据称,英富时和银河数字于9月29日提交了现货以太坊交易所交易基金(ETF)申请

区块链

以太坊推出新的测试网“Holešky”,为开发人员分配了16亿ETH

“以太坊开发者先前告诉应用开发者使用Sepolia,而Goerli预计将在一月份被弃用”

区块链

尽管交易数量较低,比特币在每日活跃地址上仍然主导以太坊

比特币比以太坊拥有更多的日活跃地址——以太坊是去中心化金融(DeFi)和非同质化代币(NFT)的中心——同时它是一个纯粹的交易层

区块链

Vitalik Buterin 希望比特币像以太坊一样尝试使用第二层解决方案

以太坊的共同创始人揭示了多年来以太坊如何成功整合各种扩展解决方案,并且最近与ZK rollups和Plasma的实验取得了更好的吞吐量