Anthropic在持续的人工智能争议中推出Claude 2
Anthropic发布了Claude 2,这是在持续的人工智能争议中的一项重要举措
Anthropic是一家人工智能(AI)和“公益”公司,于7月11日推出了Claude 2,标志着这个蓬勃发展的生成AI领域在充满看似不间断的进展的一年中又迈出了一大步。
介绍Claude 2!我们最新的模型在编码、数学和推理方面有了更好的性能。它可以产生更长的回答,并且在美国和英国的一个新的公开测试版网站上提供。链接:https://t.co/uLbS2JNczH。图源:@AnthropicAI,2023年7月11日
根据公司的博客文章,Claude 2在几乎每个可衡量的类别上都有所改进。在与其前身之间的差异中,最值得注意的是研究人员对自己的工作的讨论方式。
在宣布Claude 2的博客文章中,并没有提到传统机器学习基准测试或与类似模型的计算分数。相反,Anthropic在许多旨在代表现实世界知识、技能和问题解决测试的测试中,对Claude和Claude 2进行了头对头的测试。
Anthropic表示,Claude 2在知识、编码和其他考试中都击败了其前身,并且甚至在人类平均水平上也表现良好:
“与申请研究生的大学生相比,Claude 2在GRE阅读和写作考试上的得分超过了90%的百分位数,并且在定量推理方面与中位数申请者相当。”
值得注意的是,许多专家认为,由于人类认知推理的性质以及大型语言模型的训练数据集可能包含测试信息,人类与AI参加者之间的比较并不有效。实际上,为人类设计的测试可能并不能真正“测试”AI的推理能力,也无法提供对实际知识或技能的适当演示。
除了推出Claude 2之外,Anthropic还推出了基于Web的“与Claude交谈”界面的测试版,为美国和英国的用户提供了普遍访问聊天机器人的功能。
相关: 如何成为一名高薪的AI提示工程师
Cointelegraph对新版本进行了简要测试,并且从个人经验来看,改进效果立竿见影。Claude 2对Cointelegraph的提示几乎立即作出了明确、简明的回答。
根据Anthropic的说法,新模型的提示限制为100,000个标记,相当于75000个单词。该网站的用户界面显示用户可以上传PDF、TXT、CSV和类似的文件进行解析;然而,在Cointelegraph发布本文之前的有限测试中,此功能无法正常工作。
将本文作为NFT收藏,以保留历史时刻,并展示对加密领域独立新闻报道的支持。
We will continue to update 算娘; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles