百度表示,Ernie 3.5在关键指标上胜过了ChatGPT和GPT-4

随着中国百度公司宣布其人工智能模型Ernie 3.5在关键测试中击败了流行的OpenAI的ChatGPT和GPT-4,AI市场的竞争日趋激烈。该中国互联网公司在三月份的一次活动上推出了Ernie机器人。CEO李彦宏在宣布时表示,这一新产品还不完美,将随着人们的使用和反馈不断改进。在揭示Ernie机器人后的一小时内,百度表示约有30,000家企业客户加入了等候名单以获得聊天机器人。

与此同时,百度自推出Ernie机器人以来一直在公开测试。这个建立在中国搜索引擎基础AI模型Ernie上的聊天机器人是通过广泛的数据进行训练的。另一方面,ChatGPT是基于OpenAI的GPT 3.5模型。百度表示,它的AI模型击败了OpenAI最新、最先进的模型GPT-4。它指出,Ernie 3.5在中文语言测试中表现优于OpenAI的产品。

百度声称Ernie 3.5在多个关键领域优于ChatGPT

这家中国公司是在引用中国科技日报的一份报告时做出这一声明的。根据该报告,一个“少样本评估”显示,Ernie 3.5在多个测试集中胜过了ChatGPT。三个评估基准是AGIEval、C-Eval和MMLU。微软研究使用AGIEval评估基准来检查模型在“以人为本”的标准测试中的表现水平。重点是20个官方、公共和不同的资格考试,如美国的SAT考试和中国的高考。还包括律师资格考试、美国GMAT、GME等。此外,伯克利大学、哥伦比亚大学、伊利诺伊大学厄巴纳-香槟分校和芝加哥大学联合发布MMLU。这个大规模的多任务语言理解测试评估了模型的英语跨学科专业能力。这个测试涵盖了社会科学、人文科学、科学、技术、工程和数学(STEM)等不同的教育领域。

此外,c-Eval评估是一个包含13,948个多项选择题,涵盖53个科目的中国基础模型评估。这个评估基准是清华大学、爱丁堡大学和上海交通大学的联合努力创建和发布的。

AGIEval和C-Eval测试的结果显示,Ernie 3.5取得了比其他大型模型更高的分数,包括ChatGPT,超过了GPT-4。此外,百度的AI模型还超越了ChatGPT的40.27分和GPT -4的56.96分。Ernie 3.5获得了惊人的64.37分,排名第一。对于中国的c-Eval评估,Ernie 3.5也超过了ChatGPT。虽然这个中国AI模型的得分最高,达到了71.93分,但ChatGPT的得分为51.70分,GPT-4的得分为68.57分。此外,百度提到更多的结果表明,Ernie 3.5具有“出色的中文能力”,并且超过了ChatGPT和GPT-4。

We will continue to update 算娘; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

资讯

K-pop明星清楚自己的名字:消除加密货币争议 ⭐📰

K-pop大星崔始源和曹泫英已否认有关他们参与推广韩国虚假加密货币的指控,为此他们的声誉受到了保护

资讯

争夺 Do Kwon:引渡的法律对决

Do Kwon,Terra的创始人,目前正处于一场美国和韩国之间的法律纠纷中,以确定哪个国家将负责他的引渡这种情况凸显出Terra及其...

资讯

韩国检察官未能关闭泡菜溢价加密交易商

韩国检察官在试图监禁涉嫌交易高溢价加密货币的嫌疑人时遭遇挫折,14名个人被判无罪,这是一项积极的结果

资讯

韩国警方打击3200万美元的加密货币诈骗团伙-黑帮针对聊天应用用户

韩国当局成功关闭了一个价值3200万美元的欺诈加密操作,该操作由一群犯罪团伙利用聊天应用程序控制这一成果非常重要,为保护...

区块链

新韩银行与泰国盘谷银行科技创新公司在Hedera上试点跨境稳定币支付

韩国新韩银行和泰国盈利商业银行的SCB TechX已经成功在Hedera网络上测试了稳定币汇款

政策

🚨 OKX被调查运营为未注册的加密货币交易所:你需要知道的事情

最近,数字资产交易协会的报告促使韩国金融情报单位启动对加密货币交易所OKX运营情况的调查这表明政府积极推进确保加密货币行...