蓝海情报网

国产大模型逆袭,首次击败GPT-4 Turbo,拿下第一!SuperCLUE 刷新了国内大模型最好成绩

蓝海情报网 677

国产大模型逆袭,首次击败GPT-4 Turbo,拿下第一!SuperCLUE 刷新了国内大模型最好成绩

国产大模型逆袭,首次击败GPT-4 Turbo,拿下第一!SuperCLUE:刷新了国内大模型最好成绩

图片来源:摄图网

随着人工智能技术不断发展,以ChatGPT为代表的生成式AI大模型,正日益成为人们关注的焦点。这些大模型能够生成高质量的文本、对话和图像,具有强大的语言理解和生成能力。它们被广泛应用于自然语言处理、智能对话系统、内容生成等领域,为人们的生活和工作带来了诸多便利。然而,这些大模型也面临着隐私保护、伦理道德等方面的挑战,引发了社会和学术界的广泛讨论。

OpenAI的ChatGPT大模型,特别是GPT-4、GPT-4 Turbo,是业内公认的强力大模型,一直霸占着SuperCLUE(中文大模型测评基准)的榜首位置。随着大模型不断发展,国产大模型奋力追赶,在技术上不断创新,国产大模型竞争力不断增强,大模型性能逐渐和国际接轨。

就在近日,SuperCLUE榜单上,迎来一场巨震,随着一位国产大模型申请出战,OpenAI的GPT-4、GPT-4 Turbo首次失去榜首位置,它首次被国产大模型击败了,而击败GPT-4 Turbo的国产大模型来自于商汤科技的日日新5.0(SenseChat V5)。

SuperCLUE团队对SenseChat V5进行了一番全方位的综合性测评,最终官宣的成绩是:总分80.03分,超过GPT-4 Turbo的79.13分,成绩第一!并且SuperCLUE还给出了这样的评价:刷新了国内大模型最好成绩。

除了综合成绩测评,SuperCLUE团队还从文、理科维度对SenseChat V5进行测评。测评结果显示,文科上,SenseChat V5的综合成绩依然是打破了国内大模型的纪录,以82.20分的成绩位居第一,同样超越GPT-4 Turbo(77.78分)。理科上,虽然SenseChat V5综合成绩为76.78分,虽然此次并没有超越GPT-4-Turbo(81.13分),低了4.35分,但在国内大模型选手中首屈一指,位列国内第一。

从国产大模型击败GPT-4回看生成式AI行业发展情况:

——中国生成式AI行业竞争派系

当前,我国的AIGC行业可划分为基础设施层、模型层及应用层三个层级结构。AIGC行业的头部上市公司主要有百度、科大讯飞、腾讯等;未上市的AIGC产业领先公司有抖音集团、华为、小冰、启元世界、创新奇智、影谱科技、拓尔思、云舶科技、联汇科技、一览科技、视拓云、智源研究院、出门问问、无界AI等。

国产大模型逆袭,首次击败GPT-4 Turbo,拿下第一!SuperCLUE:刷新了国内大模型最好成绩

——中国生成式AI行业人工智能多模态大模型企业综合竞争力

根据赛迪工业和信息化研究院公布的2024年中国人工智能多模态大模型企业综合竞争力10强排名情况来看,腾讯、科大讯飞、阿里巴巴分别排名在前三位,反映这三家企业的大模型产品在中国市场中占据优势地位。其余上榜的企业大多数是互联网科技产业巨头企业。

国产大模型逆袭,首次击败GPT-4 Turbo,拿下第一!SuperCLUE:刷新了国内大模型最好成绩

——中国生成式AI行业产品布局

当前主流的生成式AI产品及大模型有百度的文心一言、科大讯飞的星火大模型、腾讯的混元大模型、盘古大模型、华为的盘古大模型等,各家头部科技企业研发打造自己的大模型及生成式AI产品,以达到或超越OpenAI推出的GPT-4生成式AI产品。

国产大模型逆袭,首次击败GPT-4 Turbo,拿下第一!SuperCLUE:刷新了国内大模型最好成绩

产业研究院分析认为,随着ChatGPT的火爆出圈,生成式AI成为各行各业关注和热议的话题。全球科技巨头和AI厂商纷纷下场,唯恐错过此番科技盛宴。行业翘楚和媒体将生成式AI浪潮类比昔日的移动互联网机遇,认为它将对全球经济和各个行业带来深远影响,企业也将迎来重大变革机遇,同时,根据Bloomberg Intelligence披露的数据,2023年全球生成式AI市场整体规模约为670亿美元,预计2029年及2032年将分别达到7280亿美元和1.3万亿美元,2022-2032年复合增长率高达42%。

根据埃森哲2024年的相关调研,87%的受访高管相信,生成式AI将在未来五年内颠覆自己所在的行业。与此同时,通过以人为本的方法部署生成式AI,企业到2038年有望额外释放10.3万亿美元的经济价值。

经济学人APP资讯组

看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。

标签:

ad2

推荐内容