全球最强开源大模型一夜易主！3000亿的超级独角兽推出DBRX，一举超过扎克伯格、马斯克

蓝海情报网 2024-04-29 08:51:14 29

图源：摄图网

全球最强开源模型，一夜易主！

近日，超级独角兽Databricks重磅推出1320亿参数的开源模型——DBRX，超越了Llama 2（meta）、Mixtral和Grok-1（注：马斯克旗下AI初创公司xAI研发的大模型）。

据了解，DBRX采用了细粒度MoE架构，推理速度比LLaMA 2-70B快了2倍。最重要的是，训练成本只用了1000万美元和3100块H100，成本直降50%。Databricks就在2个月内推出了DBRX。比起meta开发Llama2所用的成本和芯片，这是非常小的一部分。

DBRX在语言理解、编程、数学和逻辑方面轻松击败了开源模型LLaMA2-70B、Mixtral，以及Grok-1。另外，与闭源模型GPT-3.5相比，DBRX Instruct的性能全面超越了它，甚至还可与Gemini 1.0 Pro和Mistral Medium相较量。

Databricks自从2013年成立以来共完成了11轮融资，根据最新一轮融资，Databricks估值高达430亿美元（约合3000亿元人民币）。

Databricks通过DBRX向meta、谷歌、OpenAI等AI公司发起挑战。目前，企业可以在Databricks平台上访问DBRX，能在RAG系统中利用长上下文功能，还可以在自己的私有数据上构建定制的DBRX模型。而开源社区可以通过GitHub存储库和Hugging Face访问DBRX。

中国AI算力产品竞争态势

目前可以衡量国内AI算力竞争情况的模型有百度的文心大模型、腾讯的混元大模型、华为盘古大模型、阿里的通义大模型以及浪潮的源AI大模型。其中参数量最高的是阿里的通义大模型，高达十万亿级，而应用场景相对较广的是百度的文心大模型，涵盖聊天互动、文本生产以及文生图等。

全球最强开源大模型一夜易主！3000亿的超级独角兽推出DBRX，一举超过扎克伯格、马斯克

易用性和性能成为AI框架的核心竞争力

中国人工智能开发者选择开源框架最重要的两个因素是：易用性和性能。人工智能框架隔离了底层的复杂性，更加易用的框架能够让开发人员以更快的速度和更高的效率，来探索、创建、改进和迭代人工智能项目。而人工智能框架的性能则涉及到框架本身的底层性能，包括框架的底层算法效率，以及框架利用底层硬件资源进行优化开发、训练和推理的能力。

有40%的开发者将易用性作为选择框架的首选因素，34%的开发者将性能作为选择框架的首选因素。在第二重要的因素选择中，开发者选择性能比易用性更多。与易用性和性能这两个因素相比，选择其他选项作为首选的比例很少。受访者把对社区活跃度、框架厂商提供的技术支持或培训，知名度或流行程度，以及前沿技术支持的关注放在了同等位置上。

全球最强开源大模型一夜易主！3000亿的超级独角兽推出DBRX，一举超过扎克伯格、马斯克