蓝海情报网

研究员开发出新语言模型优化基因序列 通过解码mRNA设计更好疫苗

蓝海情报网 209

研究员开发出新语言模型优化基因序列 通过解码mRNA设计更好疫苗

瞻观前沿

最新发表在《自然·机器智能》上的一篇论文中,美国普林斯顿大学研究人员详细介绍了一种语言模型,该模型可追踪部分基因组序列并优化这些序列,利用其语义表示能力来设计更有效的信使RNA(mRNA)疫苗。

新模型的代码包含所有生命功能的指令。基因组中每个序列都遵循复杂的语法和句法,这些结构产生了意义。正如改变几个单词可从根本上改变句子含义,生物序列的微小变化也可使序列编码产生巨大差异。

研究团队使用经过训练的模型创建了包含211个新序列的库,每个都针对所需功能进行了优化,提高了翻译效率。这些蛋白质,如新冠疫苗靶向的刺突蛋白,可驱动针对传染病的免疫反应。

新模型是第一个专注于mRNA非翻译区域的语言模型。研究人员表示,即使是少量提高蛋白质生产效率,也会对新兴疗法产生重大推动作用。经过对来自少数物种的mRNA的训练,它能解码核苷酸序列并揭示有关基因调控的新知识。而基因调控是生命最基本的功能之一,是找到疾病和紊乱根源的关键。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

图片来源:摄图网

技术价值观察

人工智能产业链上游为硬件设备和数据设备,其中包括芯片、传感器、大数据、云计算服务等,为人工智能提供数据服务和算力支持;中游是人工智能产业的技术核心,包括通用技术、算法模型、开发平台三个方面,涵盖了机器感知、自然语言理解、机器学习、图谱、基础开源框架等核心技术;下游是人工智能的应用产品和场景,涉及交通、医疗、安防、金融、家居、制造等多个领域。

研究人员开发出新语言模型,可追踪部分基因组序列,通过解码mRNA设计更好疫苗。因此,从人工智能产业链上看,该技术处于产业链的中游环节。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

宏观市场观察

——人工智能行业发展加速

受益于算法、数据和算力三方的共同发展,人工智能应用逐渐成熟,既催生了新的市场,也为传统产业的发展注入了活力。据测算,2024年我国人工智能市场规模将突破6000亿元,预计2029年将突破万亿大关。人工智能将助力传统产业降低成本并提高效能,从而实现行业的智能化升级。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

——人工智能应用场景广泛

近年来,人工智能技术正在被应用到不同场景中,主要包括安防、金融、交通、物流、医疗、零售等领域。由于场景复杂度、技术成熟度和数据公开水平的不同,人工智能技术在各场景的渗透度也不同。根据IDC的数据,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造,其中金融和电信行业人工智能应用增长速度较为明显。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

——AI大模型汇总情况

超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

——AIGC行业热度高,受资本追捧

截止2023年4月,AIGC赛道目前在国外已出现了7家独角兽。在我国,超参数和小冰公司已明确成为独角兽公司,Minimax据传估值过10亿美元,光年之外则宣布下一轮融资已被认购2.3亿美元。目前,最受头部资本关注的机构均与底层大模型相关或与AI领军人物下场相关(如王慧文光年之外、李志飞、周伯文、王小川等)。

多家机构已高度明确要将AIGC作为主投赛道,个别投资机构已经推出了相应的主体孵化项目。整体而言,大部队还处在缺乏明确逻辑和标的的观望状态。但预计本年度融资规模将有数倍增长。随着底层大模型的逐步开放以及商业价值的落地验证,预计融资规模将在2024年出现首次阶段性的指数级增长,投资向AIGC全产业链扩散。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

——AIGC行业市场规模将持续扩大

据产业研究院测算,我国2023年AIGC市场规模预计可达到170亿人民币,2023-2025年是我国AIGC产业市场规模增长的第一阶段,增长率维持在25%左右,2025年市场规模达到约260亿人民币。2025年开始,由于行业生态完善(特别是底层大模型完成对外开放),应用层蓬勃将带动产业快速增长,年复合增长率将超过70%。预计2027年我国AIGC产业规模超600亿人民币,2028年开始,AIGC产业将延展出完整产业链,并在商业化场景上持续拓宽加深,深入变革行业。2028年起,我国AIGC产业规模将持续保高速增长,2030年市场规模超万亿。

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

中国人工智能技术赛道热力图

研究员开发出新语言模型优化基因序列:通过解码mRNA设计更好疫苗

根据产业热力图显示,与人工智能关键技术强关联的城市集群主要集中在华南和西北地区,并且以广东、陕西省为重点发展区域,未来布局人工智能技术及其他相关技术的发展路径,极大可能性在于华南、西北地区优先导入,其中可重点关注广东省广州市天河区、广东省深圳市福田区及陕西省西安市雁塔区所处的人工智能相关企业,以及该地方对于人工智能产业发展投资环境、供给市场的潜力空间。

经济学人APP资讯组

看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。

标签:

ad2

推荐内容