返回列表 发布新帖
查看: 15|回复: 0

上海高校建立全球最大蛋白质序列数据集

发表于 2025-3-23 08:37:35 | 查看全部 |阅读模式

马上注册!

您需要 登录 才可以下载或查看,没有账号?注册

×

 中新社上海3月22日电 (记者 许婧 郑莹莹)上海交通大学洪亮教授团队22日发布其最新成果:建立了全球最大的蛋白质序列数据集,并利用其训练了Venus(启明星)系列模型。

  肉、蛋、奶,这些食物中含有丰富的蛋白质,可以提供人类身体所需营养。但天然的蛋白质难以发挥这些功能,科研人员需要对天然蛋白质的功能进行设计和改造,才能使它成为满足应用需求的产品。长期以来,蛋白质设计改造一直面临时间长、成本高等难题。

  据介绍,洪亮团队建立了全球最大的蛋白质序列数据集,包含36.2亿条陆地微生物蛋白质序列、26.4亿条海洋微生物蛋白质序列、24.3亿条抗体蛋白质序列,以及0.6亿条病毒蛋白质序列。

  研究团队表示,基于该数据集训练的模型,可以把蛋白质生产从“缓慢的试错”变为“高效率的精准设计”。


  研究团队基于该数据集训练了Venus系列模型,该系列模型有“AI定向进化”与“AI挖酶”两大核心功能。

  “AI定向进化”指 Venus系列模型可以对一个不尽如人意的蛋白质产品的多种性能进行优化。

  “AI挖酶”则指 Venus系列模型基于该数据集可精准找到具备超常规功能的蛋白质,比如极度耐热、耐酸、耐碱、耐胃肠消化的蛋白质等。而这些超常规功能的蛋白质在生物技术、医药研发和工业生产中具有可观的应用潜力。(完)




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关注公众号
QQ会员群

Copyright © 2021-2025 中企互动平台 版权所有 All Rights Reserved.

相关侵权、举报、投诉及建议等,请发 E-mail:bztdxxl@vip.sina.com

Powered by Discuz! X3.5|京ICP备10020731号-1|京公网安备 11010102001080号

关灯 在本版发帖
扫一扫添加管理员微信
返回顶部
快速回复 返回顶部 返回列表