报告主题:From Token to Embedding:大模型视角下的一些生物学概念
主讲人:李兆融(阿里云)
主持人:周之超
时间:2025年1月14日周二14:00
地点:致知楼706
嘉宾简介:
李兆融,阿里云智能飞天实验室生物计算研究总监。目前负责基于云计算和人工智能技术构建生物系统大模型,并在病原学,微生物,及生物演化领域开展科学研究工作。带领团队构建LUCA生物大模型体系,主要工作包括:LucaOne-首个融合核酸和蛋白序列的生物语言预训练基础模型;是目前使用最为广泛的核酸蛋白语言预训练基础模型之一。LucaProt-病毒鉴定模型:于2024年10月9日发表在Cell,报告了全球范围内发现的180个超群和超过16万种RNA病毒。这项研究显著扩展了全球RNA病毒的多样性,展示了AI算法在病毒发现中的巨大潜力。
报告摘要:
通过讨论目前大模型领域发展力的两个基本概念:Token和Embedding,讨论其对生物系统和生物计算的实用性,并以此为起点探讨大模型技术如何应用在生物计算领域。