建立有生命的的植物大数据,这是美国佛罗里达大学教授、美国植物学会“百年奖”获得者,“Dahlgren国际奖”获得者道格拉斯·索尔蒂斯近年来专注于研究大数据时代的生命之树重建的初心,在与读特记者的对话中,可以清晰得感受到,他对于深圳的兴奋点则在于这座城市不仅拥有丰富的绿色植被,还科技范儿十足,拥有杰出的信息科技与基因科技企业,这对于组建世界范围内的创新团队实现目前植物大数据领域的技术突破提供了天然的优势。
大数据在解决如何保持生物多样性问题过程中大有可为,索尔蒂斯告诉记者,他和一些中国科学家正在探讨如何通过植物大数据分析预测问题,通过上千植物物种取样来对未来几十年中有可能受到破坏的物种有针对性地在某一个区域开展保护。“通俗地讲,大数据提供了一个新的工具,通过海量的植物数据分析比对其旧有形态和现在形态,预测出它50年之后的形态,” 索尔蒂斯举例说,他正在佛罗里达州构建“系统发育树”(系统发育树是生物信息学中描述不同生物之间关系、了解所有生物的进化历史过程的方法),并结合环境数据,不但可以分析该州植物物种分布与环境因子的关联,而且能够据此推断出数十年后该州可能的物种分布式样。
“气候变化以及世界人口的增长在对环境造成破坏的同时更威胁到生物多样性保护,我们需要组建世界范围内的协同创新团队,其中有基因科学领域的专家、相关植物学尤其是研究植物分布对保持生物多样性领域的专家在植物大数据领域实现技术突破。”索尔蒂斯解释说,目前,植物大数据与传统的大数据的概念有所不同,传统物理意义上的大数据需要占据大量电脑内存,海量数据的存储是一大挑战。而植物大数据的重点在于不同类型信息的综合表达,比如,植物的准确地点是地理信息,植物形态的数据是物理信息,植物的内含物质是生物化学信息,而植物的基因组数据则是遗传学信息,这些数据完全是不同性质不同领域的。
如何让植物大数据说话?索尔蒂斯认为,植物学大数据最大挑战是把涉及植物方方面面的数据全部有效整合,如果能突破这一点就可以寻找到有效的生物多样性保护方式,“深圳的一些信息科技和基因科技企业在中国甚至是全球处于引领地位,这也是我非常期待此次深圳大会的原因。”索尔蒂斯计划与深圳企业和研究机构组建团队尽快在植物大数据领域攻克技术上的难题,让科技的力量引领植物科学研究进入全新阶段。
编辑 曹亮