105亿美元的中国种子行业市场:育种选种人工智能来当家

IT思维  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

公众号/机器之能

育种选种是农业产业链的起点,而种子是最重要的农业生产资料之一,如何培育出商业价值高,高产抗病害的种子,是众多企业关注的焦点。而育种过程却需要大量的资金与技术投入,以及海量数据的支持,这就极大的提高了育种产业的市场准入门槛。本文将主要讨论人工智能技术在育种产业中的辅助指导作用,并探究其的发展前景与局限。

作者 | 于琳洋

一、育种行业的市场规模及人工智能在其中的影响

中国幅员辽阔可耕地众多,是仅次于美国的世界第二大种业市场,市场规模约105亿美元,占全球28.2%。但种业大国却并非育种强国,中国种业进入市场较晚,而种业市场已经被少数几家种子集团垄断。而育种行业本身的特性也增加了新加入公司扩展自己市场的的阻力:其一是高昂的研发投入,进行研发原始的资金成本高;而开发周期也相对偏长,于是厂商的平均成本始终大于其他行业;而育种基于基因突变本身的随机性,也使育种结果难以预测。人工智能的出现为育种产业提供了新的活力:基于大数据的基因库,表象库为育种提供海量数据支持;基于机器学习和神经网络的表象预测技术,节省了大量的研究时间和物质成本;基于人工智能的筛选技术,使优秀品种的发现更精确快速;模拟种植系统更是缩短了育种周期,降低平均成本。

105亿美元的中国种子行业市场:育种选种人工智能来当家

二、定向育种领域的人工智能技术

大数据技术:大数据技术的体系庞大,基础技术包括数据采集,数据预处理,数据仓库等。利用大数据技术对基因库,表象特征库进行数据平台搭建与共享,能够为育种技术的发展提供足够的数据支持;

机器学习:是指利用人工智能模型对数据集合中的规律进行挖掘,并根据其特征对其他数据进行预测。明确遗传分子和表型性状之间的相关性,需要借助机器学习模型来帮助,通过大通量的数据学习,合格的机器学习模型能够更精准的挖掘出遗传分子和性状之间的关联,从而基于基因型对表型进行更精准的预测;

深度学习:是指利用多层神经网络对数据的特征进行挖掘,并对数据进行合理预测。深度学习模型突破了机器学习基于线性模型的限制,在某个基因上学到的特征能够有效的运用到相似分子机制的基因,从而能够更有效的预测低频罕见变异的表型应;

高维数据聚类:将高维数据进行归纳分组,属于无监督学习。基因数据和表象蛋白质数据都属于高维数据,将基因和蛋白质数据进行聚类分析,能够较为有效的提取基因家族和蛋白质家族成员之间的相关性,对于整个基因家族进行分析优化优于对单点基因进行分析,既节省了数据处理难度,又能够揭示更本质的生物学原理;

计算机视觉:是指机器代替人眼对目标进行识别、跟踪和测量,并进一步进行图像处理的技术。利用计算机进行农作物生长情况的数据采集,并将采集到的数据运用到人工智能模型的训练上,搭建虚拟种植系统,能够有效的缩短育种的时间和经济成本。

三、定向育种领域人工智能应用任务方向

105亿美元的中国种子行业市场:育种选种人工智能来当家

四、人工智能在育种产业中的应用案例

华大基因:对重要农作物的基因组进行研究与分析,绘制基因组和遗传图谱,收集整理数据并进行大数据数据库搭建,华大农业应用研究院大数据中心还利用hadoop和spark解决方案挖掘大数据背后的生物学含义,进一步优化算法与流程。其优势项目包括:大豆回家,大数据中心承担3000分大豆资源的序列采集,遗传变异鉴定以及表型关联分析;药用植物4.0,完成10000中潜在药用植物资源的收集和遗传多组学解析,建立药用植物多组学数据库和高通量药用植物基因组辅助育种平台。

国家超算广州中心:“天河二号”超级计算机部署蛋白质组数据共享平台iprox, 汇集了数据,格式转换,鉴定,质控,定量,差异蛋白质筛选等功能,是超级计算机与大数据处理深度融合的典型应用。利用马尔可夫预测模型,数值模拟和数据挖掘等数据科学及机器学习方法,可以合理的机型蛋白质结构预测和相互作用网络。

中国农业科学院:开发从基因组序列预测基因表达调控模式的人工神经网络模型,借助人工智能技术实现定向育种。以基因家族代替单个基因为单位随机分配训练集和测试集,已解决“进化依赖”导致的过拟合问题,之后对模型进行解析,获得关键基因序列,并对基因的表达性进行合理预测,同时可以对基因进行虚拟诱变,并预测变异后果。

中种集团:2017年中种集团联合华中农业大学及北京大学共同推出了全球首张水稻全基因组育种芯片,利用水稻基因组的最新研究成果,全基因组snp技术以及高密度的dna探针阵列技术共同打造。芯片本身就相当于智能育种工厂,其能够通过大数据扫描来判断培育出来的种苗是否符合需要。

隆平高科:组建智能育种体系,利用人工智能建立模型,通过图像识别采集农作物数据,之后将数据导入计算机进行模拟,即使没有实际耕种作物,也能够预测出作物的生长现状,从而降低实验成本,提升育种效率。

五、人工智能在育种领域的局限性

人工智能技术在育种领域里的人才资源并不能满足现阶段的需要:虽然现今人工智能发展迅速,但人才还是主要聚集在像金融,物流,互联网等热门产业,这就导致了传统产业中人工智能人才相对不足。同时,育种产业中对于生物等基础学科的掌握度要求较高,如果要将人工智能灵活运用与育种产业,跨学科人才将是更好的选择;

受技术限制,企业准入门槛变高:现阶段无论是大数据平台搭建还是人工智能模型开发都只局限于资金雄厚,人才集中的大型公司企业,而育种产业本身的竞争机制使得研究成果共享几乎不可能。主要的大公司掌握着资金,技术,人才的三重优势,势必提高市场份额的集中效率以及市场本身的准入门槛,新加入市场的中小型面临严酷的竞争,在这种环境中谋求本身发展,抢占市场份额都十分困难。

中小型企业发展受限,可能会导致垄断现象的发生:当前市场中的大型企业都在积极发展自己的大数据库以及人工智能模型,而遗传性研究本身的复杂性决定了相关的人工智能模型的高复杂程度,并且大型企业的数据库普遍缺乏共享性。当资金技术优势导致市场份额大规模向大型企业集中,势必会导致垄断现象的发生,人工智能和大数据技术也会一定程度上加速这个过程。

六、人工智能在育种产业中的发展趋势

人工智能将实现育种基因组合优化的新突破:人工智能技术通过机器学习和深度学习,对基因与基因,基因与表象之间的相关性进行深度挖掘与分析,并利用大数据的优势,能够更有效率的发现通过普通观察发现不了的重要相关关系,从而实现基因组合及编辑的进一步优化;

人工智能将明显减少现阶段育种前期研究的时间成本:人工智能技术其关键是依赖计算机的运算能力,在较短的时间内对结果进行因果推定和有效预测。利用已搭建的大数据平台和超级计算机的计算能力,在育种的初级阶段就能够利用人工智能有效的辅助引导基因编辑;而通过计算机视觉的数据收集以及人工智能模型搭建,更能形成虚拟耕种系统,对作物的种植和未来的生长进行推断,从而缩短作物的试验培育时间;

人工智能技术能够显著提高企业科研产率的稳定性:传统育种主要依靠基因突变和杂交培育,其亲代与子代的性状相关程度往往难以预测,而利用人工智能挖掘基因家族彼此之间的关联,能够控制子代基因和性状发展方向,使研发成果的成功率更高,从而实现科研方面的高效稳定的产出。

随意打赏

提交建议
微信扫一扫,分享给好友吧。