行业
- 农业/生物科技
位置
- 总部:圣. 路易斯,莫
用例
- 产品和作物产量优化
- 客户细分和流失预测
- 供应链效率
影响
- 供应链种子生产产量显著提高
- 使用不同技能和工具的不同团队之间的协作
- 数字化解决方案实现了重大价值
用户
- 500强的数据科学社区嵌入全球多个业务线
解决方案
- 数据科学工具:R Studio, Python, 瓶, Shiny
- 服务器/云基础设施:AWS
拜耳的数据科学
它的历史可以追溯到一个多世纪以前, 拜耳一直将创新视为其提高农民产量、平衡人类需求与地球有限资源的使命的关键. 拜耳, 世界领先的农产品供应商, 它的核心依赖于数据科学, 支持用例,例如最大化作物产量, 提升客户体验, 优化供应链运作. 数据科学的输出是一个模型. 由拜耳500多个强大的数据科学社区建立的模型帮助改进了100多个决策, 这家公司体现了模型驱动的含义.
拜耳已经采用Domino作为其“science@scale”数据科学平台的一部分,以进一步增强可见性和协作性, 加快数百个同时进行的项目和多个业务部门的研究步伐. 这个平台对业务产生了很大的影响. 再加上在企业范围的数据战略和数字平台上的投资, 拜耳通过降低商品成本和提高运营效率实现了显著的成本节约.
机会
拜耳有一个多年的研发管道来开发新产品, 包括能够最大限度地提高作物产量的种子,并提供保护,使其免受害虫和除草剂的侵害,这些除草剂是对抗田间夺产量杂草所需的. The process is expensive and time-consuming; there is little margin for error.
“每年, 在每个半球的生长季节,BOB官方APP下载都有一次机会收集BOB官方APP下载培育的种子的数据,纳文·辛格拉解释道, 拜耳数据科学卓越中心的领导. “BOB官方APP下载管理着大量的数据,以帮助产生高质量的结果, 但BOB官方APP下载也知道,总有机会改进BOB官方APP下载管理和利用数据的方式.”
该公司在农业生产过程的每个阶段都应用高度复杂的模型, 从早期育种到现场测试, 在节约环境资源的同时,提高产量最大化的突破概率和速度.
拜耳在他们的数据科学之旅早期就意识到管理开发, 生产, 对模型的持续改进需要一种不同于围绕软件工程和数据管理的既定学科的方法. 拜耳开始开发内部系统, 基于云的数据科学平台称为“science@scale”,可以摄取数据并提供对广泛使用的数据科学工具的访问. 同时,该平台加快了数据分析, 模型的独特特性需要额外的协作.
模型的构建方式不同,它们服务于不同的目的.
不像软件工程或数据管理, 模型(以及拜耳的业务)需要一种基于研究的方法,包括不断的探索, 迭代, 和敏捷性. 它们是概率性的,而不是确定性的. The nature of data scientists’ work is experimental and collaborative; models must constantly be tracked, 重新训练, 并进行迭代,以反映变化的数据和导致模型漂移的其他因素.
拜耳有机会扩大其基于研究的方法,在其全球数据科学社区取得更大的成功.
模型有不同的成分.
数据科学工具和技术的前景——i.e. 进入模型的“成分”是非常不同的,并且不断发展. 数据科学平台必须提供灵活性, 敏捷性, 以及支持动态工具环境和不同技能集和偏好的可伸缩性. 快速迭代再培训模型的能力, 验证, 对拜耳来说,部署是“必须的”.
science@scale解决方案包括RStudio、Jupyter、瓶等.,面向熟悉现代软件编程范式的数据科学家. Domino为拜耳更广泛的数据科学社区提供了更容易访问大数据技术堆栈的方法, 这对拜耳多元化的研究团队产生了积极影响,同时也带来了商业价值.
“BOB官方APP下载需要一个能够抽象出复杂性并允许所有用户进行大规模分析的平台, 利用现代技术堆栈,从数据中获得更好的见解,辛格拉说.
多米诺效应
拜耳的领导层认识到通过Domino增强science@scale的机会. Domino是一个专门构建的数据科学平台,支持各种工具, 自动化硬件基础设施配置(因此数据科学家可以并行和大规模地运行实验), 并促进模型的快速迭代和部署. Domino提供的关键特性包括:
- 开放和灵活的易用性:Domino允许拜耳的数百名数据科学家专注于推动创新, 使用他们首选的硬件, 软件, 工具, 和语言——包括RStudio, Python, 瓶, 闪亮——集中管理. 该平台允许对大数据技术栈相对不熟悉的团队成员进行处理, 探索, 并使用最新的软件包对数据进行建模. 每个级别的数据科学家都有权控制自己的环境和硬件.
- 协作:Domino自动为代码版本,而不仅仅是代码版本, 而是整个实验和数据, 的环境, 讨论线程, 以及必要的工件, 这意味着工作永远不会丢失,而且总是可重复的. “能够将你当前的结果与五次实验前的结果进行比较,看看有什么变化,这是非常宝贵的,辛格拉说. 全球的数据科学家可以在过去的工作基础上进行合作,而不是重新发明轮子, 数据科学领导层对团队高效、大规模交付业务成果的能力充满信心.
- 采用:拜耳在science@scale中建立了健壮的发现环境中的Domino, 通过Domino API和闪亮的应用程序加速模型开发和模型交付. 在该公司的500多名数据科学家社区中,超过75%的人现在积极使用Domino,而且采用还在继续扩大. 随着团队的发展, 专业数据科学家在Domino中创建模板,帮助更多初级同事巩固和分享最佳实践.
拜耳的数据科学之旅:使命驱动
拜耳的大型数据科学社区是一个有凝聚力、高绩效的团队. 他们建立的模型既能推动农业突破,又能优化日常业务运营的效率.
整个公司的数字创新, 通过对数据的投资组合实现, 平台, 和人民, 带领公司实现了为世界各地农民提供农产品的价值和效率.
- 通过Domino的平台使用机器学习, 拜耳可以更好地理解, 模型和预测种子遗传的影响, 环境条件和农艺实践对其供应链业务中的作物产量有影响. 产量表现取决于作物基因型和环境因素(如地形)之间的相互作用, 作物种植地点的土壤和气候条件). 利用该平台,只需在公司现有种子生产网络的最佳区域种植一种产品,就可显著提高种子产量. 这种增加既可以用来减少生产面积, 或者现有生产面积的不确定性.
- 而不是在联机操作中使用静态模型, 研究人员现在可以根据更新的数据流调整模型. 快速迭代, 验证, 使用Domino的交付使他们能够更有效地进行现场操作.
- Domino允许拜耳的销售团队访问有关客户特定需求的更详细信息, 以便为他们的领域推荐最好的产品. 这种个性化的方法提高了客户的成功和满意度.
- 平台自动跟踪R的完整测试记录&D项目, 并将其部署为供下游系统使用的api, 允许加入团队的新成员立即做出贡献.
Domino为全球企业的用户提供了方便, 使用不同的工具,不同的背景和技能, 互相合作, 利用过去的工作, 快速合作. 这最终导致在更短的时间内交付和部署更多的模型, 使拜耳成为一个模型驱动的公司,走在农业的前沿,辛格拉说.