机器学习下的持续交付 (CD4ML) 采用了软件工程方法来创建机器学习应用。
众所周知,部署和改进机器学习应用是一项艰难的工作,而 CD4ML 有望降低这项工作的风险。 CD4ML 使组织加快实现数据驱动,并最大化机器学习的投资回报率。增加产物上市时间,提高组织在环境变化中的韧性。
它是什么?
CD4ML 采用持续交付的方式部署机器学习应用。持续交付是通过定期、快速发布代码更新来改进软件开发流程的方法。
CD4ML 非常有用,因为尽管机器学习应用是强大的工具,但其开发、部署和持续改进的过程非常复杂。应用的行为往往难以解释或预测,也难以测试和改进。
通过 CD4ML,跨职能团队可以以小而安全的增量创建基于代码、数据和模型的机器学习应用,它们可在短适应周期中随时复现、再训练和可靠地进行发布。依靠这种方法创建的机器学习应用能更快地创造商业价值。
有何益处?
机器学习工具能深刻影响组织基于数据进行业务决策的能力。CD4ML 是一套从机器学习投资中获取更多商业价值的有效方法。
但是,由于机器学习应用难以测试、解释、复现和改进,因此一直以来都有些难以捉摸。而 CD4ML 可以逐步实现碎片化部署,因此更容易在应用的整个生命周期中改进应用。
需考量的因素?
CD4ML 需要数据工程、数据科学、测试、基础设施工程和发布工程等不同专业为实现业务需求而展开协作。这种跨职能合作对孤岛式结构的组织来说可能具有挑战性。
如何应用?
CD4ML 非常适合希望实现数据驱动的公司。
在线汽车零售商 AutoScout24 利用 CD4ML 改进了其二手车定价引擎。二手车价格估算需要考虑诸多因素,而且消费者的喜好容易变化。AutoScout24 通过 CD4ML 创建了基于数据科学的汽车评估引擎,这个引擎可以根据真实的销售数据持续更新,因此能不断调整汽车的估价。
Would you like to suggest a topic to be decoded?
Just leave your email address and we'll be in touch the moment it's ready.