大数据下的典型机器学习平台综述

发布时间:2017-12-01 15:30:37 编辑: 手机版

 由于大数据海量、复杂多样、变化快,传统的机器学习平台已不再适用,因此,设计一个高效的、通用的大数据机器学习平台成为目前的研究热点。通过介绍和分析机器学习算法的特点以及大规模机器学习的数据和模型并行化,引出常见的并行计算模型。简单介绍了整体同步并行模型(BSP)、SSP并行计算模型以及BSP、SSP模型与AP模型的区别,主要介绍了基于这些并行模型的典型的机器学习平台和这些平台的优缺点,并指出各个平台最适合处理何种大数据问题。最后从采用的抽象数据结构、并行计算模型、容错机制等方面对典型的机器学习平台进行了总结,并提出一些建议和展望。

 

近年来,随着数据收集手段的丰富及数据存储能力的提升,公司、企业存储的以及科学研究(如:脑电信号分析等)产生的数据量急剧增加。对大数据进行科学的分析来获取更加有价值的信息是一项具有挑战性的任务,大数据机器学习则是完成这项任务的关键技术。目前机器学习应用广泛,但是机器学习处理大数据的效率不高,主要面临两大类挑战:大数据和大模型。当需要处理的数据量达到PB、EB级别时,单台高性能计算机已经无法在较短的时间内给出计算结果, 因此学术界提出了许多并行计算模型,为提高计算效率提供了新的方案。常见的并行计算模型[1-2]有并行随机存取器(Parallel Random Access Machine, PRAM)、LogP[3]、块分布模型(Block Distributed Model,BDM)、整体同步并行模型(Bulk Synchr-onous Parallel model, BSP)[4-5]、AP(Asynchronous Parallel)[4]和SSP(Stale Synchronous Parallel)模型[6]等。由于并行计算模型众多,因此如何设计出一个高效的大数据机器学习平台[7]或者框架成为了目前的一个研究热点,并取得了一些成果。图 1列举了常见的机器学习平台,这些机器学习平台是基于BSP、AP、SSP并行模型的,并且采用各自的编程范式。

图 1中的机器学习平台借助高级编程语言实现各自的编程模型,并基于这些编程模型实现各类机器学习算法[8],编程模型能够对相应的并行计算模型进行仿真。图 1中还列举了部分商业机器学习平台:AmazonMachineLearning(https://aws.amazon.com/cn/machine-learning/)、微软Azure(https://azure.microsoft.com/zh-cn/services/machine-learning/)、百度BML(https://cloud.baidu.com/product/bml.html)、GoogleCloudPlatform(https://cloud.google.com/products/machine-learning/)、阿里云DTPAI(https://data.aliyun.com/product/learn?spm=5176.8142029.388261.122.CnBRoG)、IBMSystemML(http://systemml.incubator.apache.org/)、腾讯TML(https://cloud.tencent.com/product/tml)等。

 

图 1 典型的机器学习平台架构Figure 1 Architecture of typical machine learning platforms
本文已影响0
+1
0