用纱线进行火花聚类

我想用纱线进行火花聚类。 我需要

  1. 安装hadoop主和从属纱configuration?
  2. 分别安装hadoop主站/从站和主站/从站?

如果1没问题,我将使用这个docker镜像( 链接 )。 这适合吗?

使用纱线configuration安装hadoop主站和从站是足够的,以便在纱线上运行火花,但是还需要确保正在下载的火花版本支持纱线。 一旦安装了火花,就应该能够进入纱线configuration,并且所需要的与纱线相关的jar文件也在火花的path上。