如何从本地机器(mac)加载csv到Spark-Neo4j docker?

我在Mac中使用Docker创build了一个Spark-Neo4j VM,并能够成功加载http://192.168.99.100:7474/browser 。 我也能够运行正常的查询。 我有一个dataset.csv,我想加载创buildgraphics数据库,但我得到“无法加载外部资源:file:/neo4j/community/code/data-3.csv”。 我可以在我的本地Neo4j服务器上运行这个文件,但是想用Spark来试试。

我该如何直接从本地机器设置path,或者有什么方法可以将数据集传输到docker?

您可以使用docker cp命令将CSV文件从主机复制到容器文件系统:

 docker cp data-3.csv CONTAINER_ID_HERE:/data/data-3.csv 

然后使用LOAD CSV语句中的指定path:

 LOAD CSV FROM "file:///data/data-3.csv" ... 

另一个简单的方法是从Google spreadsheet或Dropbox提供CSV文件,并使用LOAD CSV语句中的URL。