Jupyter notebook运行Spark+Scala教程

2020年04月10日作者：mumumuyanyanyan原文

今天在intellij调试spark的时候感觉每次有新的一段代码，都要重新跑一遍，如果用spark-shell，感觉也不是特别方便，如果能像python那样，使用jupyter notebook进行编程就很方便了，同时也适合代码展示，网上查了一下，试了一下，碰到了很多坑，有些是旧的版本，还有些是版本不同导致错误，这里就记录下来安装的过程。

1.运行环境

硬件：Mac

事先装好：Jupyter notebook，spark2.1.0，scala 2.11.8 (这个版本很重要，关系到后面的安装）

2.安装

2.1.scala kernel

从github下载

git clone https://github.com/jupyter-scala/jupyter-scala.git

进入下载的jupyter-scala目录下，运行

bash jupyter-scala

然后查看

jupyter kernelspec list

其中spark_home指的是你的spark的安装目录，记住这个安装目录必须到spark中有python之前，比如我的spark中的python（spark中的python文件夹，不是我们自己装的那个）在 /usr/local/Cellar/apache-spark/2.1.0/libexec

查看结果

jupyter kernelspec list

有这么多选项，可以快乐的用jupyter notebook进行spark了

以上这篇Jupyter notebook运行Spark+Scala教程就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持来客网。