1.软文推荐

2.软文推荐

3.软文推荐

apache spark 前几年在学术界是非常火的,最近几年可能不是那么火了,因为能研究的问题似乎都已经被研究的差不多了,最近都开始研究新的分布式框架了。本文就介绍一下如何在 ubuntu 20.04 Linux 操作系统上安装 Apache Spark 教程,包括安装 Java、安装 Apache Spark、以及通过 Apache Spark Web 界面访问的教程。Apache Spark 是一个用于大规模数据处理的开源、通用、多语言分析引擎。通过利用集群中的 RAM 对大量数据执行快速数据查询,它可以在单个和多个节点上工作。它提供批处理数据处理和实时流式传输,并支持 Python、SQL、Scala、Java 或 R 等语言的高级 API。该框架提供内存技术,使其能够将查询和数据直接存储在集群节点的主存储器。

一、安装 Java

更新系统包:

$ sudo apt update

安装 Java:

$ sudo apt install default-jdk -y

确认 Java 安装:

$ java -version

二、安装 Apache Spark

安装必要的包:

$ sudo apt install curl mlocate git scala -y

下载 Apache Spark,最新版可以在这里下载:https://spark.apache.org/downloads.html

$ curl -O https://archive.apache.org/dist/spark/spark-3.2.0/spark-3.2.0-bin-hadoop3.2.tgz

解压 Spark 安装包:

$ sudo tar xvf spark-3.2.0-bin-hadoop3.2.tgz

创建安装目录:

$ sudo mkdir /opt/spark

移动文件到安装目录:

$ sudo mv spark-3.2.0-bin-hadoop3.2/* /opt/spark

修改目录权限:

$ sudo chmod -R 777 /opt/spark

编辑 bashrc 配置文件,将 Apache Spark 安装目录添加到系统路径:

$ sudo nano ~/.bashrc

将下面两行代码添加到文件最后:

export SPARK_HOME=/opt/spark

export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

保存文件并使之生效:

$ source ~/.bashrc

启动独立主服务器:

$ start-master.sh

通过访问 http://ServerIPaddress:8080 从仪表板中查找您的服务器主机名。它可能看起来像这样:

URL: spark://my-server-development:7077

启动 Apache Spark 工作进程。使用您的服务器主机名更改 spark://ubuntu:7077。

$ start-slave.sh spark://ubuntu:7077

三、访问 Apache Spark Web 界面

转到浏览器地址栏以访问 Web 界面并输入 http://ServerIPaddress:8080 以访问 Web 安装向导。例如:

http://192.0.2.10:8080

至此,您已在服务器上安装了 Apache Spark。您现在可以访问主仪表板,开始管理您的集群。

搬瓦工VPS套餐

搬瓦工美国CN2 GIA/日本软银

最高10Gbps带宽,可选:美国cn2 gia、日本软银,企业级高端网络带宽。VPS基于KVM虚拟,SSD raid10阵列,自带一个IPv4,免费支持snapshot快照功能(可以导入、导出)和Backup(备份功能),可以一键更换IP、一键切换机房。

内存 CPU SSD 流量 带宽 价格 购买
1G 2核 20G 1.0T/月 2.5G $50/季 链接
2G 3核 40G 2.0T/月 2.5G $90/季 链接
4G 4核 80G 3.0T/月 2.5G $57/月 链接
8G 6核 160G 5.0T/月 5.0G $87/月 链接
16G 8核 320G 8.0T/月 10G $160/月 链接
32G 10核 640G 10.0T/月 10G $290/月 链接
64G 12核 1280G 12.0T/月 10G $550/月 链接
本文来源:yuntue.com/post/37744.html,若侵权,请联系删除。

相关文章 8

2

阿里云云效DevOps实验室,挑战云效赢25000元大礼包(阿里云云效做持续集成) 3分钟前

阿里云云效挑战云效devops实验室,赢25000元大礼包,阿里云云效是企业级一站式devops平台。 最近,我们对云效DevOps进行了全新升级。新云效...

3

京东云:双11活动,云主机3年低至3折,2核/4G/3M带宽仅2006.1元/3年起(京东双十一) 5分钟前

京东云双11活动开始了,京东云双十一云上狂欢季一企前行,享你所想,云产品限时秒杀,数量有限,先到先得!还有更多产品优惠券等您来...

4

腾讯云服务器重装系统操作图文过程(腾讯云服务器重启) 6分钟前

腾讯云服务器如何重装操作系统? 有的用户可能想到重装云服务器操作系统会比较麻烦,云服务器网(www.yuntue.com)小编告诉大家其实重装操作...

5

盐城云服务器_盐城云主机/易探云免备案vps主机租用(盐城云石互联网科技有限公司) 8分钟前

盐城云服务器( 盐城云主机 )真正的云计算架构云服务器,配备纯SSD架构打造的高性能存储,旨在为盐城企业和个人用户提供优质、高效、弹...

6

亿速云弹性计算云服务器所挂载的SSD云硬盘性能怎么样?(云计算快速弹性的特征) 11分钟前

亿速云所提供的“云服务器”和“裸金属服务器”这两种弹性计算服务产品,主要基于超高I/O性能的纯ssd云硬盘,来进行数据的读写与存储...

7

半月湾:上海cn2vps/1核/384M/4G SSD/500G流量/免实名/月付$6.99 12分钟前

半月湾vps怎么样? 半月湾是一家国人云主机商家,商家主要销售VPS和IPLC产品,分为正常VPS主机和nat机器,目前机房有美国洛杉矶CN2 GIA和香...

8

什么是挂机宝?挂机宝哪家好用?便宜稳定的挂机宝推荐(挂机宝可以挂哪些东西) 15分钟前

什么是挂机宝,挂机宝有什么用途? 挂机宝其实也是VPS服务器,是专门用来挂机的VPS,可以用于挂QQ、YY等各类挂机软件,一般不开放80端口...