免安装免配置 还免费的Spark 集群 --Databrickes Spark Clould

摘要:本文带你畅游Databrickes Spark Clould云服务。小白迅速上手大数据Spark开发环境,从此告别集群Bug的烦恼,彻底解放物理机负担让你随时随地想RunRun😎。

目录:

  1. Databrickes是个啥?
  2. Databrickes注册
  3. Databrickes快速入门
  4. 其他进阶神操作

Databrickes是个啥?

YouTube简介,自备云梯
Databricks 属于 Spark 的商业化公司,由美国伯克利大学 AMP 实验室著名的 Spark 大数据处理系统多位创始人联合创立。Databricks 致力于提供基于 Spark 的云服务,可用于数据集成,数据管道等任务。
Databricks 公司的云解决方案由三部分组成:Databricks 平台、Spark 和 Databricks 工作区。该产品背后的理念是提供处理数据的单独空间,不受托管环境和 Hadoop 集群管理的影响,整个过程在云中完成。该产品有几个核心概念:由 Notebooks 提供一种与数据交互并构建图形的方法,当用户了解了显示数据的方式时,就可以开始构建主控面板以监视某些类型的数据。最后,用户可以通过该平台的任务启动器来规划 Apache Spark 的运行时间。

说白了就是Databricks捞钱的,老是开源spark 也不收你钱,大家也要吃饭不是,干脆搞个 spark on cloud,服务懒人或小公司,你既不用搭建集群也不用维护,交点儿钱直接用他们提供的在线集群。当然还有一个作用,推广普及spark ,所以也就有了Community版,即免费版

Databricks相当于给你了一个在线spark 集群,即:Spark online(听着怎么这么像网游 (⊙﹏⊙)b),我等尚处spark初级阶段的小白们刚好可以用他们提供的免费版来学习,省去了搭建和维护配置的过程,用来学习或温习Spark API真是完美!
(笔者比较懒,下面Databricks Spark Cloud都用DSC代替😂)
话不多说,开搞!!!

注册Databricks

官网直达


Do you want to TRY DATACRICKS FREE?
Yeah, click here!

下面就是注册页面,不再啰嗦。注意的是左下角要进行人际身份验证,网络不好的童鞋请自备云梯😎。然后验证邮箱,点击链接到登录界面:

💡If you don't want to pay for money, pelese click here!

搭建云上Spark集群环境

入门指南

这货长这样~界面清爽颜值高,功能齐全效率高。

基本使用流程:

  1. 创建集群

没办法,笔者已经有一个集群在运行了,作为免费用户只能拥有一个活动集群,或者升级高级用户😎

2.创建nootebook
选择集群,选择语言,新建项目,凯撸~

创建笔记、加载依赖资源、创建文件夹

3.创建Table
上传本地数据,速度有点慢,耐心等待一会~😅

任务流程可视化、数据可视化


自动生成任务阶段流程,生成DAG。


丰富的画图工具,只需点点点即可完成高颜值图表。

其他操作:

下面是重点!!
下面是重点!!
下面是重点!!


这里提供了丰富的适合不同场景的训练数据、源代码及简介。
只需找到

即可快速导入到工作台。只可惜自己英文太烂,啃的很慢😂😂😂

DSC不仅提供了方便高可用的云集群服务,而且提供了丰富的学习资料,对像我等来说简直是完美的产品。感谢各位大佬给我们提供了如此便捷的学习环境和资源,Life is short,只争朝夕!
油管视频自备云梯