• 阅读: 1088 回复: 0
    学习委员

    执行代理究竟是个啥?

    楼主 发表于 2019-09-20 15:50:28

    很多用户在注册数栖云平台之后,都会被一个略带魔幻的词“执行代理搞到崩溃。到底什么是执行代理?我为什么要在这里下载一个服务包?难道不是直接就能启用服务了吗?

    不要着急,让我们一点一点解开这个谜题。但在解开谜题之前,您也可以先尝试着下载这个系统提示的安装包~毕竟听我讲完这个概念,你就会发现,想要使用我们的产品数栖云,执行代理服务安装包真的必不可少!

     

    在讲清楚执行代理究竟是什么之前,在这里也需要先跟大家大致讲解一下,为什么在我们的产品中会提到执行代理服务这个概念。

    首先,我们需要再次强调,数栖云平台实际采⽤的是混合云技术架构,主要分为三个模块:

    1. 数栖云控制端

    目前部署在云上(即:https://shuqi.dtwave.com),主要用于项目,资源组,计算引擎和数据源等的配置,开发任务的代码编写等。 
简单来说,就是大家使用的数栖云产品界面端。

    2. 客户集群

    如果想要启用数栖云的服务,每个客户都必须要有⾃己的Hadoop集群(参见帖子:数栖云使用前置条件说明),并且,集群都需要部署在自有环境内,⽐如IDC机房、私有服务器、各种云服务。例如华为云的MRS、在阿里云服务器上部署的CDH集群、腾讯云的EMR服务等。 


    3. 执行代理 


    执⾏代理作为前两者数栖云控制端和客户集群的桥梁,可以把两者有效串联起来。通过执⾏代理,在数栖平台上书写的Hive、SparkSQL等作业可以提交到客户集群上执⾏,及查询结果、日志、 状态等。

    对于执行代理的讲解,为了方便大家理解,我们举个查数据的栗子来做介绍:

    食客在饱了么外卖平台上注册账号之后,进行点外卖操作:选好商家,点好外卖,并配置好送货地址。之后饱了么平台就会分配骑手去商家取餐并送到食客手中。

    这个过程中,食客=用户饱了么外卖平台=数栖平台骑手=执行代理外卖=数据,食客下单的过程就是用户在数栖云上执行任务的过程:下发任务到骑手(执行代理),骑手(执行代理)根据任务信息到商家店里(集群上)取餐(取数据),然后送给食客品尝(查看数据)

    也就是说,如果在这个环节中没有部署好执行代理服务,在平台上的指令是无法直接传达给服务器集群的,这也是为什么很多用户注册完成后未经过部署,以为已经完成了全部的前期工作,就直接进行数据开发及跑任务的工作,会遇到根本跑不通的问题。

    补充一点,执行代理的网络需求:

    1.执行代理需要可以访问外网(数栖云控制端)

    2.需要开通执行代理的两个服务端口(可自行配置,默认8444,8443)给我们平台控制端访问,即把数栖云控制端的IP加入到您的白名单中,具体IP请联系客服(微信号:shulan_shouhou

    好啦,以上就是我们对于执行代理的一个解释啦!不知道您有没有理解它的重要性呢?如果您看完这篇帖子,还没下载执行代理服务包的话,记得回到数栖云产品中,点击用户名下面的用户中心,查看我的订单,点击订单详情,在详情页的底部一键下载执行代理服务包。

    另外,这里还有一些关于执行代理部署的小 Tips,在你下载好服务包之后一定会用到,点击下方链接直达:

    好啦~今天的解释大概就这么多啦!下次见!

  • dipper256934
    沙发 发表于 2019-10-23 13:38:38

    Re 执行代理究竟是个啥?

    执行代理、客户端、计算引擎是什么关系? 客户端是大数据集群上最终运行任务的节点?
  • 洋洋得意
    板凳 发表于 2019-10-29 17:58:35

    Re 执行代理究竟是个啥?

    回复楼上:执行代理相当于是数栖平台的agent,客户端是集群的agent,计算引擎可以理解为就是hadoop集群(因为目前saas好像只支持hadoop集群) 客户端就是集群的组件,将一套完整的集群组件全部拷贝到部署执行代理的服务器上(并且配置好环境变量和hosts等),然后执行代理接收数栖平台下发的任务,如果是shell或者python等类型的任务,则直接在执行代理机器上执行,如果是spark任务或者hive等类型的任务,则会通过调用集群的客户端去将任务提交到集群上执行。
  • 洋洋得意
    发表于 2019-10-29 17:58:36

    Re 执行代理究竟是个啥?

    该回复已被删除

  • dipper372642
    发表于 2020-03-26 11:47:12

    Re 执行代理究竟是个啥?

    是个传输数据的作用?


热门文章

数栖云部署及资源配置超详细指南

数栖平台使用前置条件说明

数栖云中的各个作业类型,到底有什么不同?

数栖云套餐选择攻略

最新文章

澜图使用教程摘要:01.工具界面各部分介绍

数据中台产品|数栖平台数据资产开发套件 :实时开发

数据可视化工具|02 澜图产品价值

鲍志方:手把手教你制作炫酷可视化地图

  • 未登录

    回复楼主

    登录后可回复
    /1000