linkis 在上层应用和底层引擎之间构建了一层计算中间件。通过使用linkis 提供的rest/websocket/jdbc 等标准接口,上层应用可以方便地连接访问spark, presto, flink 等底层引擎,同时实现跨引擎上下文共享、统一的计算任务和引擎治理与编排能力。
mysql/spark/hive/presto/flink 等底层引擎,同时实现变量、脚本、函数和资源文件等用户资源的跨上层应用互通。作为计算中间件,linkis 提供了强大的连通、复用、编排、扩展和治理管控能力。通过计算中间件将应用层和引擎层解耦,简化了复杂的网络调用关系,降低了整体复杂度,同时节约了整体开发和维护成本。
没有linkis之前
上层应用以紧耦合方式直连底层引擎,使得数据平台变成复杂的网状结构
有linkis之后
通过计算中间件将应用层和引擎层解耦,以标准化可复用方式简化复杂的网状调用关系,降低数据平台复杂度
linkis 在上层应用和底层引擎之间构建了一层计算中间件。通过使用linkis 提供的rest/websocket/jdbc 等标准接口,上层应用可以方便地连接访问spark, presto, 我的乐园作文flink 等底层引擎。
引擎
引擎版本
linkis 0.x 版本要求
linkis 1.x 版本要求
说明
flink
1.12.2
>=dev-0.12.0, pr #703 尚未合并
>=1.0.2
flink engineconn。支持flinksql 代码,也支持以flink jar 形式启动一个新的yarn 应用程序。
impala
>=3.2.0, cdh >=6.3.0″
>=dev-0.12.0, pr #703 尚未合并
ongoing
impala engineconn. 支持impala sql 代码.
presto
>= 0.180
>=0.11.0
ongoing
presto engineconn. 支持presto sql 代码.
elasticarch
>=6.0
>=0.11.0
ongoing
elasticarch engineconn. 支持sql 和dsl 代码.
shell
bash >=2.0
>=0.9.3
>=1.0.0_rc1
shell engineconn. 支持bash shell 代码.
mlsql
>=1.1.0
>=0.9.1
ongoing
mlsql engineconn. 支持mlsql 代码.
jdbc
mysql >=5.0, hive >=1.2.1
>=0.9.0
>=1.0.0_rc1
jdbc engineconn. 已支持mysql 和hiveql,可快速扩展支持其他有jdb电影剧本c driver 包的引擎, 如oracle.
spark
apache 2.0.0~2.4.7, cdh >=5.4.0
>=0.5.0
>=1.0.0梦见牙掉了_rc1
spark engineconn. 支持sql, scala, pyspark 和r 代码.
hive
apache >=1.0.0, cdh >=5.4.0
>=0.5.0
>=1.0.0_rc1
hive engineconn. 支持hiveql 代码.
hadoop
apache >=2.6.0, cdh >=5.4.0
>=0.5.0
ongoing
hadoop engineconn. 支持hadoop mr/yarn application.
python
>=2.6
>=0.5.0
>=1.0.0_rc1
python engineconn. 支持python 代码.
tispark
1.1
>=0.5.0
ongoing
tispark engineconn. 支持用sparksql 查询tidb.
因为mysql-connector-java驱动是gpl2.0协议,不满足apache开源协议关于licen的政策,因此从1.0.3版本开始,提供的apache版本官方部署包,默认是没有mysql-connector-java-x.x.x.jar的依赖包,安装部署时需要添加依赖到对应的lib包中。
linkis1.0.3 默认已适配的引擎列表如下:
引擎类型
适配情况
官方安装包是否包含
python
1.0已适配
包含
shell
1.0已适配
包含
hive
1.0已适配
包含
spark
1.0已适配
包含
引擎类型
依赖环境
特殊说明
python
python环境
日志和结果集如果配置hdfs://则依赖hdfs环境
jdbc
可以无依赖
日志和结果集路径如果配置hdfs://则依赖hdfs环境
shell
可以无依赖
日志和结果集路径如果配置hdfs://则依赖hdfs环境
hive
依赖hadoop和hive环境
spark
依赖hadoop/hive/spark
要求:安装linkis需要至少3g内存。
默认每个微服务jvm堆内存为512m,可以通过修改rver_heap_size
来统一调整每个微服务的堆内存,如果您的服务器资源较少,我们建议修改该参数为128m。如下:
vim ${linkis_home}/deploy-config/linkis-env.sh# java application default jvm memory.export rver_heap_size="128m"
官网示例:
#jdkexport java_home=/nemo/jdk1.8.0_141##如果不使用hive、spark等引擎且不依赖hadoop,则不需要修改以下环境变量#hadoop export hadoop_home=/appcom/install/hadoopexport hadoop_conf_dir=/appcom/c注册公司的流程onfig/hadoop-config#hiveexport hive_home=/appcom/install/hiveexport hive_conf_dir=/appcom/config/hive-config#sparkexport spark_home=/appcom/install/sparkexport spark_conf_dir=/appcom/config/spark-config/export pyspark_allow_incure_gateway=1 # pyspark必须加的参数
示例:
https://linkis.apache.org/zh-cn/download/main
vi deploy-config/linkis-env.sh#ssh_port=22 #指定ssh端口,如果单机版本安装可以不配置deployur=hadoop #指定部署用户linkis_install_home=/appcom/install/linkis # 指定安装目录workspace_ur_root_path=file:///tmp/hadoop # 指定用户根目录,一般用于存储用户的脚本文件和日志文件等,是用户的工作空间。result_t_root_path=file:///tmp/linkis # 结果集文件路径,用于存储job的结果集文件engineconn_root_path=/appcom/tmp #存放ecp的安装路径,需要部署用户有写权限的本地目录entrance_config_log_path=file:///tmp/linkis/ #entrance的日志路径## ldap配置,默认linkis只支持部署用户登录,如果需要支持多用户登录可以使用ldap,需要配置以下参数:#ldap_url=ldap://localhost:1389/ #ldap_badn=dc=webank,dc=com
vi deploy-config/db.sh
执行安装脚本:sh bin/install.sh
install.sh脚本会询问您是否需要初始化数据库并导入元数据。
因为担心用户重复执行install.sh脚本,把数据库中的用户数据清空,所以在install.sh执行时,会询问用户是否需要初始化数据库并导入元数据。
启动服务
sh sbin/linkis-start-all.sh
查看是否启动成功
可以在eureka界面查看服务启动成功情况,查看方法:
使用http://${eureka_install_ip}:${eureka_port}
, 在浏览器中打开,查看服务是否注册成功。
如果您没有在config.sh指定eureka_install_ip和eureka_install_ip,则http地址为:http://127.0.0.1:2030中国最高的盆地3
默认会启动8个linkis微服务,其中图下linkis-cg-engineconn服务为运行任务才会启动
1、telnet
<-----start to check ud cmd---->check command fail need 'telnet' (your linux command not found)failed to + check env
解决:sudo yum -y install telnet
2、connection exception
mkdir: call from hadoop01/192.168.88.111 to hadoop01:9820 failed on connection exception: java.net.connectexception: 拒绝连接; for more details e: http://wiki.apache.org/hadoop/connectionrefudfailed to + create hdfs:///tmp/linkis directory
解决:启动hdfs
到此这篇关于apachelinkis中间件架构及快速安装的文章就介绍到这了,更多相关apachelinkis中间件内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!
本文发布于:2023-04-06 05:31:49,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/29de783c6582f2d119bee6bb7c79892a.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:Apache Linkis 中间件架构及快速安装步骤.doc
本文 PDF 下载地址:Apache Linkis 中间件架构及快速安装步骤.pdf
留言与评论(共有 0 条评论) |