利用oozie,执行sqoop action将DB2中的数据导入到hive分区表中

测试:利用oozie,执行sqoop action将DB2中的数据导入到hive分区表中。

 

需要注意的地方:

1,要添加hive.metastore.uris这个参数。否则无法将数据加载到hive表中。并且,如果一个xml文本中有多个这种操作的话,每个action中都需要配置这个参数。

2,要注意XML中的转义字符问题。这里我的sql中,就有一个小于号需要重写,否则执行后会说sql语句不对。

3,因为是分区表,按照每日分区,所以要从系统获取系统时间。这里没找到其他的可执行的方法,就比较麻烦的写成了这个样子:${replaceAll(timestamp(),"T.{0,}","")}

4,还要注意xmlns的版本问题。这个时候,多试几个就好了。


workflow.xml

<?xml version="1.0" encoding="gb2312"?>

<workflow-app name="workID1" xmlns="uri:oozie:workflow:0.5">

    <start to="step0101"/>

    <action name="step0101">

        <sqoop xmlns="uri:oozie:sqoop-action:0.4">

        <configuration>

        <property>

        <name>hive.metastore.uris</name>

        <value>thrift://192.168.20.39:9083</value>

        </property>

        </configuration>

            <arg>import</arg>

            <arg>–connect</arg>

            <arg>jdbc:db2://192.168.20.236:50001/sample</arg>

            <arg>–username</arg>

            <arg>db2inst1</arg>

            <arg>–password</arg>

            <arg>zheshimima</arg>

            <arg>–query</arg>

            <arg>select projno,projname,prstdate from project where prstdate &lt; date(current date)-1 day and $CONDITIONS</arg>

            <arg>–fields-terminated-by</arg>

            <arg>"/t"</arg>

            <arg>–hive-import</arg>

            <arg>–target-dir</arg>

            <arg>/qpf/target-dir/</arg>

            <arg>–hive-table</arg>

            <arg>ceshiku.tb_db2test</arg>

            <arg>–null-string</arg>

            <arg>"//N"</arg>

            <arg>–null-non-string</arg>

            <arg>"//N"</arg>

            <arg>–hive-partition-key</arg>

            <arg>shijian</arg>

            <arg>–hive-partition-value</arg>

            <arg>"${replaceAll(timestamp(),"T.{0,}","")}"</arg>

            <arg>-m</arg>

            <arg>1</arg>    

        </sqoop>

        <ok to="end"/>

        <error to="Kill0101" />

    </action>

    <kill name="Kill0101">

        <message>Action failed,step01 error message[${wf:errorMessage(wf:lastErrorNode())}]</message>

    </kill> 

    <end name="end"/>

</workflow-app>

原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/194881.html

(0)
上一篇 2021年11月16日
下一篇 2021年11月16日

相关推荐

发表回复

登录后才能评论