Oozie PySpark SQL action gives NoSuchMethodError:org.apache.curator.utils.ZKPaths.fixForNamespace

I have a very simple oozie workflow job running just one pyspark action of
SHOW DATABASES;
on a just installed Cloudera Quickstart VM.

and it gives the below error:

    Traceback (most recent call last):

  File "test_pyspark.py", line 13, in <module>

    main()

  File "test_pyspark.py", line 9, in main

    results=sqlContext.sql("SHOW DATABASES").collect()

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/context.py", line 580, in sql

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/java_gateway.py", line 813, in __call__

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/utils.py", line 45, in deco

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/protocol.py", line 308, in get_return_value

py4j.protocol.Py4JJavaError: An error occurred while calling o42.sql.

: java.lang.NoSuchMethodError: org.apache.curator.utils.ZKPaths.fixForNamespace(Ljava/lang/String;Ljava/lang/String;Z)Ljava/lang/String;

    at org.apache.curator.framework.imps.NamespaceImpl.fixForNamespace(NamespaceImpl.java:82)

    at org.apache.curator.framework.imps.CuratorFrameworkImpl.fixForNamespace(CuratorFrameworkImpl.java:579)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:434)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:44)

    at org.apache.hadoop.hive.ql.lockmgr.zookeeper.ZooKeeperHiveLockManager.setContext(ZooKeeperHiveLockManager.java:85)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.getLockManager(DummyTxnManager.java:72)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.acquireLocks(DummyTxnManager.java:101)

    at org.apache.hadoop.hive.ql.Driver.acquireLocksAndOpenTxn(Driver.java:994)

    at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1185)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1059)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1049)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:495)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$withHiveState$1.apply(ClientWrapper.scala:290)

    at org.apache.spark.sql.hive.client.ClientWrapper.liftedTree1$1(ClientWrapper.scala:237)

    at org.apache.spark.sql.hive.client.ClientWrapper.retryLocked(ClientWrapper.scala:236)

    at org.apache.spark.sql.hive.client.ClientWrapper.withHiveState(ClientWrapper.scala:279)

    at org.apache.spark.sql.hive.client.ClientWrapper.runHive(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper.runSqlHive(ClientWrapper.scala:474)

    at org.apache.spark.sql.hive.HiveContext.runSqlHive(HiveContext.scala:624)

    at org.apache.spark.sql.hive.execution.HiveNativeCommand.run(HiveNativeCommand.scala:33)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult$lzycompute(commands.scala:58)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult(commands.scala:56)

    at org.apache.spark.sql.execution.ExecutedCommand.doExecute(commands.scala:70)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:132)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:130)

    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:150)

    at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:130)

    at org.apache.spark.sql.execution.QueryExecution.toRdd$lzycompute(QueryExecution.scala:55)

    at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:55)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:145)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:130)

    at org.apache.spark.sql.DataFrame$.apply(DataFrame.scala:52)

    at org.apache.spark.sql.SQLContext.sql(SQLContext.scala:817)

    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)

    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

    at java.lang.reflect.Method.invoke(Method.java:606)

    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:231)

    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:381)

    at py4j.Gateway.invoke(Gateway.java:259)

    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:133)

    at py4j.commands.CallCommand.execute(CallCommand.java:79)

    at py4j.GatewayConnection.run(GatewayConnection.java:209)

    at java.lang.Thread.run(Thread.java:745)

I have checked in oozie share lib the curator jar (2.7.1) is in the spark shared lib folder.

hadoop fs -ls /user/oozie/share/lib/lib_20171023091808/spark/

-rw-r--r--   1 hdfs  supergroup      69500 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-client-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     186273 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-framework-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     270342 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-recipes-2.7.1.jar

Is there anything else that I am missing?

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

add a comment |

I have a very simple oozie workflow job running just one pyspark action of
SHOW DATABASES;
on a just installed Cloudera Quickstart VM.

and it gives the below error:

    Traceback (most recent call last):

  File "test_pyspark.py", line 13, in <module>

    main()

  File "test_pyspark.py", line 9, in main

    results=sqlContext.sql("SHOW DATABASES").collect()

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/context.py", line 580, in sql

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/java_gateway.py", line 813, in __call__

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/utils.py", line 45, in deco

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/protocol.py", line 308, in get_return_value

py4j.protocol.Py4JJavaError: An error occurred while calling o42.sql.

: java.lang.NoSuchMethodError: org.apache.curator.utils.ZKPaths.fixForNamespace(Ljava/lang/String;Ljava/lang/String;Z)Ljava/lang/String;

    at org.apache.curator.framework.imps.NamespaceImpl.fixForNamespace(NamespaceImpl.java:82)

    at org.apache.curator.framework.imps.CuratorFrameworkImpl.fixForNamespace(CuratorFrameworkImpl.java:579)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:434)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:44)

    at org.apache.hadoop.hive.ql.lockmgr.zookeeper.ZooKeeperHiveLockManager.setContext(ZooKeeperHiveLockManager.java:85)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.getLockManager(DummyTxnManager.java:72)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.acquireLocks(DummyTxnManager.java:101)

    at org.apache.hadoop.hive.ql.Driver.acquireLocksAndOpenTxn(Driver.java:994)

    at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1185)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1059)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1049)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:495)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$withHiveState$1.apply(ClientWrapper.scala:290)

    at org.apache.spark.sql.hive.client.ClientWrapper.liftedTree1$1(ClientWrapper.scala:237)

    at org.apache.spark.sql.hive.client.ClientWrapper.retryLocked(ClientWrapper.scala:236)

    at org.apache.spark.sql.hive.client.ClientWrapper.withHiveState(ClientWrapper.scala:279)

    at org.apache.spark.sql.hive.client.ClientWrapper.runHive(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper.runSqlHive(ClientWrapper.scala:474)

    at org.apache.spark.sql.hive.HiveContext.runSqlHive(HiveContext.scala:624)

    at org.apache.spark.sql.hive.execution.HiveNativeCommand.run(HiveNativeCommand.scala:33)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult$lzycompute(commands.scala:58)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult(commands.scala:56)

    at org.apache.spark.sql.execution.ExecutedCommand.doExecute(commands.scala:70)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:132)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:130)

    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:150)

    at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:130)

    at org.apache.spark.sql.execution.QueryExecution.toRdd$lzycompute(QueryExecution.scala:55)

    at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:55)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:145)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:130)

    at org.apache.spark.sql.DataFrame$.apply(DataFrame.scala:52)

    at org.apache.spark.sql.SQLContext.sql(SQLContext.scala:817)

    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)

    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

    at java.lang.reflect.Method.invoke(Method.java:606)

    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:231)

    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:381)

    at py4j.Gateway.invoke(Gateway.java:259)

    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:133)

    at py4j.commands.CallCommand.execute(CallCommand.java:79)

    at py4j.GatewayConnection.run(GatewayConnection.java:209)

    at java.lang.Thread.run(Thread.java:745)

I have checked in oozie share lib the curator jar (2.7.1) is in the spark shared lib folder.

hadoop fs -ls /user/oozie/share/lib/lib_20171023091808/spark/

-rw-r--r--   1 hdfs  supergroup      69500 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-client-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     186273 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-framework-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     270342 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-recipes-2.7.1.jar

Is there anything else that I am missing?

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

add a comment |

I have a very simple oozie workflow job running just one pyspark action of
SHOW DATABASES;
on a just installed Cloudera Quickstart VM.

and it gives the below error:

    Traceback (most recent call last):

  File "test_pyspark.py", line 13, in <module>

    main()

  File "test_pyspark.py", line 9, in main

    results=sqlContext.sql("SHOW DATABASES").collect()

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/context.py", line 580, in sql

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/java_gateway.py", line 813, in __call__

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/utils.py", line 45, in deco

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/protocol.py", line 308, in get_return_value

py4j.protocol.Py4JJavaError: An error occurred while calling o42.sql.

: java.lang.NoSuchMethodError: org.apache.curator.utils.ZKPaths.fixForNamespace(Ljava/lang/String;Ljava/lang/String;Z)Ljava/lang/String;

    at org.apache.curator.framework.imps.NamespaceImpl.fixForNamespace(NamespaceImpl.java:82)

    at org.apache.curator.framework.imps.CuratorFrameworkImpl.fixForNamespace(CuratorFrameworkImpl.java:579)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:434)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:44)

    at org.apache.hadoop.hive.ql.lockmgr.zookeeper.ZooKeeperHiveLockManager.setContext(ZooKeeperHiveLockManager.java:85)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.getLockManager(DummyTxnManager.java:72)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.acquireLocks(DummyTxnManager.java:101)

    at org.apache.hadoop.hive.ql.Driver.acquireLocksAndOpenTxn(Driver.java:994)

    at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1185)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1059)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1049)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:495)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$withHiveState$1.apply(ClientWrapper.scala:290)

    at org.apache.spark.sql.hive.client.ClientWrapper.liftedTree1$1(ClientWrapper.scala:237)

    at org.apache.spark.sql.hive.client.ClientWrapper.retryLocked(ClientWrapper.scala:236)

    at org.apache.spark.sql.hive.client.ClientWrapper.withHiveState(ClientWrapper.scala:279)

    at org.apache.spark.sql.hive.client.ClientWrapper.runHive(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper.runSqlHive(ClientWrapper.scala:474)

    at org.apache.spark.sql.hive.HiveContext.runSqlHive(HiveContext.scala:624)

    at org.apache.spark.sql.hive.execution.HiveNativeCommand.run(HiveNativeCommand.scala:33)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult$lzycompute(commands.scala:58)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult(commands.scala:56)

    at org.apache.spark.sql.execution.ExecutedCommand.doExecute(commands.scala:70)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:132)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:130)

    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:150)

    at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:130)

    at org.apache.spark.sql.execution.QueryExecution.toRdd$lzycompute(QueryExecution.scala:55)

    at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:55)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:145)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:130)

    at org.apache.spark.sql.DataFrame$.apply(DataFrame.scala:52)

    at org.apache.spark.sql.SQLContext.sql(SQLContext.scala:817)

    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)

    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

    at java.lang.reflect.Method.invoke(Method.java:606)

    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:231)

    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:381)

    at py4j.Gateway.invoke(Gateway.java:259)

    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:133)

    at py4j.commands.CallCommand.execute(CallCommand.java:79)

    at py4j.GatewayConnection.run(GatewayConnection.java:209)

    at java.lang.Thread.run(Thread.java:745)

I have checked in oozie share lib the curator jar (2.7.1) is in the spark shared lib folder.

hadoop fs -ls /user/oozie/share/lib/lib_20171023091808/spark/

-rw-r--r--   1 hdfs  supergroup      69500 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-client-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     186273 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-framework-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     270342 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-recipes-2.7.1.jar

Is there anything else that I am missing?

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

I have a very simple oozie workflow job running just one pyspark action of
SHOW DATABASES;
on a just installed Cloudera Quickstart VM.

and it gives the below error:

    Traceback (most recent call last):

  File "test_pyspark.py", line 13, in <module>

    main()

  File "test_pyspark.py", line 9, in main

    results=sqlContext.sql("SHOW DATABASES").collect()

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/context.py", line 580, in sql

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/java_gateway.py", line 813, in __call__

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/pyspark.zip/pyspark/sql/utils.py", line 45, in deco

  File "/yarn/nm/usercache/cloudera/appcache/application_1542753977327_0023/container_1542753977327_0023_01_000001/py4j-0.9-src.zip/py4j/protocol.py", line 308, in get_return_value

py4j.protocol.Py4JJavaError: An error occurred while calling o42.sql.

: java.lang.NoSuchMethodError: org.apache.curator.utils.ZKPaths.fixForNamespace(Ljava/lang/String;Ljava/lang/String;Z)Ljava/lang/String;

    at org.apache.curator.framework.imps.NamespaceImpl.fixForNamespace(NamespaceImpl.java:82)

    at org.apache.curator.framework.imps.CuratorFrameworkImpl.fixForNamespace(CuratorFrameworkImpl.java:579)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:434)

    at org.apache.curator.framework.imps.CreateBuilderImpl.forPath(CreateBuilderImpl.java:44)

    at org.apache.hadoop.hive.ql.lockmgr.zookeeper.ZooKeeperHiveLockManager.setContext(ZooKeeperHiveLockManager.java:85)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.getLockManager(DummyTxnManager.java:72)

    at org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager.acquireLocks(DummyTxnManager.java:101)

    at org.apache.hadoop.hive.ql.Driver.acquireLocksAndOpenTxn(Driver.java:994)

    at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1185)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1059)

    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1049)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:495)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$runHive$1.apply(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$withHiveState$1.apply(ClientWrapper.scala:290)

    at org.apache.spark.sql.hive.client.ClientWrapper.liftedTree1$1(ClientWrapper.scala:237)

    at org.apache.spark.sql.hive.client.ClientWrapper.retryLocked(ClientWrapper.scala:236)

    at org.apache.spark.sql.hive.client.ClientWrapper.withHiveState(ClientWrapper.scala:279)

    at org.apache.spark.sql.hive.client.ClientWrapper.runHive(ClientWrapper.scala:484)

    at org.apache.spark.sql.hive.client.ClientWrapper.runSqlHive(ClientWrapper.scala:474)

    at org.apache.spark.sql.hive.HiveContext.runSqlHive(HiveContext.scala:624)

    at org.apache.spark.sql.hive.execution.HiveNativeCommand.run(HiveNativeCommand.scala:33)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult$lzycompute(commands.scala:58)

    at org.apache.spark.sql.execution.ExecutedCommand.sideEffectResult(commands.scala:56)

    at org.apache.spark.sql.execution.ExecutedCommand.doExecute(commands.scala:70)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:132)

    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$5.apply(SparkPlan.scala:130)

    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:150)

    at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:130)

    at org.apache.spark.sql.execution.QueryExecution.toRdd$lzycompute(QueryExecution.scala:55)

    at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:55)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:145)

    at org.apache.spark.sql.DataFrame.<init>(DataFrame.scala:130)

    at org.apache.spark.sql.DataFrame$.apply(DataFrame.scala:52)

    at org.apache.spark.sql.SQLContext.sql(SQLContext.scala:817)

    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)

    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

    at java.lang.reflect.Method.invoke(Method.java:606)

    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:231)

    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:381)

    at py4j.Gateway.invoke(Gateway.java:259)

    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:133)

    at py4j.commands.CallCommand.execute(CallCommand.java:79)

    at py4j.GatewayConnection.run(GatewayConnection.java:209)

    at java.lang.Thread.run(Thread.java:745)

I have checked in oozie share lib the curator jar (2.7.1) is in the spark shared lib folder.

hadoop fs -ls /user/oozie/share/lib/lib_20171023091808/spark/

-rw-r--r--   1 hdfs  supergroup      69500 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-client-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     186273 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-framework-2.7.1.jar

-rw-r--r--   1 hdfs  supergroup     270342 2018-11-20 16:42 /user/oozie/share/lib/lib_20171023091808/spark/curator-recipes-2.7.1.jar

Is there anything else that I am missing?

pyspark apache-spark-sql oozie

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

asked Nov 21 '18 at 1:31

WEIHANG LIU

383

add a comment |

0

active

oldest

votes

Your Answer

StackExchange.ifUsing("editor", function () {
StackExchange.using("externalEditor", function () {
StackExchange.using("snippets", function () {
StackExchange.snippets.init();
});
});
}, "code-snippets");

StackExchange.ready(function() {
var channelOptions = {
tags: "".split(" "),
id: "1"
};
initTagRenderer("".split(" "), "".split(" "), channelOptions);

StackExchange.using("externalEditor", function() {
// Have to fire editor after snippets, if snippets enabled
if (StackExchange.settings.snippets.snippetsEnabled) {
StackExchange.using("snippets", function() {
createEditor();
});
}
else {
createEditor();
}
});

function createEditor() {
StackExchange.prepareEditor({
heartbeatType: 'answer',
autoActivateHeartbeat: false,
convertImagesToLinks: true,
noModals: true,
showLowRepImageUploadWarning: true,
reputationToPostImages: 10,
bindNavPrevention: true,
postfix: "",
imageUploader: {
brandingHtml: "Powered by u003ca class="icon-imgur-white" href="https://imgur.com/"u003eu003c/au003e",
contentPolicyHtml: "User contributions licensed under u003ca href="https://creativecommons.org/licenses/by-sa/3.0/"u003ecc by-sa 3.0 with attribution requiredu003c/au003e u003ca href="https://stackoverflow.com/legal/content-policy"u003e(content policy)u003c/au003e",
allowUrls: true
},
onDemand: true,
discardSelector: ".discard-answer"
,immediatelyShowMarkdownHelp:true
});

}
});

draft saved

draft discarded

Sign up or log in

StackExchange.ready(function () {
StackExchange.helpers.onClickDraftSave('#login-link');
});

Post as a guest

Name

Required, but never shown

StackExchange.ready(
function () {
StackExchange.openid.initPostLogin('.new-post-login', 'https%3a%2f%2fstackoverflow.com%2fquestions%2f53404084%2foozie-pyspark-sql-action-gives-nosuchmethoderrororg-apache-curator-utils-zkpath%23new-answer', 'question_page');
}
);

Post as a guest

Name

Required, but never shown

0

active

oldest

votes

0

active

oldest

votes

draft saved

draft discarded

Thanks for contributing an answer to Stack Overflow!

Please be sure to answer the question. Provide details and share your research!

But avoid …

Asking for help, clarification, or responding to other answers.

Making statements based on opinion; back them up with references or personal experience.

To learn more, see our tips on writing great answers.

draft saved

draft discarded

Sign up or log in

StackExchange.ready(function () {
StackExchange.helpers.onClickDraftSave('#login-link');
});

Post as a guest

Name

Required, but never shown

Post as a guest

Name

Required, but never shown

Sign up or log in

StackExchange.ready(function () {
StackExchange.helpers.onClickDraftSave('#login-link');
});

Post as a guest

Name

Required, but never shown

Sign up or log in

StackExchange.ready(function () {
StackExchange.helpers.onClickDraftSave('#login-link');
});

Post as a guest

Name

Required, but never shown

Sign up or log in

StackExchange.ready(function () {
StackExchange.helpers.onClickDraftSave('#login-link');
});

Post as a guest

Name

Required, but never shown

Name

Required, but never shown

Name

Required, but never shown

This page is only for reference, If you need detailed information, please check here

Search This Blog

Ufyukyu