execution

Type Members

class CartesianProduct[T >: Null] extends AnyRef
abstract class CommonJoinOperator[T <: JoinDesc] extends NaryOperator[T] with JoinFilter[T]
class ExplainTaskHelper extends AnyRef
class ExtractOperator extends UnaryOperator[ExtractDesc] with ReduceSinkTableDesc
class FileSinkOperator extends TerminalOperator with Serializable
class FilterOperator extends UnaryOperator[FilterDesc]
class ForwardOperator extends UnaryOperator[ForwardDesc]
class HadoopTableReader extends TableReader

Helper class for scanning tables stored in Hadoop - e.
class HeapTableReader extends TableReader

Helper class for scanning tables stored in Spark's block manager
type HiveDesc = OperatorDesc
trait JoinFilter[T <: JoinDesc] extends AnyRef
class JoinOperator extends CommonJoinOperator[JoinDesc] with ReduceSinkTableDesc
class LateralViewForwardOperator extends UnaryOperator[LateralViewForwardDesc]
class LateralViewJoinOperator extends NaryOperator[LateralViewJoinDesc]

LateralViewJoin is used only for LATERAL VIEW explode, which adds a new row per array element in the array to be exploded.
class LimitOperator extends UnaryOperator[LimitDesc]
class MapJoinOperator extends CommonJoinOperator[MapJoinDesc]

A join operator optimized for joining a large table with a number of small tables that fit in memory.
class MemoryStoreSinkOperator extends TerminalOperator

Cache the RDD and force evaluate it (so the cache is filled).
abstract class NaryOperator[T <: HiveDesc] extends Operator[T]

A base operator class that has many parents and one child.
class OffHeapTableReader extends TableReader

Helper class for scanning tables stored off-heap.
abstract class Operator[+T <: HiveDesc] extends LogHelper with Serializable
sealed trait ReduceKey extends Comparable[ReduceKey]

A data structure used for shuffling data that supports comparison.
class ReduceKeyMapSide extends ReduceKey with Externalizable
class ReduceKeyPartitioner extends HashPartitioner

A special Spark partitioner that allows hash partitioning of data based on the partitionCode field in ReduceKey.
class ReduceKeyReduceSide extends ReduceKey with Serializable
class ReduceSinkOperator extends UnaryOperator[ReduceSinkDesc]

Converts a collection of rows into key, value pairs.
trait ReduceSinkTableDesc extends LogHelper
class ScriptOperator extends UnaryOperator[ScriptDesc]

An operator that runs an external script.
class SelectOperator extends UnaryOperator[SelectDesc]

An operator that does projection, i.
class SharkExplainTask extends Task[SharkExplainWork] with Serializable with LogHelper

SharkExplainTask executes EXPLAIN for RDD operators.
class SharkExplainWork extends ExplainWork
class SparkWork extends Serializable
class TableRddSinkOperator extends TerminalOperator

Collect the output as a TableRDD.
trait TableReader extends LogHelper

A trait for subclasses that handle table scans.
class TableScanOperator extends TopOperator[TableScanDesc]

The TableScanOperator is used for scanning any type of Shark or Hive table.
class TerminalOperator extends UnaryOperator[FileSinkDesc]

File sink operator.
abstract class TopOperator[T <: HiveDesc] extends UnaryOperator[T]
class UDTFCollector extends Collector
class UDTFOperator extends UnaryOperator[UDTFDesc]
abstract class UnaryOperator[T <: HiveDesc] extends Operator[T]

A base operator class that has at most one parent.
class UnionOperator extends NaryOperator[UnionDesc]

A union operator.

Value Members

object CommonJoinOperator extends Serializable
object FileSinkOperator extends Serializable
object GroupByOperator

Unlike Hive, group by in Shark is split into two different operators: GroupByPostShuffleOperator and GroupByPreShuffleOperator.
object HadoopTableReader
object JoinUtil
object KryoSerializerToString

Use Kryo to serialize udtfOp and selOp ObjectInspectors, then convert the Array[Byte] to a String, since XML serialization of Bytes (for @BeanProperty keyword) is inefficient.
object Operator extends LogHelper with Serializable
object OperatorFactory extends LogHelper

Given a Hive plan, OperatorFactory creates the corresponding Shark plan.
object RDDUtils

A set of RDD-related functions that provide some handy features in addition to Spark's built-in abstractions.
object ReduceKeyReduceSide extends Serializable
object ScriptOperator extends Serializable
object SparkLoadTask extends Serializable
object SparkLoadWork extends Serializable
object TableReader
object TableScanOperator extends LogHelper with Serializable
implicit def kryoWrapper2object[T](wrapper: KryoSerializationWrapper[T]): T
implicit def opSerWrapper2op[T <: Operator[_ <: HiveDesc]](wrapper: OperatorSerializationWrapper[T]): T
package optimization
package serialization

package execution

Type Members

class CartesianProduct[T >: Null] extends AnyRef

abstract class CommonJoinOperator[T <: JoinDesc] extends NaryOperator[T] with JoinFilter[T]

class ExplainTaskHelper extends AnyRef

class ExtractOperator extends UnaryOperator[ExtractDesc] with ReduceSinkTableDesc

class FileSinkOperator extends TerminalOperator with Serializable

class FilterOperator extends UnaryOperator[FilterDesc]

class ForwardOperator extends UnaryOperator[ForwardDesc]

class HadoopTableReader extends TableReader

class HeapTableReader extends TableReader

type HiveDesc = OperatorDesc

trait JoinFilter[T <: JoinDesc] extends AnyRef

class JoinOperator extends CommonJoinOperator[JoinDesc] with ReduceSinkTableDesc

class LateralViewForwardOperator extends UnaryOperator[LateralViewForwardDesc]

class LateralViewJoinOperator extends NaryOperator[LateralViewJoinDesc]

class LimitOperator extends UnaryOperator[LimitDesc]

class MapJoinOperator extends CommonJoinOperator[MapJoinDesc]

class MemoryStoreSinkOperator extends TerminalOperator

abstract class NaryOperator[T <: HiveDesc] extends Operator[T]

class OffHeapTableReader extends TableReader

abstract class Operator[+T <: HiveDesc] extends LogHelper with Serializable

sealed trait ReduceKey extends Comparable[ReduceKey]

class ReduceKeyMapSide extends ReduceKey with Externalizable

class ReduceKeyPartitioner extends HashPartitioner

class ReduceKeyReduceSide extends ReduceKey with Serializable

class ReduceSinkOperator extends UnaryOperator[ReduceSinkDesc]

trait ReduceSinkTableDesc extends LogHelper

class ScriptOperator extends UnaryOperator[ScriptDesc]

class SelectOperator extends UnaryOperator[SelectDesc]

class SharkExplainTask extends Task[SharkExplainWork] with Serializable with LogHelper

class SharkExplainWork extends ExplainWork

class SparkWork extends Serializable

class TableRddSinkOperator extends TerminalOperator

trait TableReader extends LogHelper

class TableScanOperator extends TopOperator[TableScanDesc]

class TerminalOperator extends UnaryOperator[FileSinkDesc]

abstract class TopOperator[T <: HiveDesc] extends UnaryOperator[T]

class UDTFCollector extends Collector

class UDTFOperator extends UnaryOperator[UDTFDesc]

abstract class UnaryOperator[T <: HiveDesc] extends Operator[T]

class UnionOperator extends NaryOperator[UnionDesc]

Value Members

object CommonJoinOperator extends Serializable

object FileSinkOperator extends Serializable

object GroupByOperator

object HadoopTableReader

object JoinUtil

object KryoSerializerToString

object Operator extends LogHelper with Serializable

object OperatorFactory extends LogHelper

object RDDUtils

object ReduceKeyReduceSide extends Serializable

object ScriptOperator extends Serializable

object SparkLoadTask extends Serializable

object SparkLoadWork extends Serializable

object TableReader

object TableScanOperator extends LogHelper with Serializable

implicit def kryoWrapper2object[T](wrapper: KryoSerializationWrapper[T]): T

implicit def opSerWrapper2op[T <: Operator[_ <: HiveDesc]](wrapper: OperatorSerializationWrapper[T]): T

package optimization

package serialization

Inherited from AnyRef

Inherited from Any

Ungrouped