spark.PipedRDD

Instance Constructors

new PipedRDD(parent: RDD[T], command: String)(implicit arg0: ClassManifest[T])
new PipedRDD(parent: RDD[T], command: Seq[String])(implicit arg0: ClassManifest[T])
new PipedRDD(parent: RDD[T], command: Seq[String], envVars: Map[String, String])(implicit arg0: ClassManifest[T])

Value Members

final def !=(arg0: AnyRef): Boolean

Definition Classes
AnyRef
final def !=(arg0: Any): Boolean

Definition Classes
Any
final def ##(): Int

Definition Classes
AnyRef → Any
def ++(other: RDD[String]): RDD[String]

Definition Classes
RDD
final def ==(arg0: AnyRef): Boolean

Definition Classes
AnyRef
final def ==(arg0: Any): Boolean

Definition Classes
Any
def aggregate[U](zeroValue: U)(seqOp: (U, String) ⇒ U, combOp: (U, U) ⇒ U)(implicit arg0: ClassManifest[U]): U

Aggregate the elements of each partition, and then the results for all the partitions, using given combine functions and a neutral "zero value".
Aggregate the elements of each partition, and then the results for all the partitions, using given combine functions and a neutral "zero value". This function can return a different result type, U, than the type of this RDD, T. Thus, we need one operation for merging a T into an U and one operation for merging two U's, as in scala.TraversableOnce. Both of these functions are allowed to modify and return their first argument instead of creating a new U to avoid memory allocation.

Definition Classes
RDD
final def asInstanceOf[T0]: T0

Definition Classes
Any
def cache(): RDD[String]

Definition Classes
RDD
def cartesian[U](other: RDD[U])(implicit arg0: ClassManifest[U]): RDD[(String, U)]

Definition Classes
RDD
def clone(): AnyRef

Attributes
protected[lang]
Definition Classes
AnyRef
Annotations
@throws()
def collect(): Array[String]

Definition Classes
RDD
def compute(split: Split): Iterator[String]

Definition Classes
PipedRDD → RDD
def context: SparkContext

Definition Classes
RDD
def count(): Long

Definition Classes
RDD
val dependencies: List[OneToOneDependency[T]]

Definition Classes
PipedRDD → RDD
final def eq(arg0: AnyRef): Boolean

Definition Classes
AnyRef
def equals(arg0: Any): Boolean

Definition Classes
AnyRef → Any
def filter(f: (String) ⇒ Boolean): RDD[String]

Definition Classes
RDD
def finalize(): Unit

Attributes
protected[lang]
Definition Classes
AnyRef
Annotations
@throws()
def first(): String

Definition Classes
RDD
def flatMap[U](f: (String) ⇒ TraversableOnce[U])(implicit arg0: ClassManifest[U]): RDD[U]

Definition Classes
RDD
def fold(zeroValue: String)(op: (String, String) ⇒ String): String

Aggregate the elements of each partition, and then the results for all the partitions, using a given associative function and a neutral "zero value".
Aggregate the elements of each partition, and then the results for all the partitions, using a given associative function and a neutral "zero value". The function op(t1, t2) is allowed to modify t1 and return it as its result value to avoid object allocation; however, it should not modify t2.

Definition Classes
RDD
def foreach(f: (String) ⇒ Unit): Unit

Definition Classes
RDD
final def getClass(): java.lang.Class[_]

Definition Classes
AnyRef → Any
def glom(): RDD[Array[String]]

Definition Classes
RDD
def groupBy[K](f: (String) ⇒ K)(implicit arg0: ClassManifest[K]): RDD[(K, Seq[String])]

Definition Classes
RDD
def groupBy[K](f: (String) ⇒ K, numSplits: Int)(implicit arg0: ClassManifest[K]): RDD[(K, Seq[String])]

Definition Classes
RDD
def hashCode(): Int

Definition Classes
AnyRef → Any
val id: Int

Definition Classes
RDD
final def isInstanceOf[T0]: Boolean

Definition Classes
Any
final def iterator(split: Split): Iterator[String]

Definition Classes
RDD
def map[U](f: (String) ⇒ U)(implicit arg0: ClassManifest[U]): RDD[U]

Definition Classes
RDD
def mapPartitions[U](f: (Iterator[String]) ⇒ Iterator[U])(implicit arg0: ClassManifest[U]): RDD[U]

Definition Classes
RDD
final def ne(arg0: AnyRef): Boolean

Definition Classes
AnyRef
final def notify(): Unit

Definition Classes
AnyRef
final def notifyAll(): Unit

Definition Classes
AnyRef
val partitioner: Option[Partitioner]

Definition Classes
RDD
def pipe(command: Seq[String], env: Map[String, String]): RDD[String]

Definition Classes
RDD
def pipe(command: Seq[String]): RDD[String]

Definition Classes
RDD
def pipe(command: String): RDD[String]

Definition Classes
RDD
def preferredLocations(split: Split): Seq[String]

Definition Classes
RDD
def reduce(f: (String, String) ⇒ String): String

Definition Classes
RDD
def sample(withReplacement: Boolean, fraction: Double, seed: Int): RDD[String]

Definition Classes
RDD
def saveAsObjectFile(path: String): Unit

Definition Classes
RDD
def saveAsTextFile(path: String): Unit

Definition Classes
RDD
def splits: Array[Split]

Definition Classes
PipedRDD → RDD
final def synchronized[T0](arg0: ⇒ T0): T0

Definition Classes
AnyRef
def take(num: Int): Array[String]

Take the first num elements of the RDD.
Take the first num elements of the RDD. This currently scans the partitions *one by one*, so it will be slow if a lot of partitions are required. In that case, use collect() to get the whole RDD instead.

Definition Classes
RDD
def takeSample(withReplacement: Boolean, num: Int, seed: Int): Array[String]

Definition Classes
RDD
def toArray(): Array[String]

Definition Classes
RDD
def toString(): String

Definition Classes
AnyRef → Any
def union(other: RDD[String]): RDD[String]

Definition Classes
RDD
final def wait(): Unit

Definition Classes
AnyRef
Annotations
@throws()
final def wait(arg0: Long, arg1: Int): Unit

Definition Classes
AnyRef
Annotations
@throws()
final def wait(arg0: Long): Unit

Definition Classes
AnyRef
Annotations
@throws()

PipedRDD

class PipedRDD[T] extends RDD[String]

Instance Constructors

new PipedRDD(parent: RDD[T], command: String)(implicit arg0: ClassManifest[T])

new PipedRDD(parent: RDD[T], command: Seq[String])(implicit arg0: ClassManifest[T])

new PipedRDD(parent: RDD[T], command: Seq[String], envVars: Map[String, String])(implicit arg0: ClassManifest[T])

Value Members

final def !=(arg0: AnyRef): Boolean

final def !=(arg0: Any): Boolean

final def ##(): Int

def ++(other: RDD[String]): RDD[String]

final def ==(arg0: AnyRef): Boolean

final def ==(arg0: Any): Boolean

def aggregate[U](zeroValue: U)(seqOp: (U, String) ⇒ U, combOp: (U, U) ⇒ U)(implicit arg0: ClassManifest[U]): U

final def asInstanceOf[T0]: T0

def cache(): RDD[String]

def cartesian[U](other: RDD[U])(implicit arg0: ClassManifest[U]): RDD[(String, U)]

def clone(): AnyRef

def collect(): Array[String]

def compute(split: Split): Iterator[String]

def context: SparkContext

def count(): Long

val dependencies: List[OneToOneDependency[T]]

final def eq(arg0: AnyRef): Boolean

def equals(arg0: Any): Boolean

def filter(f: (String) ⇒ Boolean): RDD[String]

def finalize(): Unit

def first(): String

def flatMap[U](f: (String) ⇒ TraversableOnce[U])(implicit arg0: ClassManifest[U]): RDD[U]

def fold(zeroValue: String)(op: (String, String) ⇒ String): String

def foreach(f: (String) ⇒ Unit): Unit

final def getClass(): java.lang.Class[_]

def glom(): RDD[Array[String]]

def groupBy[K](f: (String) ⇒ K)(implicit arg0: ClassManifest[K]): RDD[(K, Seq[String])]

def groupBy[K](f: (String) ⇒ K, numSplits: Int)(implicit arg0: ClassManifest[K]): RDD[(K, Seq[String])]

def hashCode(): Int

val id: Int

final def isInstanceOf[T0]: Boolean

final def iterator(split: Split): Iterator[String]

def map[U](f: (String) ⇒ U)(implicit arg0: ClassManifest[U]): RDD[U]

def mapPartitions[U](f: (Iterator[String]) ⇒ Iterator[U])(implicit arg0: ClassManifest[U]): RDD[U]

final def ne(arg0: AnyRef): Boolean

final def notify(): Unit

final def notifyAll(): Unit

val partitioner: Option[Partitioner]

def pipe(command: Seq[String], env: Map[String, String]): RDD[String]

def pipe(command: Seq[String]): RDD[String]

def pipe(command: String): RDD[String]

def preferredLocations(split: Split): Seq[String]

def reduce(f: (String, String) ⇒ String): String

def sample(withReplacement: Boolean, fraction: Double, seed: Int): RDD[String]

def saveAsObjectFile(path: String): Unit

def saveAsTextFile(path: String): Unit

def splits: Array[Split]

final def synchronized[T0](arg0: ⇒ T0): T0

def take(num: Int): Array[String]

def takeSample(withReplacement: Boolean, num: Int, seed: Int): Array[String]

def toArray(): Array[String]

def toString(): String

def union(other: RDD[String]): RDD[String]

final def wait(): Unit

final def wait(arg0: Long, arg1: Int): Unit

final def wait(arg0: Long): Unit

Inherited from RDD[String]

Inherited from Serializable

Inherited from Serializable

Inherited from AnyRef

Inherited from Any