HnswSimilarity

Instance Constructors

new HnswSimilarity()
new HnswSimilarity(uid: String)

uid
identifier

Type Members

type TIndex[TId, TVector, TItem <: Item[TId, TVector], TDistance] = HnswIndex[TId, TVector, TItem, TDistance]

Type of index.
Type of index.

Attributes
protected
Definition Classes
HnswSimilarity → KnnAlgorithm

Value Members

final def !=(arg0: Any): Boolean

Definition Classes
AnyRef → Any
final def ##(): Int

Definition Classes
AnyRef → Any
final def $[T](param: Param[T]): T

Attributes
protected
Definition Classes
Params
final def ==(arg0: Any): Boolean

Definition Classes
AnyRef → Any
final def asInstanceOf[T0]: T0

Definition Classes
Any
final def clear(param: Param[_]): HnswSimilarity.this.type

Definition Classes
Params
def clone(): AnyRef

Attributes
protected[java.lang]
Definition Classes
AnyRef
Annotations
@throws( ... )
def copy(extra: ParamMap): Estimator[HnswSimilarityModel]

Definition Classes
KnnAlgorithm → Estimator → PipelineStage → Params
def copyValues[T <: Params](to: T, extra: ParamMap): T

Attributes
protected
Definition Classes
Params
def createIndex[TId, TVector, TItem <: Item[TId, TVector] with Product, TDistance](dimensions: Int, maxItemCount: Int, distanceFunction: DistanceFunction[TVector, TDistance])(implicit distanceOrdering: Ordering[TDistance], idSerializer: ObjectSerializer[TId], itemSerializer: ObjectSerializer[TItem]): HnswIndex[TId, TVector, TItem, TDistance]

Create the index used to do the nearest neighbor search.
Create the index used to do the nearest neighbor search.
TId
type of the index item identifier
TVector
type of the index item vector
TItem
type of the index item
TDistance
type of distance between items
dimensions
dimensionality of the items stored in the index
maxItemCount
maximum number of items the index can hold
distanceFunction
the distance function
distanceOrdering
the distance ordering
idSerializer
invoked for serializing ids when saving the index
itemSerializer
invoked for serializing items when saving items
returns
create an index

Attributes
protected
Definition Classes
HnswSimilarity → KnnAlgorithm
def createModel[TId, TVector, TItem <: Item[TId, TVector] with Product, TDistance](uid: String, outputDir: String, numPartitions: Int)(implicit arg0: scala.reflect.api.JavaUniverse.TypeTag[TId], arg1: scala.reflect.api.JavaUniverse.TypeTag[TVector], arg2: scala.reflect.api.JavaUniverse.TypeTag[TItem], arg3: scala.reflect.api.JavaUniverse.TypeTag[TDistance], evId: ClassTag[TId], evVector: ClassTag[TVector], distanceNumeric: Numeric[TDistance]): HnswSimilarityModel

Creates the model to be returned from fitting the data.
Creates the model to be returned from fitting the data.
TId
type of the index item identifier
TVector
type of the index item vector
TItem
type of the index item
TDistance
type of distance between items
uid
identifier
outputDir
directory containing the persisted indices
numPartitions
number of index partitions
returns
model

Attributes
protected
Definition Classes
HnswSimilarity → KnnAlgorithm
final def defaultCopy[T <: Params](extra: ParamMap): T

Attributes
protected
Definition Classes
Params
val distanceFunction: Param[String]

Param for the distance function to use.
Param for the distance function to use. One of "bray-curtis", "canberra", "cosine", "correlation", "euclidean", "inner-product", "manhattan" or the fully qualified classname of a distance function Default: "cosine"

Definition Classes
KnnAlgorithmParams
val ef: IntParam

Size of the dynamic list for the nearest neighbors (used during the search).
Size of the dynamic list for the nearest neighbors (used during the search). Default: 10

Definition Classes
HnswModelParams
val efConstruction: IntParam

Has the same meaning as ef, but controls the index time / index precision.
Has the same meaning as ef, but controls the index time / index precision. Default: 200

Definition Classes
HnswParams
final def eq(arg0: AnyRef): Boolean

Definition Classes
AnyRef
def equals(arg0: Any): Boolean

Definition Classes
AnyRef → Any
val excludeSelf: BooleanParam

Param that indicates whether to not return the a candidate when it's identifier equals the query identifier Default: false
Param that indicates whether to not return the a candidate when it's identifier equals the query identifier Default: false

Definition Classes
KnnModelParams
def explainParam(param: Param[_]): String

Definition Classes
Params
def explainParams(): String

Definition Classes
Params
final def extractParamMap(): ParamMap

Definition Classes
Params
final def extractParamMap(extra: ParamMap): ParamMap

Definition Classes
Params
final val featuresCol: Param[String]

Definition Classes
HasFeaturesCol
def finalize(): Unit

Attributes
protected[java.lang]
Definition Classes
AnyRef
Annotations
@throws( classOf[java.lang.Throwable] )
def fit(dataset: Dataset[_]): HnswSimilarityModel

Definition Classes
KnnAlgorithm → Estimator
def fit(dataset: Dataset[_], paramMaps: Array[ParamMap]): Seq[HnswSimilarityModel]

Definition Classes
Estimator
Annotations
@Since( "2.0.0" )
def fit(dataset: Dataset[_], paramMap: ParamMap): HnswSimilarityModel

Definition Classes
Estimator
Annotations
@Since( "2.0.0" )
def fit(dataset: Dataset[_], firstParamPair: ParamPair[_], otherParamPairs: ParamPair[_]*): HnswSimilarityModel

Definition Classes
Estimator
Annotations
@Since( "2.0.0" ) @varargs()
final def get[T](param: Param[T]): Option[T]

Definition Classes
Params
final def getClass(): Class[_]

Definition Classes
AnyRef → Any
final def getDefault[T](param: Param[T]): Option[T]

Definition Classes
Params
def getDistanceFunction: String

Definition Classes
KnnAlgorithmParams
def getEf: Int

Definition Classes
HnswModelParams
def getEfConstruction: Int

Definition Classes
HnswParams
def getExcludeSelf: Boolean

Definition Classes
KnnModelParams
final def getFeaturesCol: String

Definition Classes
HasFeaturesCol
def getIdentifierCol: String

Definition Classes
KnnAlgorithmParams
def getK: Int

Definition Classes
KnnModelParams
def getM: Int

Definition Classes
HnswParams
def getNumPartitions: Int

Definition Classes
KnnAlgorithmParams
def getNumReplicas: Int

Definition Classes
KnnModelParams
final def getOrDefault[T](param: Param[T]): T

Definition Classes
Params
def getOutputFormat: String

Definition Classes
KnnModelParams
def getParallelism: Int

Definition Classes
KnnModelParams
def getParam(paramName: String): Param[Any]

Definition Classes
Params
def getPartitionCol: String

Definition Classes
KnnAlgorithmParams
final def getPredictionCol: String

Definition Classes
HasPredictionCol
def getQueryIdentifierCol: String

Definition Classes
KnnModelParams
def getQueryPartitionsCol: String

Definition Classes
KnnModelParams
def getSimilarityThreshold: Double

Definition Classes
KnnModelParams
final def hasDefault[T](param: Param[T]): Boolean

Definition Classes
Params
def hasParam(paramName: String): Boolean

Definition Classes
Params
def hashCode(): Int

Definition Classes
AnyRef → Any
val identifierCol: Param[String]

Param for the column name for the row identifier.
Param for the column name for the row identifier. Default: "id"

Definition Classes
KnnAlgorithmParams
def initializeLogIfNecessary(isInterpreter: Boolean, silent: Boolean): Boolean

Attributes
protected
Definition Classes
Logging
def initializeLogIfNecessary(isInterpreter: Boolean): Unit

Attributes
protected
Definition Classes
Logging
final def isDefined(param: Param[_]): Boolean

Definition Classes
Params
final def isInstanceOf[T0]: Boolean

Definition Classes
Any
final def isSet(param: Param[_]): Boolean

Definition Classes
Params
def isTraceEnabled(): Boolean

Attributes
protected
Definition Classes
Logging
val k: IntParam

Param for number of neighbors to find (> 0).
Param for number of neighbors to find (> 0). Default: 5

Definition Classes
KnnModelParams
def log: Logger

Attributes
protected
Definition Classes
Logging
def logDebug(msg: ⇒ String, throwable: Throwable): Unit

Attributes
protected
Definition Classes
Logging
def logDebug(msg: ⇒ String): Unit

Attributes
protected
Definition Classes
Logging
def logError(msg: ⇒ String, throwable: Throwable): Unit

Attributes
protected
Definition Classes
Logging
def logError(msg: ⇒ String): Unit

Attributes
protected
Definition Classes
Logging
def logInfo(msg: ⇒ String, throwable: Throwable): Unit

Attributes
protected
Definition Classes
Logging
def logInfo(msg: ⇒ String): Unit

Attributes
protected
Definition Classes
Logging
def logName: String

Attributes
protected
Definition Classes
Logging
def logTrace(msg: ⇒ String, throwable: Throwable): Unit

Attributes
protected
Definition Classes
Logging
def logTrace(msg: ⇒ String): Unit

Attributes
protected
Definition Classes
Logging
def logWarning(msg: ⇒ String, throwable: Throwable): Unit

Attributes
protected
Definition Classes
Logging
def logWarning(msg: ⇒ String): Unit

Attributes
protected
Definition Classes
Logging
val m: IntParam

The number of bi-directional links created for every new element during construction.
The number of bi-directional links created for every new element during construction.
Default: 16

Definition Classes
HnswParams
final def ne(arg0: AnyRef): Boolean

Definition Classes
AnyRef
final def notify(): Unit

Definition Classes
AnyRef
final def notifyAll(): Unit

Definition Classes
AnyRef
val numPartitions: IntParam

Number of partitions (default: 1)
Number of partitions (default: 1)

Definition Classes
KnnAlgorithmParams
val numReplicas: IntParam

Param that specifies the number of index replicas to create when querying the index.
Param that specifies the number of index replicas to create when querying the index. More replicas means you can execute more queries in parallel at the expense of increased resource usage. Default: 0

Definition Classes
KnnModelParams
val outputFormat: Param[String]

Param for the output format to produce.
Param for the output format to produce. One of "full", "minimal" Setting this to minimal is more efficient when all you need is the identifier with its neighbors
Default: "full"

Definition Classes
KnnModelParams
val parallelism: IntParam

Param that specifies the number of threads to use.
Param that specifies the number of threads to use. Default: number of processors available to the Java virtual machine

Definition Classes
KnnModelParams
lazy val params: Array[Param[_]]

Definition Classes
Params
val partitionCol: Param[String]

Definition Classes
KnnAlgorithmParams
final val predictionCol: Param[String]

Definition Classes
HasPredictionCol
val queryIdentifierCol: Param[String]

Param for the column name for the query identifier.
Param for the column name for the query identifier.

Definition Classes
KnnModelParams
val queryPartitionsCol: Param[String]

Param for the column name for the query partitions.
Param for the column name for the query partitions.

Definition Classes
KnnModelParams
final def set(paramPair: ParamPair[_]): HnswSimilarity.this.type

Attributes
protected
Definition Classes
Params
final def set(param: String, value: Any): HnswSimilarity.this.type

Attributes
protected
Definition Classes
Params
final def set[T](param: Param[T], value: T): HnswSimilarity.this.type

Definition Classes
Params
final def setDefault(paramPairs: ParamPair[_]*): HnswSimilarity.this.type

Attributes
protected
Definition Classes
Params
final def setDefault[T](param: Param[T], value: T): HnswSimilarity.this.type

Attributes
protected
Definition Classes
Params
def setDistanceFunction(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setEf(value: Int): HnswSimilarity.this.type
def setEfConstruction(value: Int): HnswSimilarity.this.type
def setExcludeSelf(value: Boolean): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setFeaturesCol(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setIdentifierCol(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setK(value: Int): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setM(value: Int): HnswSimilarity.this.type
def setNumPartitions(value: Int): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setNumReplicas(value: Int): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setOutputFormat(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setParallelism(value: Int): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setPartitionCol(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setPredictionCol(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setQueryIdentifierCol(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setQueryPartitionsCol(value: String): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
def setSimilarityThreshold(value: Double): HnswSimilarity.this.type

Definition Classes
KnnAlgorithm
val similarityThreshold: DoubleParam

Param for the threshold value for inclusion.
Param for the threshold value for inclusion. -1 indicates no threshold Default: -1

Definition Classes
KnnModelParams
final def synchronized[T0](arg0: ⇒ T0): T0

Definition Classes
AnyRef
def toString(): String

Definition Classes
Identifiable → AnyRef → Any
def transformSchema(schema: StructType): StructType

Definition Classes
KnnAlgorithm → PipelineStage
def transformSchema(schema: StructType, logging: Boolean): StructType

Attributes
protected
Definition Classes
PipelineStage
Annotations
@DeveloperApi()
val uid: String

identifier
identifier

Definition Classes
HnswSimilarity → KnnAlgorithm → Identifiable
def validateAndTransformSchema(schema: StructType, identifierDataType: DataType): StructType

Attributes
protected
Definition Classes
KnnModelParams
final def wait(arg0: Long, arg1: Int): Unit

Definition Classes
AnyRef
Annotations
@throws( ... )
final def wait(arg0: Long): Unit

Definition Classes
AnyRef
Annotations
@throws( ... )
final def wait(): Unit

Definition Classes
AnyRef
Annotations
@throws( ... )

Related Doc: package hnsw

class HnswSimilarity extends KnnAlgorithm[HnswSimilarityModel] with HnswParams

Instance Constructors

new HnswSimilarity()

new HnswSimilarity(uid: String)

Type Members

type TIndex[TId, TVector, TItem <: Item[TId, TVector], TDistance] = HnswIndex[TId, TVector, TItem, TDistance]

Value Members

final def !=(arg0: Any): Boolean

final def ##(): Int

final def $[T](param: Param[T]): T

final def ==(arg0: Any): Boolean

final def asInstanceOf[T0]: T0

final def clear(param: Param[_]): HnswSimilarity.this.type

def clone(): AnyRef

def copy(extra: ParamMap): Estimator[HnswSimilarityModel]

def copyValues[T <: Params](to: T, extra: ParamMap): T

final def defaultCopy[T <: Params](extra: ParamMap): T

val distanceFunction: Param[String]

val ef: IntParam

val efConstruction: IntParam

final def eq(arg0: AnyRef): Boolean

def equals(arg0: Any): Boolean

val excludeSelf: BooleanParam

def explainParam(param: Param[_]): String

def explainParams(): String

final def extractParamMap(): ParamMap

final def extractParamMap(extra: ParamMap): ParamMap

final val featuresCol: Param[String]

def finalize(): Unit

def fit(dataset: Dataset[_]): HnswSimilarityModel

def fit(dataset: Dataset[_], paramMaps: Array[ParamMap]): Seq[HnswSimilarityModel]

def fit(dataset: Dataset[_], paramMap: ParamMap): HnswSimilarityModel

def fit(dataset: Dataset[_], firstParamPair: ParamPair[_], otherParamPairs: ParamPair[_]*): HnswSimilarityModel

final def get[T](param: Param[T]): Option[T]

final def getClass(): Class[_]

final def getDefault[T](param: Param[T]): Option[T]

def getDistanceFunction: String

def getEf: Int

def getEfConstruction: Int

def getExcludeSelf: Boolean

final def getFeaturesCol: String

def getIdentifierCol: String

def getK: Int

def getM: Int

def getNumPartitions: Int

def getNumReplicas: Int

final def getOrDefault[T](param: Param[T]): T

def getOutputFormat: String

def getParallelism: Int

def getParam(paramName: String): Param[Any]

def getPartitionCol: String

final def getPredictionCol: String

def getQueryIdentifierCol: String

def getQueryPartitionsCol: String

def getSimilarityThreshold: Double

final def hasDefault[T](param: Param[T]): Boolean

def hasParam(paramName: String): Boolean

def hashCode(): Int

val identifierCol: Param[String]

def initializeLogIfNecessary(isInterpreter: Boolean, silent: Boolean): Boolean

def initializeLogIfNecessary(isInterpreter: Boolean): Unit

final def isDefined(param: Param[_]): Boolean

final def isInstanceOf[T0]: Boolean

final def isSet(param: Param[_]): Boolean

def isTraceEnabled(): Boolean

val k: IntParam

def log: Logger

def logDebug(msg: ⇒ String, throwable: Throwable): Unit

def logDebug(msg: ⇒ String): Unit

def logError(msg: ⇒ String, throwable: Throwable): Unit

def logError(msg: ⇒ String): Unit

def logInfo(msg: ⇒ String, throwable: Throwable): Unit

def logInfo(msg: ⇒ String): Unit

def logName: String

def logTrace(msg: ⇒ String, throwable: Throwable): Unit

def logTrace(msg: ⇒ String): Unit

def logWarning(msg: ⇒ String, throwable: Throwable): Unit

def logWarning(msg: ⇒ String): Unit