DataFrame

org.apache.spark.sql.DataFrame => com.snowflake.snowpark.DataFrame

Spark

SnowPark

Notes

agg(expr: Column, exprs: Column*): DataFrame

agg

agg(exprs: Map[String, String]): DataFrame

N/A

agg(exprs: Map[String, String]): DataFrame

N/A

agg(aggExpr: (String, String), aggExprs: (String, String)*): DataFrame

agg

apply(colName: String): Column

apply

cache(): DataFrame

cacheResult

cache is an alias for persist.

col(colName: String): Column

col

collect(): Array[T]

collect

count(): Long

count

createOrReplaceTempView(viewName: String): Unit

createOrReplaceTempView

createTempView(viewName: String): Unit

N/A

crossJoin(right: Dataset[_]): DataFrame

crossJoin

cube(col1: String, cols: String*): RelationalGroupedDataset

cube

cube(cols: Column*): RelationalGroupedDataset

cube*

distinct(): Dataset[T]

distinct

drop(col: Column): DataFrame

drop*

drop(colNames: String*): DataFrame

drop*

drop(colName: String): DataFrame

drop

dropDuplicates(col1: String, cols: String*): Dataset[T]

dropDuplicates*

dropDuplicates(): Dataset[T]

dropDuplicates

except(other: Dataset[T]): Dataset[T]

except

explain(): Unit

explain

filter(condition: Column): Dataset[T]

filter

first(): T

first

foreach(func: ForeachFunction[T]): Unit

N/A

foreach(f: (T) ⇒ Unit): Unit

N/A

groupBy(col1: String, cols: String*): RelationalGroupedDataset

groupBy

groupBy(cols: Column*): RelationalGroupedDataset

groupBy *

intersect(other: Dataset[T]): Dataset[T]

intersect

join(right: Dataset[_], joinExprs: Column, joinType: String): DataFrame

join

join(right: Dataset[_], joinExprs: Column): DataFrame

join

join(right: Dataset[_], usingColumns: Seq[String], joinType: String): DataFrame

join

join(right: Dataset[_], usingColumns: Seq[String]): DataFrame

join

join(right: Dataset[_], usingColumn: String): DataFrame

join

join(right: Dataset[_]): DataFrame

join

limit(n: Int): Dataset[T]

limit

map[U](func: MapFunction[T, U], encoder: Encoder[U]): Dataset[U]

map[U]*****

map[U](func: (T) ⇒ U)(implicit arg0: Encoder[U]): Dataset[U]

map[U]*****

na: DataFrameNaFunctions

persist(): DataFrame

cacheResult()

persist(newLevel: StorageLevel)

cacheResult()

randomSplit(weights: Array[Double]): Array[Dataset[T]]

randomSplit

randomSplit(weights: Array[Double], seed: Long): Array[Dataset[T]]

randomSplit*

reduce(func: ReduceFunction[T]): T

reduce*****

reduce(func: (T, T) ⇒ T): T

reduce*****

rollup(col1: String, cols: String*): RelationalGroupedDataset

rollup

rollup(cols: Column*): RelationalGroupedDataset

rollup*

repartition(cols: Column): DataFrame

N/A