본문 바로가기

Programming/scala

[Spark] DataFrame의 특정 Column을 List로 추출 (map 사용)

import sqlContext.implicits._

val df = Seq(
  (1, "First Value", java.sql.Date.valueOf("2020-04-19")),
  (2, "Second Value", java.sql.Date.valueOf("2020-04-20"))
).toDF("int_column", "string_column", "date_column")

val int_column = df.select("int_column").rdd.map(r => r(0).asInstanceOf[Int]).collect().toList

int_column: List[Int] = List(1, 2) 와 같이 생성된다.

 

'Programming > scala' 카테고리의 다른 글

[scala] 스칼라의 특징  (0) 2019.03.09