Chandan Prakash's Blog: Apache Spark : RDD vs DataFrame vs Dataset