博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark_SQl
阅读量:5897 次
发布时间:2019-06-19

本文共 718 字,大约阅读时间需要 2 分钟。

引入 hadoop 的core-site.xml

加入与之对应版本的Spark-client

和Spark-Sql  依赖

这是一个简单SparkSql 方式的Word-count 的例子

···

package com.xxx

import org.apache.spark.sql.SparkSession

object WordCount {

def main(args: Array[String]): Unit = {

val spark =SparkSession.builder().master("local[*]").appName("spark sql word count").getOrCreate()

//连接hdfs
//导入隐式转换

import spark.implicits._import  spark.sql

//导入文件

val rdd=spark.sparkContext.textFile("/user_info.txt")val ds =rdd toDS()ds.printSchema()ds.createOrReplaceTempView("line_str")val wcResult =sql(  """    |select word    |  ,count(1) as  count    |  from(    |  select explode(split(value,'')) as word    |  from line_str    |  )    |  group by word  """.stripMargin)wcResult.show()

}

}

···

转载地址:http://ekosx.baihongyu.com/

你可能感兴趣的文章
windows server2008多用户远程登陆设置方法
查看>>
sencha touch巧妙使用请求超时提升用户体验
查看>>
15. 3Sum
查看>>
ArrayList源码解析
查看>>
基于SpringMVC、Maven以及Mybatis的环境搭建
查看>>
可见面判别算法---区域细分算法
查看>>
ViewPager Banner(广告墙)
查看>>
iOS开发20:Navigation Bar的简单设置
查看>>
iOS开发24:使用SQLite3存储和读取数据
查看>>
Yii2 Unable to verify your data submission 错误-CSRF
查看>>
angularjs-paste-upload
查看>>
解除 Linux 系统的最大进程数和最大文件打开数限制
查看>>
RXjs相关
查看>>
百练2973: Skew binary 数 之 Java 题解
查看>>
linux基础命令 head
查看>>
在模板中将php数组转换成js对象
查看>>
使用java调用FFMPEG进行转码
查看>>
克隆虚拟机以及互相登陆
查看>>
AES加密解密
查看>>
objective c:import和include的区别, ""和<>区别
查看>>