首页
IT技术
前端
后端
移动开发
编程语言
数据库
大数据
每日资讯
登录
标签
spark
hive_query_string yarn应用程序查询 hive.groupby.mapaggr.checkinterval
定义现象绝大部分任务都很快完成,只有一个或者少数几个任务执行的很慢甚至最终执行失败, 这样的现象为数据倾斜现象。 任务进度长时间维持在 99%或者 100%的附近,查看任务监控页面,发现只有少量 reduce 子任务未完成,因为其处理的数据
hive
spark
flink
数据倾斜
数据
admin
6月前
25
0
sparksql 查询kudu sparksql 子查询
Spark 2.x管理与开发-Spark SQL-【Spark SQL案例】(一)单表查询*1.读取并打印指定文件的所有数据Scala代码:package sqlExamplesimport org.apache.spark.sql.Spa
sparksql 查询kudu
spark
SQL
apache
admin
6月前
13
0
java 根据内容构建modbus java实现基于内容的推荐
目录(1)基于内容推荐原理(2)基于内容推荐优势与应用场景(3)基于内容推荐架构图详解(4)基于内容推荐TF-IDF详解(5)构建基于内容推荐开发环境(6)内容推荐开发步骤与数据演化详解(7)内容推荐余弦相似度算法详解(8)Spark稀疏
java 根据内容构建modbus
spark
apache
scala
admin
6月前
19
0
odps 与HDFS的区别 hadoop odps
简介什么是Hadoop?hadoop中有3个核心组件 分布式文件系统:HDFS —— 实现将文件分布式存储在很多的服务器上 分布式运算编程框架:MAPREDUCE —— 实现在很多机器上分布式并行运算 分布式资源调度平台:YARN —— 帮
odps 与HDFS的区别
大数据
hadoop
flink
spark
admin
6月前
23
0
以下哪个不是Flink的转换因子 flink中不包含哪种计算窗口
SPARK Apache软件基金会下的顶级开源项目之一,Apache软件基金会最重要的三大分布式计算系统开源项目之一(Hadoop、Spark、Storm)Flink Apache 软件基金会顶级项目,是Apache软件基金会的5个最大的大
以下哪个不是Flink的转换因子
spark
flink
storm
数据
admin
6月前
20
0
win 配置 spark
如何配置 Spark1. 事前准备在开始配置 Spark 之前,确保你已经安装了 Java 和 Scala,并且已经下载了 Spark 的压缩包。2. 配置步骤下面是配置 Spark 的步骤:gantttitle 配置 Sparksecti
spark
环境变量
admin
6月前
15
0
spring gateway k8s集成 k8s spring cloud
说在前面云原生应用也就是面向“云”而设计的应用,在使用云原生技术后,开发者无需考虑底层的技术实现,可以充分发挥云平台的弹性和分布式优势,实现快速部署、按需伸缩、不停机交付等。 今天我们通过把wordpress 和Mysql部署到IBM公有云
Cloud
k8s
ibm
mysql
spark
admin
6月前
16
0
linux pyspark安装
免费资料:Linux常用命令合辑+企业应用文档+Linux精选面试题点击领取>>>免费课程:学习Linux企业级实操技术点此进入>>>Linux系统是一种常用的操作系统,而Pyspark是一种基于Pyth
spark
x系统
java
admin
6月前
15
0
python svr时间序列预测 pyspark 时间序列预测
PySpark.ml时间序列特征工程1.特征预处理1).二值化与分桶2).最小最大值标准化(MinMaxScaler)3).绝对值归一化MaxAbsScaler4).特征标准化StandardScaler5).Normalizer (正则
python svr时间序列预测
算法
机器学习
数据挖掘
spark
admin
6月前
24
0
调度服务 jenkins 调度服务业
目录1. 项目结构1.1. 项目介绍1.2. 项目结构2. Oozie 介绍2.1. 需求2.2. 可选的方式2.2.1. Crontab2.2.2. Oozie2.3. Oozie 和竞品的对比3. Oozie 组件3.1. Workfl
调度服务 jenkins
spark
HDFS
执行流程
admin
6月前
18
0
为什么spark很少基于java 为什么spark用scala写
Spark也支持Java和Python,为啥要学Scala?因为Spark的原生语言是Scala,对Scala的支持最好,我觉得,Scala像是Java和Python的结合体,学着还挺好玩的一、基本语法1.声明值和变量:val: (变量指向
为什么spark很少基于java
spark
scala
List
构造器
admin
6月前
19
0
docker 安装hbase单节点 docker hbase集群
这里写目录标题一、docker搭建二.安装和配置JAVA环境三.SSH免密登录四.安装Hdoop五、spark-hadoop的搭建六、安装HBase七、安装zookeeper八、安装hive 一、docker搭建1.本项目搭建在ubunt
docker 安装hbase单节点
hadoop
Hbase
hive
spark
admin
7月前
23
0
spark环境搭建中需要改什么文件以及内容 spark在windows下的环境搭建
SparkWindows调试环境搭建教程本教程介绍的是Windows环境下的Spark调试环境的搭建步骤。主要参考文章:http:wenku.baidu.comlink?url=ZVIXNbwGZE4Z41zvG6UBO911urnYDRz
spark
scala
apache
admin
7月前
16
0
pyspark怎么查看python路径 pyspark指定python环境
文章目录背景conda创建环境并zip打包上传zip包到hdfsspark-submit提交参数设置参考 背景在使用PySpark进行开发时,面临的痛点问题之一是Driver或Executor上运行Python的包依赖的问题,解决办法之一
pyspark怎么查看python路径
PySpark
archives
conda
spark
admin
7月前
13
0
spark中文 乱码 spark nlp 中文
SparkNLP的官方文档1>sbt引入:scala为2.11时 libraryDependencies += "com.johnsnowlabs.nlp" %% "spark-nlp"
spark中文 乱码
人工智能
大数据
scala
spark
admin
7月前
12
0
dolphinScheduler 使用java dolphin conservation trust
Table of Contents任务总体存储Shell节点SQL节点存储过程节点SPARK节点MapReduce(MR)节点Python节点Flink节点HTTP节点子流程节点依赖(DEPENDENT)节点任务总体存储在调度平台所创建的所
SQL
jar
spark
admin
7月前
22
0
LDA 主题数量 lda每次生成的主题不同
文档主题生成模型(LDA)算法介绍:LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以
LDA 主题数量
MLlib
spark
数据挖掘
机器学习
admin
7月前
20
0
spark sql 字符类型转换成INT spark sql 字符串长度
1.对于确定长度的数组,用模式匹配来获取每一位的数据正例:val Array(name,age) = x.split(",")反例: val array = x.split(","); val nam
spark
大数据
scala
SQL
正例
admin
7月前
12
0
spark集群搭建
K8s免费学习资料:K8s+devops+prometheus等云原生安装包&学习指南&面试...### Spark集群搭建实践#### 一、流程概述在搭建Spark集群之前,需要准备好相应的软件和资源,然后按照以下步骤逐步
hadoop
spark
admin
7月前
11
0
«
1
2
3
»