首页
IT技术
前端
后端
移动开发
编程语言
数据库
大数据
每日资讯
登录
标签
大数据
kafka最新版本镜像 kafka client版本
说明除了使用Kafka的bin目录下的脚本工具来管理Kafka,还可以使用管理Kafka的API将某些管理查看 的功能集成到系统中。在Kafka0.11.0.0版本之前,可以通过kafka-core包(Kafka的服务端,采用Scala 编
kafka最新版本镜像
kafka
java
scala
大数据
admin
6月前
11
0
spark sql 字符类型转换成INT spark sql 字符串长度
1.对于确定长度的数组,用模式匹配来获取每一位的数据正例:val Array(name,age) = x.split(",")反例: val array = x.split(","); val nam
spark
大数据
scala
SQL
正例
admin
6月前
11
0
js data索引 date索引
前言对于索引结构一旦创建 就不能增加分片 除非重建索引那对于这种需求我们该怎么办呢?步骤blog取⼀个别名blog_latest, blog_latest作为对外使⽤新增⼀个索引blog_20220101,结构复制于nba索引,根据业务要求
js data索引
大数据
spring
elasticsearch
java
admin
6月前
17
0
数据量千万可以加索引么 上亿数据加索引
数据在千万级别上进行全文检索有哪些技术?强大的大数据全文索引解决方案-ClouderaSearch1.lucene (solr, elasticsearch 都是基于它) 2.sphinx3.elasticsearch 简单易用。天生分布式
数据量千万可以加索引么
大数据
solr
全文索引
搜索
admin
6月前
13
0
正向序号体系索引号从什么开始 什么是正排索引
正排索引和倒排索引理解详解一、正排索引二、 倒排索引三、为什么搜索引擎选用倒排索引?四、倒排索引优点五、小结 一、正排索引蜘蛛爬虫经过文字提取、中文分词、去重等操作后,得到的就是独特的、能反应页面的主题内容、以词为单位的字符串。接下来搜索
正向序号体系索引号从什么开始
搜索引擎
云计算
大数据
索引
admin
6月前
17
0
kafka底层 kafka底层架构
一.Kafka简介 Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,使用Scala语言编写,之后成为Apache项目的一部分。Kafka是一个分布式的,可划分的,多订阅者,冗余备份的持久性的日志服务。它主要用于处理活
kafka底层
scala
大数据
数据库
消息队列
admin
6月前
12
0
MongoDB国产同类数据库 mongodb 海量数据
MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为WEB应用提供可扩展的高性能数据存储解决方案。其名字来自humongous这个单词的中间部分,从名字可见其野心所在就是海量数据的处理。一、MongoDB简介 2011
MongoDB国产同类数据库
mongodb
nosql
大数据
海量数据
admin
6月前
16
0
activemq 模拟大数据量 activemq用的多吗
ActiveMQ 单机吞吐量:万级 时效性:ms级 可用性:高,基于主从架构实现高可用性 消息可靠性:有较低的概率丢失数据 功能支持:MQ领域的功能极其完备 总结: 非常成熟,功能强大,在早些年业内大量的公司以及项目中都有
activemq 模拟大数据量
消息队列
kafka
日志采集
大数据
admin
6月前
15
0
ELK搜索引擎可以干嘛 es搜索引擎优点
本篇主要介绍对es的初次体检,以及安装和初步使用。一.es简介Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎,能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心,它集中存储您的数据,
ELK搜索引擎可以干嘛
大数据
数据库
操作系统
Elastic
admin
6月前
16
0
Flink编程模型 flink 模型
Flink 的核心语义和架构模型 Flink核心概念 Streams(流) 有界流 有固定大小,不随时间增长而增长的数据,比如Hive中的一张表无界流 无固定大小,数据随时间增长而增长,比如Kafka中的消息State(状态)#重要 指的是
Flink编程模型
分布式
队列
大数据
flink
admin
6月前
11
0
es aggregations 过滤 elasticsearch 过滤器
1、布尔过滤器 前篇文章中(term精确查找)的两个例子都是单个过滤器(filter)的使用方式。在实际应用中,我们很有可能会过滤多个值或字段。比方说,怎样用 Elasticsearch 来表达下面的 SQL ? 这
es aggregations 过滤
大数据
SQL
Elastic
嵌套
admin
6月前
10
0
flinksql 连接数据库超时是什么原因 flink1.11 sql
Flink(七)Flink SQL一.SQL基础1.基础架构2.表环境2.1 表环境的作用2.2 创建表环境3.创建表3.1 表的ID3.2 DDL2.3 流转换成表4.表的查询4.1. 执行 SQL 进行查询4.2 调用 Table A
大数据
flink
SQL
API
字段
admin
6月前
16
0
es 创建索引 text字段映射 es创建索引过程
索引过程1 IndexRequestUUID工具自动生成一个uuid,代码在IndexRequest的process方法内。2TransportIndexAction根据索引数据的id、类型以及索引分片信息进行哈希取模,确定把该条数据分配到
es 创建索引 text字段映射
大数据
数据
取模
自动生成
admin
6月前
13
0
keepalived配置详解 track_interface keepalived参数详解
一、集群基础1、系统的扩展方式scale up向上扩展:提高单台服务器的性能scale out向外扩展:多台服务器联合起来满足同一个需要2、集群类型LB :load balancing,负载均衡集群,通过横向扩展提高系统性能前端 : 负载均
后端
操作系统
大数据
IP
优先级
admin
6月前
20
0
zookeeper curator 节点数据读取不到 zookeeper节点个数
因为这里zookeeper的集群部署都会2n+1台Dubbo建议使用Zookeeper作为服务的注册中心。Zookeeper集群中只要有过半的节点是正常的情况下,那么整个集群对外就是可用的。正是基于这个特性,要将ZK集群的节点数量要为奇数(
大数据
开发工具
java
zookeeper
客户端
admin
6月前
18
0
大数据编程 架构 大数据编程入门经典
本书单是鉴于本人多年浸淫大数据领域的经验,按照学习大数据的阶段和技术所列的书单,适合刚刚接触大数据领域的新人。话不多说,直接上书单!第一阶段:大数据基础语言的学习Java语言基础:Java开发介绍、熟悉Eclipse开发工具、Java语言基
大数据编程 架构
大数据
大数据开发
大数据学习
编程语言
admin
6月前
12
0
HIVESQL 加密解密 hive 解锁
数据仓库hive-极致优化-解释计划11. 读懂解释计划hivesql的运行同关系型数据库一样遵循一个逻辑。解释计划就是用来描述这个逻辑。读懂解释计划,就能够知道,程序运行的前世今生。能够很直观的了解程序运行瓶颈点。 简而言之,优化SQL,
HIVESQL 加密解密
数据库
大数据
hadoop
hive
admin
6月前
15
0
hive判断连续出现的最大长度 hive查询最大日期
轻松入门大数据 文章目录轻松入门大数据第10章 入门到进阶:如何快速掌握Hive核心函数10.1 Hive函数10.1.5 动手实操日期时间函数的使用 第10章 入门到进阶:如何快速掌握Hive核心函数10.1 Hive函数复杂数据类型Hi
hive判断连续出现的最大长度
hive
大数据
hadoop
admin
6月前
12
0
mysql中固态硬盘和机械硬盘的区别 数据库用固态硬盘
一、关于IO等待时间问题 通常,仅仅增加处理器能力对提高Oracle性能几乎毫无裨益。因为无论处理器多快,都要时不时地等待获取磁盘上的数据。当数据链上所有其他部件都在按时钟周期和电子线路的固有速度运转时,硬盘驱动器却依赖磁头围绕磁碟的物理移
mysql中固态硬盘和机械硬盘的区别
数据库
大数据
固态盘
服务器
admin
6月前
13
0
es先去重后分组 es去重查询误差
问题复现今天加班写了一个接口,刚开始发现诶数据还是正常的,觉得可以上线了,因为这个接口只是去ES查了一次数据,统计了一下数量,前端验证也没什么问题,但是突然,我发现了另一个问题: 这里面待处理是0 啊,为什么接口返回的是10,有值导致前端加
es先去重后分组
elasticsearch
大数据
big data
ES自动判空
admin
6月前
20
0
«
1 ...
5
6
7
8
9
10
11
»