首页
IT技术
前端
后端
移动开发
编程语言
数据库
大数据
每日资讯
登录
标签
大数据
深度学习提取关键词 提取关键词方法
文本分类和提取关键词算法背景 Web应用程序变得越来越智能。 从网站上使用服务的日子已经一去不复返了,用户不得不填写一个巨大的表格。 假设您有一个适合书迷的网站。 在Web 2.0之前,像这样的网站曾经以诸如年龄,阅读的书籍,喜欢的书籍类型
深度学习提取关键词
算法
python
java
大数据
admin
6月前
29
0
hive 数据等距分箱 hive分桶查询
一、分桶及抽样查询1.分桶表数据存储 分区针对的是数据存储路径(HDFS中表现出来的便是文件夹),分桶针对的是数据文件。分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区,特别是当数据要确定合适的划分大小的时
hive 数据等距分箱
大数据
hive
分桶表
自定义函数
admin
6月前
31
0
TEZ 引擎设置容器数 tez引擎快的原理
文章目录简介Tez的实现Tez+Hive与Impala区别 简介Tez是Apache开源的支持DAG作业的计算框架,是支持HADOOP2.x的重要引擎。它源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,分解
TEZ 引擎设置容器数
大数据
hive
获取数据
依赖关系
admin
6月前
25
0
ElasticSearch 两个BoolQueryBuilder满足其中一个
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();BoolQueryBuilder boolQueryBuilder1 = QueryBuilders.boolQue
elasticsearch
大数据
搜索引擎
List
admin
6月前
30
0
ES如何分析UNASSIGNED的原因 es unassigned
1. 故障分析与排查一个 Elasticsearch 集群至少包括一个节点和一个索引。或者它 可能有一百个数据节点、三个单独的主节点,以及一小打客户端节点——这些共同操作一千个索引(以及上万个分片)。不管集群扩展到多大规模,你都会想要一个快
大数据
json
API
Elastic
admin
6月前
26
0
经纬度在mysql中以什么字段类型存储 数据经纬度
经过之前的工作,目前已经完成了数据地图的数据格式化和录入记录,目前我们的数据地图项目已经进行到最后阶段,所以现在需要一个接口,进行格式化数据并输出,其中需要用到Elasticsearch的全文检索,检索出数据后,使用php接口格式化数据输出
经纬度在mysql中以什么字段类型存储
大数据
php
开发工具
搜索
admin
6月前
30
0
spark表支持geo类型吗 spark支持哪几种编程语言
一、Scala1.1、Scala简介Scala是一门现代的多范式编程语言,平滑地集成了面向对象和函数式语言的特性,旨在以简练、优雅的方式来表达常用编程模式。Scala的设计吸收借鉴了许多种编程语言的思想,只有很少量特点是Scala自己独有的
spark表支持geo类型吗
spark
大数据
hadoop
Powered by 金山文档
admin
6月前
24
0
Python时间序列中数据序列减一年 pandas时间序列相减
导读pandas是Python数据分析最好用的第三方库,没有之一。——笛卡儿没说过这句话!在进行时间相关的数据分析时,时间序列的处理是自然而然的事情,从创建、格式转换到筛选、重采样和聚合统计,pandas都提供了全套方法支持,用的熟练简直是
Python时间序列中数据序列减一年
python
java
大数据
人工智能
admin
6月前
21
0
es如何实现分组查询 es分组聚合查询
es如何实现分组查询
elasticsearch
java
大数据
数据
admin
6月前
17
0
使用docker部署skywalking集群 docker搭建spark集群
docker6_搭建spark集群1、安装spark2、配置spark3、Standalone-HA4、Spark-On-Yarn 链接: 基于CentOS 8镜像的spark集群搭建连接进入node1容器docker exec -it
spark
大数据
分布式
hadoop
vim
admin
6月前
22
0
java postmethod设置编码 postman java代码
postman是一款支持http协议的接口调试与测试工具,其主要特点就是功能强大,使用简单且易用性好 。无论是开发人员进行接口调试,还是测试人员做接口测试,postman都是我们的首选工具之一 。那么接下来就介绍下postman到底有哪些功
java postmethod设置编码
大数据
python
java
软件测试
admin
6月前
20
0
presto中处理json presto cli
SQL on Hadoop的计算引擎的第一步总是从提交查询开始,只有提交了查询,才有后面一系列的sql解析,优化,生成执行计划,调度之类的工作,因此,今天我们来分析一下presto的提交查询是如何进行的(基于prestosql 330版本进
presto中处理json
presto
大数据
SQL
封装
admin
6月前
25
0
hive注册账号 iD number 是什么 hive账号注册官网
Zookeeper+Hadoop+Hbase+Hive+Kylin+Nginx集群搭建一、虚拟机安装Centos71.准备工作2.centos7安装过程3.关闭防火墙(关键)二、安装jdk1.卸载镜像自带jdk2.安装自己的jdk3.配置
大数据
hadoop
linux
HDFS
centos
admin
6月前
31
0
linux的docker的es安装分词器未挂载数据卷 elasticsearch ik分词安装
目录一、检查java环境二、下载安装Elasticsearch2.1.创建安装目录2.2.下载Elastaicsearch2.3.解压压缩文件2.4.创建运行es的用户2.5.修改es配置文件2.6.系统设置(Root用户)2.6.1设置内
elasticsearch
大数据
搜索引擎
运维
后端
admin
6月前
18
0
java DataSource 连接pg java连接oracle数据库详细步骤
数据库的操作是当前系统开发必不可少的开发部分之一,尤其是在现在的大数据时代,数据库尤为重要。但是你真的懂得Java与数据库是怎么连接的么? 先给大家一个数据库连接的简单实例:package com.java.dbtest;import j
数据库
java
大数据
SQL
admin
6月前
21
0
项目管理ES 项目管理eso
一、整体管理1.项目启动1)制定项目章程 输入:合同 工作说明书(SOW) 组织过程资产输出:项目章程 2)选择项目经理2.制定初步范围说明书输出初步的项目范围说明书3.项目计划管理1)项目计划制定 输出:项目管理计划 2)项目计划执行 3
项目管理ES
大数据
pmp
高项
软考
admin
6月前
14
0
Android和idea前后端分离 idea前后端分离项目
因为前后端分离的便利性,大多数公司都会选择使用前后端分离的方式进行项目的操作,今天,我就来给大家科普一下如何在前后端分离的情况下实现增删改查。一、首先,我们打开IDEA,检查一下后台代码,我昨天做了检查,发现没有写修改时候的接口和实现,那么
Android和idea前后端分离
大数据
Data
用户名
前后端分离
admin
6月前
28
0
mongodb查询500万条数据速度
MongoDB查询500万条数据速度在大数据时代,数据量的增长是不可避免的。对于数据库来说,如何高效地查询处理大量数据成为一个重要的问题。而MongoDB作为一种非关系型数据库,在处理大数据方面有着独特的优势。MongoDB简介MongoD
数据
数据库
大数据
admin
7月前
40
0
aggregateByKey自定义聚合函数 hive自定义聚合函数
目录一、hive函数的使用1.hive函数分类2.字符函数3.类型转换函数4.数学函数5.日期函数6.集合函数7.条件函数8.聚合函数9.表生成函数:输出可以作为表使用二、UDF函数1.先创建maven项目2.继承UDF并重写evaluat
hive
hadoop
HDFS
mapreduce
大数据
admin
7月前
31
0
centos7部署zookeeper环境 zookeeper环境配置
1.什么是Zookeeper ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配
java
大数据
服务器
zookeeper
hadoop
admin
7月前
25
0
«
1
2
3
4
5
6
...11
»