当前位置：首页>前端>正文

ES指定doc id导致内存溢出 es存储对象

前端2024-05-09 22:59:06

什么是文档？

通常，我们可以认为对象(object)和文档(document)是等价相通的。不过，他们还是有所差

别：对象(Object)是一个JSON结构体——类似于哈希、hashmap、字典或者关联数组；对象

(Object)中还可能包含其他对象(Object)。在Elasticsearch中，文档(document)这个术语有着特殊含义。它特指最顶层结构或者根对象(root object)序列化成的JSON数据（以唯一ID标识

并存储于Elasticsearch中）

文档元数据

一个文档不只有数据。它还包含了元数据(metadata)——关于文档的信息。

_index：文档存储的地方
_type：文档代表的对象的类
_id：文档的唯一id

索引创建原则

类似的数据放在一个索引，非类似的数据放不同索引：product index（包含了所有的商品），sales index（包含了所有的商品销售数据），inventory index（包含了所有库存相关的数据）。如果你把比如product，sales，human resource（employee），全都放在一个大的index里面，比如说company index，不合适的。
index中包含了很多类似的document：类似是什么意思，其实指的就是说，这些document的fields很大一部分是相同的，你说你放了3个document，每个document的fields都完全不一样，这就不是类似了，就不太适合放到一个index里面去了。
索引名称必须是小写的，不能用下划线开头，不能包含逗号：product，website，blog

创建索引、类型、文档（接口的方式）

以博客内容管理为例,索引名为blog,类型为article，自定义id是“1”，新加一个文档：

1. curl -H 'Content-Type:application/json' -XPUT http://localhost:9200/blog/article/1 -d '
2. {

3. "id": "1",
4. "title": "New version of Elasticsearch released!",
5. "content": "Version 1.0 released today!",
6. "priority": 10,
7. "tags": ["announce", "elasticsearch", "release"]
8. }'

自增ID

当我们想要一个自增ID的时候，直接不用设置id即可，即原来是把文档存储到某个ID对应的空间，现在是把这个文档添加到某个_type下(注意：这边是POST不是PUT)

1. curl -H 'Content-Type:application/json' -XPOST http://localhost:9200/blog/article/ -d '
2. {

3. "title": "New version of Elasticsearch released!",
4. "content": "Version 1.0 released today!",
5. "priority": 10,
6. "tags": ["announce", "elasticsearch", "release"]
7. }'

返回结果：

1. {

2. "_index": "blog",
3. "_type": "article",
4. "_id": "eTmX5mUBtZGWutGW0TNs",
5. "_version": 1,
6. "result": "created",
7. "_shards": {

8. "total": 2,
9. "successful": 1,
10. "failed": 0
11. },
12. "_seq_no": 0,
13. "_primary_term": 1
14. }

自动生成的id，长度为20个字符，URL安全，base64编码，GUID，分布式系统并行生成时不可能会发生冲突。

检索文档

在对应的浏览器地址栏输入如下地址

http://XXX.XXX.XXX.XX:9200/blog/article/1?pretty

ES指定doc id导致内存溢出 es存储对象,ES指定doc id导致内存溢出 es存储对象_ES指定doc id导致内存溢出,第1张

或者在Linux中使用如下脚本：

curl -H 'Content-Type:application/json' -XGET http://localhost:9200/blog/article/1?pretty

响应包含了现在熟悉的元数据节点，增加了_source字段，它包含了在创建索引时我们发送给Elasticsearch的原始文档。

pretty：在任意的查询字符串中增加pretty参数，类似于上面的例子。会让Elasticsearch美化输出(pretty-print)JSON响应以便更加容易阅读。

_source字段不会被美化，它的样子与我们输入的一致，现在只包含我们请求的字段，而且过滤了date字段。

或者你只想得到_source字段而不要其他的元数据，你可以这样请求：

curl -H 'Content-Type:application/json' -XGET http://localhost:9200/blog/article/1/_source

返回结果：

1. {

2. "id": "1",
3. "title": "New version of Elasticsearch released!",
4. "content": "Version 1.0 released today!",
5. "priority": 10,
6. "tags": ["announce", "elasticsearch", "release"]
7. }

请求返回的响应内容包括{"found": true}。这意味着文档已经找到。如果我们请求一个不存在的文档，依旧会得到一个JSON，不过found值变成了false。此外，HTTP响应状态码也会变成'404 Not Found'代替'200 OK'。我们可以在curl后加-i参数得到响应头：

curl -H 'Content-Type:application/json' -i -XGET http://localhost:9200/blog/article/1?pretty

显示结果：

1. HTTP/1.1 200 OK
2. content-type: application/json; charset=UTF-8
3. content-length: 337
4.  
5. {

6. "_index" : "blog",
7. "_type" : "article",
8. "_id" : "1",
9. "_version" : 1,
10. "found" : true,
11. "_source" : {

12. "id" : "1",
13. "title" : "New version of Elasticsearch released!",
14. "content" : "Version 1.0 released today!",
15. "priority" : 10,
16. "tags" : [
17. "announce",
18. "elasticsearch",
19. "release"
20. ]
21. }
22. }

更新文档

1. curl -H 'Content-Type:application/json' -XPOST http://localhost:9200/blog/article/1/_update -d '{
2. "script": "ctx._source.content = \"new content\""
3. }'

ES指定doc id导致内存溢出 es存储对象,ES指定doc id导致内存溢出 es存储对象_ES指定doc id导致内存溢出_02,第2张

删除文档

curl -XDELETE http://localhost:9200/blog/article/1

ES指定doc id导致内存溢出 es存储对象,ES指定doc id导致内存溢出 es存储对象_ES指定doc id导致内存溢出_03,第3张

冲突，并发与锁

数据库离不开锁的问题。MYSQL在这方面可是相当的复杂，涉及到两种引擎，四种隔离级别，undo和redo，当前读和快照读等一系列麻烦的东西。不过es显性有version字段，看起来似乎没那么复杂。使用的乐观锁。贴一段介绍吧

悲观并发控制（Pessimistic concurrency control）这在关系型数据库中被广泛的使用，假设冲突的更改经常发生，为了解决冲突我们把访问区块化。典型的例子是在读一行数据前锁定这行，然后确保只有加锁的那个线程可以修改这行数据。乐观并发控制（Optimistic concurrency control）：被Elasticsearch使用，假设冲突不经常发生，也不区块化访问，然而，如果在读写过程中数据发生了变化，更新操作将失败。这时候由程序决定在失败后如何解决冲突。实际情况中，可以重新尝试更新，刷新数据（重新读取）或者直接反馈给用户。

查看全文

https://www.xamrdz.com/web/22a1951662.html

相关文章：