(미완)[Elasticsearch]특징

2020. 10. 29. 11:15

728x90

-Full text search가 가능

->이 말은 토큰 analyer같은게 내장디ㅗ어 있다는 것, document사이 relevancy를 측정할 measure가 있다는 것

->inverted index 사용

구체적으로는 참고자료 inverted index이해하기 참고

요약하면,

row는 field1(term11,term12,...)field2(term21,term22,...),...

column은 document로 document에 대해

term(in each field)의

doc freq(term을 포함하는 document개수),

position(term이 doc내에서 몇번째 token인지)

term freq(term이 각 doc마다 몇번 나타나는가),

offset(term이 doc내에서 몇번째 위치에서 시작하고 끝나는지)

정보를 분석하여 저장해둔다는 것이 핵심

이에 ES는 Standard Analyzer라는 Tokenization기능이 내장되어 있다.

->따라서 NRT(Near Real Time)검색이 가능

-Platform-indenpendent

->RESTful API를 사용하기 때문에

-같은 field명이면 다룬 index에 속하는 document도 한번에 조회가 가능하다.

->검색 특화

다중 Shard의 존재로 병렬처리가 가능

->Scalibility가 존재

단점으로는

-롤백, 트랜잭션 기능이 제공되지 않음(트랜잭션 기능이란게 뭐지?)

-Real Time은 불가능, NRT만 가능, 이는 indexed data는 내부적인 commit/flush같은 과정을 거치기 때문(commit/flush가 뭐지?)

참고자료:

medium.com/@AIMDekTech/what-is-elasticsearch-why-elasticsearch-advantages-of-elasticsearch-47b81b549f4d

What is ElasticSearch? Why ElasticSearch? Advantages of ElasticSearch!

What is Elasticsearch?

medium.com

cloudingdata.tistory.com/45

Inverted Index 이해하기

들어가며 Elasticsearch를 사용하는데에 있어서 가장 핵심이 되는 개념인 Inverted Index를 정리해본다. 또한, Inverted Index를 알아야 Elasticsearch를 용도에 맞게 사용할 수 있다고 생각한다. 따라서, Inverte..

cloudingdata.tistory.com

deviscreen.tistory.com/17

Elasitcsearch 기본

유사도 검색 텍스트 분석의 기초 텍스트 데이터 분석으 숫자, 날짜, 시간과 같은 다른 타입의 데이터 분석과는 다르다. 문자열 타입으로 지정하거나 종종 해당 필드에 정확히 일치하는 쿼리를

deviscreen.tistory.com

velog.io/@jakeseo_me/%EC%97%98%EB%9D%BC%EC%8A%A4%ED%8B%B1%EC%84%9C%EC%B9%98-%EC%95%8C%EC%95%84%EB%B3%B4%EA%B8%B0-2-DB%EB%A7%8C-%EC%9E%88%EC%9C%BC%EB%A9%B4-%EB%90%98%EB%8A%94%EB%8D%B0-%EC%99%9C-%EA%B5%B3%EC%9D%B4-%EA%B2%80%EC%83%89%EC%97%94%EC%A7%84

[엘라스틱서치 알아보기 #2] DB만 있으면 되는데, 왜 굳이 검색엔진?

엘라스틱서치 알아보기 프로젝트는 엘라스틱서치 실무가이드의 목차와 내용을 참조하였습니다. 이 포스트를 읽는 분들이라면 엘라스틱서치 실무가이드 책을 한권 반드시 구매하는 것을 권장

velog.io

728x90

저작자표시 (새창열림)

'CS' 카테고리의 다른 글

(미완)Faiss, Facebook AI Similarity Search (0)	2020.10.29
파이썬에서 원소 체크를 자주한다면 list말고 set이나 dictionary를 쓰자. (0)	2020.10.29
Inverted index 이해하기 (0)	2020.10.29
(미완)[Docker] option 정리 (0)	2020.10.21
(미완)Ubuntu 명령어 정리 (0)	2020.10.21

나를 잃지 말자

(미완)[Elasticsearch]특징

'CS' 카테고리의 다른 글

+ Recent posts

티스토리툴바