4.1 쿼리 컨텍스트와 필터 컨텍스트
쿼리 컨텍스트
필터 컨텍스트
쿼리/필터 조합으로 사용하는 추세임
4.2 쿼리 스트링과 쿼리 DSL
쿼리 DSL:
4.3 유사도 스코어
explain 옵션
을 사용해 유사도 스코어 알고리즘을 알 수 있다.BM25 알고리즘
검색, 추천에 많이 사용
TF + IDF + 문서 길이 를 고려한 알고리즘
IDF 계산
문서 빈도 : 특정 용어가 얼마나 자주 등장했는지 의미
문서 빈도가 높다 → 중요한 용어가 아님 (ex. 관사, 부사)
문서 빈도의 역수(IDF): 도큐먼트 내에 발생 빈도가 적을수록 가중치를 높여주는 것
n: 3, N: 4675
TF 계산
용어 빈도 : 특정 용어가 하나의 도큐먼트에 얼마나 많이 등장했는지 의미
용어 빈도가 높다 → 주제 용어
BM25알고리즘 최종 값 = IDF * TF * boost(2.2)