일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 가장 큰 수
- 모던 자바 인 액션
- 해시
- 전화번호 목록
- 롬복 어노테이션
- @Data
- 루씬 인 액션
- kubenetes
- @configuration
- 크론 표현식
- H-index
- 알고리즘
- @Getter
- 기능개발
- Java
- 코딩 테스트
- 프로그래머스
- 커링
- 다리를 지나는 트럭
- 스택/큐
- 정렬
- @Setter
- 완주하지 못한 선수
- 쿠버네티스
- 고차원 함수
- @EnableScheduling
- 검색 기능 확장
- 스프링 스케쥴러
- 영속 자료구조
- K번째수
- Today
- Total
목록루씬 Lucene (8)
Today I Learned
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/ndibN/btqX82Al1q5/qIfGcYGM4PwKIYfzKegkEK/img.png)
11장에서 다루는 내용 성능 최적화 스레드 활용 디스크, 파일 식별자, 메모리 사용량 관리 색인 백업과 복원 색인 문제점 확인과 수정 흔한 오류에 대한 이해 11.1 성능 최적화 색인의 규모가 늘어나고, 검색 애플리케이션에 기능을 추가하고, 검색 요청 수가 많아짐에 따라 성능 문제가 발생할 수 있다. 이럴 경우 다양한 최적화 방법으로 루씬의 색인 또는 검색 성능을 개선할 수 있다. 11.1.1 간단한 최적화 방법 특정 지표에 대한 최적화를 수행하기 전에 간단한 최적화 절차를 먼저 살펴보자. SSD 사용 루씬 라이브러리 버전 업그레이드 JVM 버전 업그레이드 및 성능 최적화 JVM 실행 시 -server 설정 지정 로컬 디스크에 색인 저장 자바 성능 측정 프로파일러 또는 System.nanoTime 등의 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/mscxA/btrbpP1FNPK/suoeyKkYjPNkJFKfVKa8ck/img.jpg)
8.2 분석기와 토큰 필터 contrib 모듈에는 상당 수의 언어별 분석기가 들어있으며, 여러 종류의 필터와 토큰 추출기가 제공된다. 8.2.1 스노볼 분석기 SnowballAnaylzer 클래스는 여러 언어의 기본형을 찾아주는 스테머(stemmer)의 기초가 된다. 스노볼 분석기를 통해 다양한 언어의 기본형 찾기 기능을 구현할 수 있다. public void testEnglish() throws Exception { Analyzer analyzer = new SnowballAnalyzer(Version.LUCENE_30, "English"); AnalyzerUtils.assertAnalyzesTo(analyzer, "stemming algorithms", new String[] {"stem", "alg..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cOhgHW/btrbquCZ2ws/1td4Ddjk9qy0rfwaBrbhs1/img.jpg)
6장에서 다루는 내용 - 정렬 기능 직접 구현 - Collector 활용 - QueryParser 기능 변경 - 위치 기반 적재 6.1 정렬 기능 직접 구현 FieldComparatorSource 클래스 - 검색 결과를 연관도 점수, 문서 ID, 특정 필드의 값 등이 아닌 다른 값으로 정렬해야 할 때, 상속받아 직접 구현할 수 있다. - 색인 과정에서 정렬 조건을 확정할 수 없는 경우 검색 결과를 원하는 방법으로 정렬하는 기능 사용시 유용하다. 검색 결과를 특정 지점에서 지리적인 거리가 얼마나 가까운지를 기준으로 정렬하는 방법으로 알아보자. 1. 색인할 때 준비해야할 내용 2. 검색할 때 정렬 기능을 구현하는 방법 3. 화면에 표시할 목적으로 색인된 문서의 위치정보를 찾아내는 방법 6.1.1 색인 시점에..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cgeF9o/btrbpPHnMa2/6BA2kBfjXgwUCbHSDkGUV0/img.jpg)
5장에서 다루는 내용 - 문서의 필드 값 불러오기 - 검색 결과 필터링과 정렬 - 스팬 질의, 함수 질의 - 텀 벡터 활용 - 검색 중단 기본적인 기능을 뛰어넘은 검색이 필요할 때 사용할 고급 검색 기능들 각 결과 문서에서 질의에 해당하는 텀의 위치 정보를 세심하게 활용하는 고급 질의인 스팬 질의를 사용하는 방법 구문 질의에서 유사어를 검색할 수 있는 MultiPhraseQuery 클래스 FieldSelector 클래스를 사용해 검색 결과 문서에서 원하는 필드만 불러오는 방법 여러 개의 루씬 색인을 대상으로 검색하는 방법 일정 시간이 지나면 진행중인 검색 작업을 중단하는 방법 QueryParser에 기반을 둔 별도의 클래스를 사용해 여러 개의 필드를 한번에 검색하는 방법 5.1 필드 캐시 루씬의 역파일 ..