중국시가넷 - 고서 복원 - Solr 구성 요소의 역할은 무엇입니까?

Solr 구성 요소의 역할은 무엇입니까?

Solr 은 웹 응용 프로그램에 쉽게 추가할 수 있는 Lucene Java 기반 오픈 소스 검색 서버입니다.

둘째, Solr 은 레벨 검색 (통계) 을 제공하며, hit 는 XML/XSLT 및 JSON 을 포함한 다양한 출력 형식을 지원합니다. 설치와 구성이 간편하며 http 기반 기능을 제공합니다

관리 인터페이스. Solr 은 이미 많은 대형 사이트에서 사용되어 성숙하고 안정적이다.

셋째로, Solr 는 Lucene 을 캡슐화하고 확장했기 때문에 Solr 은 기본적으로 Lucene 의 관련 조항을 따랐다. 더 중요한 것은 Solr 에서 만든 인덱스가 Lucene 검색 엔진 라이브러리와 완벽하게 호환된다는 것입니다.

4.Solr 은 다른 Lucene 응용 프로그램에 내장된 인덱스를 읽고 사용할 수 있으며, 경우에 따라 인코딩해야 할 수도 있습니다.

5. 또한 많은 Lucene 도구 (예: Nutch 및 Luke) 가 Solr 로 만든 인덱스를 사용할 수 있습니다. Solr 의 우수한 기본 검색 기능을 사용하거나 비즈니스 요구에 따라 확장할 수 있습니다.

Solr 의 이점

위에서 Solr 에 대해 소개한 바와 같이 Solr 의 장점은 다음과 같습니다.

① 고급 전체 텍스트 검색 기능;

(2) 높은 통과 용량을 갖는 네트워크 트래픽 최적화;

③ 개방형 인터페이스 (XML 및 HTTP) 표준을 기반으로합니다.

④ 포괄적 인 HTML 관리 인터페이스;

⑤ 확장성-다른 Solr 검색 서버에 효과적으로 복제할 수 있습니다.

⑥ 유연성과 적응성을 달성하기 위해 XML 구성을 사용한다.

⑦ 확장 가능한 플러그인 시스템.

Solr 대 Lucene! -응?

Solr 과 Lucene 을 비교하기 전에 Lucene 이 무엇인지 알기 위해 Lucene 이 무엇인지 검토해 보겠습니다.

Lucene 은 Java 기반 전체 텍스트 정보 검색 키트입니다. 완전한 검색 응용 프로그램은 아니지만 응용 프로그램에 인덱스 및 검색 기능을 제공합니다. Lucene 은 현재 Apache Jakarta 제품군의 오픈 소스 프로젝트입니다. 또한 가장 인기 있는 Java 기반 오픈 소스 전체 텍스트 검색 키트이기도 합니다. 현재 많은 응용 프로그램의 검색 기능은 Eclipse 도움말 시스템의 검색 기능과 같은 Lucene 을 기반으로 합니다. Lucene 은 텍스트 유형의 데이터를 인덱스화할 수 있으므로 인덱스화할 데이터 형식을 텍스트 형식으로 변환하는 한 Lucene 은 문서를 인덱스화하고 검색할 수 있습니다.

그럼, 솔러는 그에 비해' 진' 거야? 아니면' 승리' 인가?

사실, Solr 와 Lucene 은 경쟁과 대립이 아니다. 반대로, Solr 는 Lucene 에 의존한다. 왜냐하면 Solr 의 기본 핵심 기술은 Lucene 에 의해 구현되기 때문이다. Solr 과 Lucene 에는 검색 서버, 엔터프라이즈 및 관리의 세 가지 본질적인 차이점이 있습니다. Lucene 은 본질적으로 검색 라이브러리이지, 독립적인 앱이 아니라 Solr 이다. Lucene 은 검색 인프라 건설에 집중하고, Solr 은 엔터프라이즈 어플리케이션에 집중합니다. Lucene 은 검색 서비스를 지원하는 데 필요한 관리에 대해 책임을 지지 않으며 Solr 은 책임을 집니다. 즉, Solr: Solr 은 Lucene 이 엔터프라이즈 검색 응용 프로그램을 확장하는 것입니다.

다음은 Solr 및 Lucene 의 스키마입니다.

이 그림은 매우 복잡해서 너는 이해할 수 없다. 낙심하지 마세요. 너는 뒤의 코드에서 이 그림이 무엇인지 알 수 있다.

녹색은 Lucene 의 모듈이고, 파란색은 Solr 확장 Lucene 이라는 것을 쉽게 알 수 있다. 그림에서 다음 사항을 볼 수 있습니다.

A. 동적 필드와 고유 키가 있는 실제 데이터 스키마?

B.Lucene 쿼리 언어의 강력한 확장! -응?

C. 결과의 동적 그룹화 및 필터링을 지원합니까?

D. 고급 및 구성 가능한 텍스트 분석?

E. 고도로 구성 가능하고 확장 가능한 캐싱 메커니즘?

F. 성능 최적화?

G. XML 을 통한 외부 구성 지원?

H. 관리 인터페이스가 있습니까?

I. 모니터링 가능한 로그?

J 빠른 증분 업데이트 및 스냅샷 배포를 지원합니다.

말하자면, Solr 의 소개는 끝났다. 나는 모든 사람들이 솔러에 대해 이미 초보적인 이해를 가지고 있다고 믿는다. Solr 의 공통 속성은 무엇입니까?

Solr 사용 속성 및 구성 파일

문서에는 하나 이상의 필드가 포함되어 있습니다. 필드에는 이름, 컨텐트 및 메타 데이터가 포함되어 있어 Solr 에 콘텐츠를 처리하는 방법을 알려줍니다.

예를 들어, Field 는 문자열, 숫자, 부울 또는 날짜 또는 추가할 모든 유형을 포함할 수 있습니다. Solr 의 프로필에서 해당 구성을 수행하기만 하면 됩니다. 필드는 다음과 같은 여러 옵션으로 설명할 수 있습니다

옵션은 Solr 에게 인덱싱 및 검색 중 컨텐츠를 처리하는 방법을 알려줍니다.

이제 다음 그림에 나열된 중요한 속성의 하위 집합을 살펴 보겠습니다.

Solr 의 중요한 파일 중 하나는 schema.xml 의 구성 파일입니다.

Schema.xml

구성 파일 schema.xml 은 Solr 패키지를 다운로드한 설치 및 압축 해제 디렉토리의 \ Solr \ example \ Solr \ collection1\ conf 에서 찾을 수 있으며 Solr 패키지는 Solr 과 함께 제공됩니다

이 프로필을 열면 자세한 주석을 찾을 수 있습니다. 모델 조직은 크게 세 가지 중요한 구성으로 나뉩니다.

먼저, 필드 유형

Fieldtype: int, String, Boolean 등의 속성 유형을 나타냅니다. 이 프로필에서 FieldType 에는 속성을 정의하는 기능이 있습니다. 다음 그림을 보세요:?

이 그림에는 익숙한 int, String, boolean 이 있습니다. 그렇다면 다음 구성은 무엇입니까? 그런 다음 다음 매개 변수를 소개하겠습니다.

둘째, 영역

Field: 는 인덱스 파일에 추가된 속성의 이름입니다. 유형을 선언하려면 위의 유형이 필요합니다. 예를 들면 다음과 같습니다.

Ps: ① 필드: 고정 필드 설정; ② 동적 필드: 나중에 필드를 정의하는 동적 필드 설정 및 * 와일드카드. 예를 들어 test_i 는 int 유형의 동적 필드입니다.

일반적으로 검색에 사용되는 특수 필드인 copyField 가 있어 이 필드만 색인화되고 세그먼트화될 수 있습니다. 소스가 여러 개 있는 경우 copyField 의 dest 필드를 설정해야 합니다.