• 제품 및 서비스
  • 제품소개
  • 검색엔진 특장점
  • 제품시연

Home > 제품 및 서비스 > Docs-One 검색엔진 특장점

검색엔진 특장점

정형, 비정형 데이터에 대한 안전하고 최적화된 색인과 검색 수행
Docs-One 은 수억건의 데이터를 병렬 Index DB 로 색인하고 검색 수행
최적화된 한글화 작업을 거쳐 한글 데이터에 검색에 탁월한 성능을 발휘
0.001초대 의 빠른 검색결과
하드 디스크 I/O 를 최소화하며 데이터 증가시 검색 속도의 저하 없이 항상 0.001초대의 
검색 속도를 유지
최신 검색 기술 제공
Facet Search (다면검색), Boosting Search, Group Search, 문장검색 같은 최신 검색 기술
강력한 검색 기능 제공
불린검색, 제한검색, 인접어 검색, 문장검색, 그룹검색 등 검색 질의어 기능
문서 포맷 필드별 중요도에 따라 차별화된 검색결과를 제공하여 정확도 향상
검색어 및 제목·내용 등의 필드와 그룹별로 색인어 기반 가중치 색인으로 검색결과
검색 키워드 입력 순서에 따라 랭킹 가중치를 자동으로 조절하는 지능형 랭킹 시스템
MS-OFFICE 파일, HWP, PDF, HTML, XML 등 전자문서 원문 검색
OCR 을 통한 원문이미지 내용 검색 지원
공공기관 웹개발 표준 및 보안 지침을 준수하는 검색 프로그램 제공
개인정보호 알고리즘 적용으로 컨텐츠내 개인정보 유무 체크 기능 지원
검색엔진 외 다양한 확장 기술
웹수집기, 자동분류, 문서 클러스터링, 토픽검색, 시맨틱검색 등 확장

System Architecture

architecture2.png




주요 검색기능

구 분 구성항목
Boolean 검색

AND : 다음 단어 모두 포함


OR : 다음 단어 중 아무거나 포함


NOT : 다음 단어 제외


(title:"정보" AND body:"검색") OR title:인공지능


제목에 정보 내용에는 검색이란 단어를 포함하거나 제목에 


인공지능이란 단어를 포함하는 문서 검색



title:인공지능 - title:정보


제목에서 인공지능 단어로 검색하되 정보라는 단어가 있는

 

문서를 제외함.

문장검색

정확한 문장을 인용부호로 묶어서 검색


"나의 문화유산답사기" 로 검색하면 정확하게


 문장이 일치하는 문서를 검색


"나의 아름다운 고양이" 로 검색하면 해당 


도서를 정확하게 검색

범위검색

DATE : [20150101 TO 20150201] 


2015년1월1일 부터 2015년2월1일 까지의 자료 검색


VAL : [234123 TO 234455] 


234123 에서 234455 범위 내의 자료 검색

인접어검색

두 개의 키워드가 특정 단어만큼 떨어져 있는 문서 검색


"정보 기술"~4


정보와 기술이 4 단어 이내로 있는 문서 검색

절단검색

키워드 일부만 포함하고 있는 문서 검색


title:정보* 


제목에서 정보로 시작하는 모든 단어 검색


title:정보*론


제목에서 정보로 시작하고 으로 마치는 모든 단어 검색


title:정보??


정보 단어뒤에 2글자(? 2개)가 추가된 단어를 검색

부스팅검색

심리학^4 철학


심리학에 4배의 가중치를 계산하여 결과 출력


"지혜의 심리학"^4 "철학개론"


"지혜의 심리학" 이란 문장에 4배의 가중치를

 

계산하여 결과 출력

그룹검색

((A AND B) OR C) 


AND DATE : [20150101 TO 20150201] 


같은 ( ) 를 사용한 그룹 검색이 가능