8 자체 호스팅 강력한 검색 🔍 제품용 엔진 소프트웨어

어려워 보이지만 애플리케이션에 강력한 검색 기능을 추가하는 것은 복잡하거나 시간이 많이 걸리지 않습니다. 다음은 몇 가지 확실한 권장 사항입니다!

지난 2-30년 동안 많은 기술이 깊은 인상을 주었지만 검색은 우리 삶에 없어서는 안될 몇 안 되는 기술 중 하나입니다. 전자 상거래 사이트, 블로그, 지식 기반 등 어디에나 있습니다. 검색 상자와 아이콘이 멋지게 보이기 때문이 아니라 꼭 필요한 작업을 수행하기 때문입니다.

좋은 검색 솔루션을 찾고 있거나 기존 솔루션이 지겹다면 어떻게 하시겠습니까?

고맙게도 터무니없는 라이선스 비용을 지불할 필요도 없고 20명의 개발자와 시스템 관리자로 구성된 팀을 유지할 필요도 없습니다. 오늘 저는 특히 1-2 규모의 개발자 팀이 있는 소규모 비즈니스에서 즉시 설치 및 통합할 수 있는 몇 가지 검색 엔진 권장 사항을 가지고 있습니다.

메일리서치

가장 훌륭하고 가치 있는 검색 엔진 중 하나는 MeiliSearch입니다.

그렇다면 MeiliSearch를 최고의 추천 목록에 포함시키는 이유는 무엇입니까?

여기 간다.

오픈 소스

MeiliSearch를 지원하는 모든 소스 코드는 GitHub에서 공개되어 있습니다. 즉, 개발자는 코드의 모든 부분을 스스로 검사할 수 있습니다. 그 대가로 기업은 품질과 의도를 확신할 수 있습니다(예: 프로그램에 백도어 또는 스캐너 없음). 물론 지식이 풍부한 개발자는 기술을 더욱 개선하는 데 도움을 줄 수 있습니다.

훌륭한 UX

MeiliSearch에는 복잡한 규칙이 없습니다(예: “a – b”는 b가 아님을 의미함). 자연스럽게 검색을 입력하면 결과가 유동적으로 표시되기 시작합니다. 엔진은 매우 관대하고 수용적이어서 오타나 동의어가 사용된 경우에도 정확한 결과를 제공합니다. 또한 여러 언어를 지원합니다.

훌륭한 DevEx

개발자는 MeiliSearch를 좋아할 것입니다! 사용자 정의 및 확장이 가능할 뿐만 아니라 REST API로 인터페이스합니다! 문서화도 훌륭하고 완벽합니다. 어떤 언어로든 HTTP 호출을 하는 것은 사소하지만, 서두르는 사람들을 위해 5개 언어(JavaScript, Ruby, Python, Golang, PHP)의 예제가 제공됩니다.

단순 검색 솔루션은 사용 및 설정이 간단해야 합니다. 이와 같이 MeiliSearch는 모든 상자를 확인합니다! 계속 진행하려면 클릭 한 번으로 DigitalOcean에서 시작하십시오.

솔러

Apache 프로젝트의 일부인 Solr은 이제 몇 년 동안 사용되었습니다. ElasticSearch라는 인기 있는 검색 솔루션을 지원하는 잘 알려져 있고 매우 안정적인 Lucene 라이브러리를 기반으로 합니다. 이 모든 말은 Solr이 가장 ​​강력하고 확장 가능하며 표준을 준수하고 기능이 풍부하고 신뢰할 수 있는 검색 솔루션이라는 것을 의미합니다.

Disney, eBay, Netflix, Zappos 및 BestBuy와 같은 거대 기업에서 사용합니다. 그러나 이것이 더 작고 단순한 설치(예: 단일 시스템, 확장 없음, 장애 조치 없음 – 음, 때로는 괜찮음)를 실행하고 Solr이라는 강력한 기능을 사용할 수 없다는 것을 의미하지는 않습니다.

그렇다면 왜 Solr를 사용합니까?

여기에 몇 가지 훌륭한 이유가 있습니다.

정확하고 강력한

Solr는 세계에서 가장 정확하고 유능하며 강력한 검색 시스템 중 하나입니다. 게다가 오픈 소스이기 때문에 (앞서 언급한 것처럼) 유명 인사들이 그 자리에 선 이유를 설명합니다. 문서를 소화하고 검색 쿼리에 응답하는 능력은 타의 추종을 불허합니다.

간단한 설치 및 유지 보수

Solr를 설치하는 것은 프로그램의 압축을 풀고 실행하는 것만큼 간단합니다. 단순한 단일 기계 시스템의 경우 까다로운 유지 관리가 필요하지 않습니다. 일반적으로 검색 솔루션과 특히 Java 기반 기술은 RAM 사용량이 많을 수 있으므로 RAM 사용량을 주시하십시오(빠른 읽기/쓰기를 제공하기 위해 RAM에 모든 것을 유지하거나 유지하려고 하기 때문).

관리자 패널

Solr는 시각적 모니터링 및 구성을 허용하는 관리자 패널과 함께 제공됩니다. 약간의 교육으로 비개발자도 주요 차트를 읽는 법을 배울 수 있습니다. 이 목록에 있는 많은 검색 솔루션에는 이와 같은 기능이 제공되지 않습니다.

이미지 출처: 공식 사이트

API 기반, 표준 준수

  흰색으로 깜박이는 PS4 컨트롤러 수정

Solr는 JSON, CSV, XML 및 바이너리와 같은 여러 형식을 처리할 수 있는 API로 결과 인터페이스를 제공합니다. Java 개발자에게 큰 이점인 JMX 표준에 따라 모니터링 데이터를 출력합니다.

Solr에 찬성하여 할 말이 더 많지만 모든 것을 덮으려는 것은 우리를 종말에 이르게 할 것입니다. 😂 Solr는 최고 수준의 솔루션이며 어떤 유형의 데이터로 작업하든 절대 잘못될 수 없습니다.

엘라스틱서치

Elasticsearch는 자유 형식 텍스트 검색의 선구자였으며 지금도 틀림없습니다. 실제로 오늘날에도 프로그래머나 시스템 관리자에게 검색 엔진에 대한 추천을 요청하면 Elasticsearch가 유일한 이름일 가능성이 높습니다. 물론, 요즘에는 상당한 규모의 청크가 Algolia와 같은 것을 추천할 것입니다. 그러나 우리는 이미 그것이 어떻게 진행되는지를 다뤘습니다. 🤪

위 그림의 “무료 평가판 시작” 버튼에 현혹되지 마십시오. 핵심 Elasticsearch 기술 자체는 오픈 소스이며 무료이지만 회사는 노력으로 수익을 창출하고 기업을 대상으로 삼고 있습니다. 따라서 여기에서 볼 수 있는 것은 실제로 클라우드 서비스에 대한 평가판으로, 특히 관련 클러스터가 있는 경우 Elasticsearch를 쉽게 관리할 수 있습니다.

어, 풀어야 할 거미줄이 너무 많습니다. 요약하자면 Elasticsearch는 오픈 소스이며 무료이며 누구나 쉽게 설정하고 제한 없이 사용할 수 있습니다.

이제 예상대로 Elasticsearch를 선택한 이유를 살펴보겠습니다.

  • 완성도 높은 전투 테스트를 거친 검색 엔진. 이것은 “이상한” 버그가 있는 경우 솔루션을 찾을 가능성이 훨씬 더 높다는 것을 의미합니다.
  • 클러스터링, 확장성 및 비동기식 쓰기에 대한 최고 수준의 초점입니다.
  • 간단한 REST API를 통해 액세스할 수 있습니다(다른 모든 사람들이 복사한 것).
  • 문서 지향적이지만 필요한 경우 스키마를 지원합니다.
  • 엄청나게 빠르고 정확한 결과. 구성 가능한 검색 속도.
  • 양과 유용성 측면에서 뛰어난 문서.
  • 편리함을 위해 비용을 지불하고 싶다면 완전한 검색 및 분석 클라우드 플랫폼(ELK 스택).

Elasticsearch에 대해 내가 할 수 있는 유일한 선택은 엄청난 RAM 소비입니다. 내 말은, 컨설턴트로서 클라이언트가 월 20달러의 비용이 드는 서버에 투자하도록 설득하는 것은 충분히 어렵습니다. 슬프게도 Elasticsearch가 요구하는 것과는 거리가 멉니다.

Elasticsearch를 배우고 싶다면 이 Udemy 과정을 확인하십시오.

서체

Typesense는 가볍고 간단하지만 강력한 검색 엔진입니다. 유용함과 단순함을 찾는 사람들은 확실히 이것을 시도해야 합니다.

Typesense의 가장 좋은 점 중 하나는 웹사이트에서 바로 사용해 볼 수 있다는 것입니다. 그렇게 하면 모든 것을 설정하고 API를 시도하는 경우 좌절과 시간을 절약할 수 있습니다. . . 하나 이상의 기능이 원하는 방식으로 작동하지 않는다는 것을 알게 될 뿐입니다.

엔진에 버그가 있을 수 있다는 의미는 아닙니다. 엔진이 선호하는 내용이 아닐 수도 있고 비즈니스 도메인과 완전히 충돌할 수도 있습니다. 오타, 특수 기호, 동의어 등. . . 엔진이 출력하는 결과를 홈페이지에서 바로 확인할 수 있습니다(이를 위해 책 데이터베이스를 사용하고 있습니다).

보시다시피 이 섹션은 최상위 섹션 바로 아래에 있습니다. 검색 상자에 “tra”라는 검색어를 입력했고 그 아래에는 도서 데이터베이스의 일치하는 결과(메타데이터 – 전체 결과, 현재 페이지 등)가 표시됩니다.

Typesense는 검색 엔진을 선택하는 데 많은 도움이 됩니다.

  • 그 이면의 기술은 완전히 오픈 소스이며 환영합니다.
  • 필요한 경우 HA(고가용성) 설정을 쉽게 구성할 수 있습니다.
  • 검색어의 오타 및 기타 노이즈에 대해 관대합니다.
  • 검색 결과를 세밀하게 제어해야 하는 사용자를 위한 고급 필터링 시스템입니다.
  • 간단한 REST API, 비록 그들의 문서가 당신을 찾기 위해 더 열심히 일하게 만들겠지만!
  • 클라이언트(SDK)는 일부 주요 언어(JavaScript, Python, Ruby 및 PHP)에서 사용할 수 있습니다.

마지막으로, 새로운 서버를 설정하는 아이디어가 지겹다면 Typesense는 프로비저닝이 한 번의 클릭으로 이루어지는 클라우드 제품도 제공합니다. 요금은 시간 단위로 청구되며 읽기 및 쓰기는 무제한입니다. 솔직히 말해서, 사전에 가격을 책정하고 순 이익이 되는지 확인했다면 이것이 대부분의 기업에 더 나은 옵션이라고 말하고 싶습니다.

  Linux에서 Stremio를 사용하고 설치하는 방법

전반적으로 Typesense는 작고 매끄럽고 정확하고 실제 작업용 도구가 필요한 경우 많은 의미가 있습니다(말장난이 아닙니다!).

소닉

Sonic은 “몇 MB의 RAM”에서 실행되는 ElasticSaerch 대안임을 자랑스럽게 생각합니다.

이것이 어떻게 가능한지?

자, JVM(Java Virtual Machine)은 RAM을 많이 사용하는 것으로 알려져 있습니다(일반적으로 JVM을 시작하는 것은 약 1GB의 RAM을 차지합니다). 따라서 Rust 언어로 코딩된 것(개발자에게 완전한 제어 및 메모리 안전을 제공함)이 그만큼 빠르게 실행되고 몇 MB의 RAM만 사용할 수 있다는 것은 놀라운 일이 아닙니다.

진정하세요, 여러분! 바로 프로젝트 마스코트입니다.

글을 쓰는 시점에서 사용자 중에는 몇 개의 회사가 나열되어 있지만 이름을 추가하는 데 신경 쓰지 않은 회사가 몇 개 더 있을 것이라고 확신합니다. 정확한 시기나 방법은 기억나지 않지만 이전에 Sonic을 접한 적이 있습니다. 그 당시에는 메모리가 부족한 대안을 보고 기뻤지만 숨겨진 버그를 안정화하고 고칠 시간이 필요하다고 생각했습니다. 글쎄, 그들이 어느 정도 도착한 것 같습니다. Sonic이 얼마나 인기를 얻는지는 시간이 말해줄 것입니다.

자, 오랜 반추를 제쳐두고 조직/프로젝트에 Sonic을 사용하는 것을 고려해야 하는 이유는 무엇입니까?

다음은 몇 가지 이유입니다.

  • 검색 엔진이 사용하는 한 메모리 사용량이 매우 낮습니다.
  • 라이브러리는 모든 주요 프로그래밍 언어에 사용할 수 있습니다. Node, PHP, Rust는 작성자가 직접 발표한 것이고 다른 것들은 커뮤니티에서 만든 것입니다(Elixir 및 Nim과 같은 이국적인 뻣뻣함도 다루므로 기뻐하십시오!).
  • 여러 언어가 지원됩니다.
  • 뜻밖의 일! 새로운 언어를 사용할 수도 있고 엔진은 작동하지만(😂😂), 중지 단어와 같은 일부 고급 기능은 잃게 됩니다.
  • 매우 빠른 엔진. GitHub 페이지를 확인하면 수집 및 검색 시간이 여러 경우에 마이크로초 단위임을 알 수 있습니다! 물론 네트워크 대기 시간으로 인해 숫자가 이렇게 낮지 않을 것이기 때문에 이것은 단일 시스템 테스트였습니다.

이 엔진이 작동하는 모습을 보려면 이 링크(사용자 회사 중 하나)로 이동하여 거기에 있는 검색 상자를 사용하십시오.

검색 엔진으로서 Sonic에는 특정 제한 사항이 있습니다. 개발자는 GitHub 페이지에서 공개적으로 강조 표시하고 토론했습니다. 내 조언은 이 목록을 면밀히 검토하고 사용 사례가 해당 도메인과 공통되지 않는지 확인하는 것입니다. 즉, 모든 것에는 한계가 있습니다. 단지 그것들이 숨겨져 있을 뿐이고 너무 늦을 때까지 우리는 그것을 깨닫지 못합니다. 따라서 Sonic은 검색 엔진에 탁월한 선택이라고 생각합니다.

TNT검색

이제 이 목록에 매력적인 항목이 있습니다. 첫 번째 흥미로운 점은 이 기능이 완벽하고 프로덕션 준비가 된 검색 엔진이 PHP로 작성되었다는 것입니다!

예, 가능한 모든 언어 중에서 PHP입니다. 제가 PHP를 싫어해서가 아니라 PHP가 설계상 수명이 짧은 프로세스이기 때문입니다.

두 번째로 흥미로운 점은 최소한 글을 쓰는 시점에서 라이센스입니다. 실제로 라이선스 자체는 MIT이므로 문제가 없지만 작성자는 이 소프트웨어를 PS4Ware로 분류합니다. 프로덕션에서 TNTSearch를 사용하는 경우 PS4 게임을 보내야 합니다! 😂😂 이제 “해야 한다”는 말처럼 필수는 아니지만, 믿기지 않을 정도로 재미있습니다. 나는 또한 그들이 PS5 라이센스로 업그레이드하기를 희망하지만 지금은 너무 이르다.

어쨌든 강력한 PHP + Laravel 배경을 가지고 있기 때문에 이 분들의 노력에 감사드립니다. 그들의 웹 사이트에는 많은 정보가 없지만 그들이 컨설턴트임을 나타내는 것 같으므로 프로젝트가 있으면 그들에게 연락하는 것이 좋습니다!

이제 프로젝트에서 TNTSearch를 사용해야 하는 좋은 이유가 있습니까?

네, 있습니다:

  • PHP로, PHP용으로, PHP로 코딩했습니다. PHP 생태계에는 이와 같은 보다 전용의 고품질 솔루션이 필요합니다.
  • 퍼지 검색, 지리 검색 및 텍스트 분류와 같은 중요한 기능.
  • 많은 솔루션에서 누락된 주요 유연성인 검색 색인을 쉽게 변경할 수 있습니다.
  • 형태소 분석, BM25 순위 및 사용자 지정 토큰화는 높은 정확도를 보장합니다.
  • 다른 Composer 패키지와 마찬가지로 손쉬운 배포!

여기에서 엔진 성능을 확인하고 얼마나 빠르고 정확한지 직접 확인할 수 있습니다. PHP 측면을 다시 강조하고 싶습니다. PHP 프로젝트를 유지 관리하는 경우 가능한 한 PHP 벽 안에 머물기를 원할 것입니다(왜? 재교육 비용을 생각하세요). 그리고 그러한 경우 TNTSearch는 거부하기 어려운 가치 제안을 제공합니다!

  OLED vs. QLED, 그리고 더: 어떤 TV를 사야 할까요?

베스파

Vespa는 광범위하고 중량감 있는 제품입니다. 이 목록에 있는 다른 몇 가지 항목과 마찬가지로 이 목록은 너무 커서 몇 마디로 요약할 수 없습니다. 하지만 노력해야 하므로 그렇게 할 것입니다. 🙂 Vespa는 물론 검색 엔진이지만 일반 검색 엔진으로 사용하면 잠재력이 낭비됩니다.

Vespa는 끝없는 양의 데이터(빅 데이터)를 처리하고 그 위에 기계 학습 기반 기능과 끝없는 사용자 지정을 제공하도록 구축되었습니다.

Vespa는 스스로를 Elasticsearch 및 기존 데이터베이스의 경쟁자로 포지셔닝하고 언제 무엇을 사용해야 하는지에 대한 적절한 비교를 제공합니다.

보시다시피 머신 러닝 기반 작업에 더 가까이 다가가고자 할수록 Vespa는 더 많은 의미를 갖게 됩니다. 중소기업을 위한 순수 검색 엔진으로서 다른 옵션에 비해 장점이 없다고 생각합니다.

이제 지속적으로 방대한 양의 데이터를 생성하고 AI/ML(오늘날 많은 SaaS 비즈니스에 적합한 설명)을 통해 더 나은 의사 결정을 내리길 원한다는 점을 고려할 때 Vespa가 매우 적합한 이유는 다음과 같습니다.

  • 오픈 소스: 이상한 라이선스나 트래핑 계약이 없습니다. 그리고 그 외에 지불할 것은 없지만, 저는 회사가 가장 많이 사용하는 프로젝트에 정기적인 금액을 지불한다고 항상 강조합니다(월 $50라도 많은 도움이 될 것입니다).
  • 실시간: Vespa는 진정한 실시간입니다. 들어오는 데이터를 다이제스트, 크런치 및 검색만 할 수는 없습니다. 구성도 즉석에서 수정할 수 있습니다.
  • 확장 가능하고 관대함: Vespa는 규모가 작습니다. 또한 노드의 갑작스러운 소멸에 매우 잘 대응하여 높은 신뢰성을 제공합니다.
  • 순위 및 권장 사항: 검색, 순위 지정 및 Vespa 권장 사항은 구조화된 쿼리와 융합되어 진정으로 정확한 결과를 제공할 수 있습니다.
  • 무통 AI/ML: Vespa는 사전 훈련된 고품질 ML 모델과 함께 번들로 제공됩니다. 데이터를 정리하고 사용하기 위해 20명의 데이터 과학자를 고용할 필요가 없습니다.
  • 사용자 정의 플러그인: 개발자가 엔진 작동 방식을 변경해야 하는 경우 사용자 정의 Java 플러그인을 생성하는 데 도움이 되는 전체 API 세트가 있습니다.

Vespa는 의심할 여지 없이 방대하기 때문에 팀 규모, 기술 능력, 인프라 예산, 일일 데이터 볼륨 또는 기타 무엇이든 시작 계층을 약간 넘어선 팀에 대해 분명합니다. 이 부문에서 Vespa는 홈런을 칠 것이며 적극 권장됩니다.

암바

일부 비즈니스의 경우 검색 데이터가 이미 JSON 문서로 깔끔하게 변환 및 저장되지 않습니다. 오히려 단어의 진정한 의미에서 엉망입니다. Word, PDF, HTML 파일 등과 같은 모든 종류의 문서의 혼란스러운 모음입니다. 당신이 그들 중 하나이고 당신에게 희망이 없다고 생각한다면, 음, 안녕하세요 Ambar입니다!

Ambar의 가장 좋은 점은 다음과 같이 작업할 수 있는 대용량 파일입니다.

  • PowerPoint, Visio 및 Publisher를 포함한 MS Office 파일 형식(.docx, .xlsx 등)!
  • 오픈오피스 파일 형식
  • 정보를 추출하기 위해 자동 OCR이 적용된 PDF 문서.
  • 이미지
  • PST와 같은 이메일 아카이브 형식(안녕하세요, Outlook 사용자!)
  • 첨부 파일이 있는 이메일 메시지

굿즈도 여기서 끝이 아닙니다. Ambar는 대용량 파일(30MB 이상), ZIP 아카이브 및 멀티스레딩 작업을 통해 CPU를 최대한 활용하고 더 빠른 결과를 얻을 수 있습니다. 따라서 잊어버린 서버의 일부 디스크에 수년 동안의 문서가 있는 경우 다시 가져와 Ambar에 모든 것을 제공할 때입니다!

결론

검색 🔎은 강력하고, 검색은 마법이며, 검색은 어디에서나 가능합니다!

그것은 흑마법일 수도 있지만 오늘날에는 모든 사람이(물론 약간의 개발자 도움이 있으면) 그 이점을 얻을 수 없는 이유가 없습니다. 기업에서 개인, 정부에 이르기까지 이 목록의 검색 엔진은 기하급수적인 이점과 영향력을 가진 거의 제로에 가까운 서비스를 제공합니다.

계속해서 클라우드 서버를 가져와서 경험하고 싶은 위에 나열된 검색 소프트웨어를 설치하십시오.