
Apache Solrは、全文検索、ヒットハイライト、ファセット検索、リアルタイムインデックス、動的クラスタリングを実行できるオープンソースの検索プラットフォームです。データベース統合、高度なドキュメント処理機能、そしてユーザーフレンドリーなWebベースのUIを備えています。膨大な量のデータを検索する必要がある場合、このツールはまさに必要としているツールかもしれません。Apache Solrは、高トラフィックに最適化されており、高いスケーラビリティとフォールトトレランスを備えています。
参照: 採用キット: データベースエンジニア(TechRepublic Premium)
Ubuntu Server 22.04 (Jammy Jellyfish) のインスタンスに Apache Solr をインストールして実行するための簡単な手順を説明します。
必要なもの
Apache Solrを正常にインストールするには、Ubuntu Server 22.04のインスタンスとsudo権限を持つユーザーが必要です。もちろん、Apache Solrは他のLinuxディストリビューションにもインストールできますが、ここでは私が愛用しているサーバーに絞って説明します。
それではインストールに移りましょう。
Apache Solrのインストール方法
Ubuntu Server インスタンスにログインし、次のコマンドで Java をインストールします。
sudo apt-get install default-jdk -y
Java をインストールしたら、次のコマンドで Apache Solr をダウンロードします。
wget https://downloads.apache.org/lucene/solr/8.11.1/solr-8.11.1.tgz
Apache Solr のダウンロード ページにアクセスして、アプリケーションの最新バージョンをダウンロードしていることを確認してください。
パッケージをダウンロードしたら、次のコマンドで解凍します。
tar -xvzf solr-8.11.1.tgz
新しく作成されたディレクトリには、ほぼすべての作業を自動的に処理する便利なインストールスクリプトが含まれています。このスクリプトを実行するには、次のコマンドを実行します。
sudo ./solr-8.11.1/bin/install_solr_service.sh solr-8.11.1.tgz
スクリプトが終了したら、次のコマンドで Apache Solr を起動して有効にします。
sudo systemctl enable --now solr
コレクションを作成する方法
次に、データを格納するためのコレクションを作成します。ただし、その前に、インストーラースクリプトの実行中に追加されたSolrユーザーのパスワードを作成する必要があります。これを行うには、次のコマンドを実行します。
sudo passwd solr
ユーザーの新しいパスワードを入力して確認するよう求められます。
ここで、次のコマンドを使用してコレクションを作成できます。
su - solr -c "/opt/solr/bin/solr create -c datacollection -n data_driven_schema_configs"
solr ユーザー用に作成した新しいパスワードの入力を求められます。
作成が完了したら、次のコマンドを使用してコレクションにサンプル データを追加しましょう。
./bin/post -c datacollection example/exampledocs/*
これで、Web ベースのインターフェースにアクセスする準備が整いました。
Apache SolrのWebベースインターフェースにアクセスする方法
Webブラウザを開き、http://SERVER:8983にアクセスします。「Core Selector」ドロップダウン(図A)から、「datacollection」(先ほど作成したもの)を選択します。
図A

データ収集を選択すると、概要画面が表示され、すでにデータが含まれていることがわかります。「クエリ」をクリックし、オプションを変更して「クエリ実行」をクリックすると、そのデータを検索できます(図B)。
図B

おめでとうございます。Apache Solr のインストール、新しいデータ コレクションの作成、サンプル データの追加、データに対するクエリの実行が正常に完了しました。
Jack Wallen によるビジネス プロフェッショナル向けの最新のテクノロジー アドバイスをすべて知るには、YouTube でTechRepublic の How To Make Tech Work を購読してください。