勉強したことのメモ

Webエンジニア / プログラマが勉強したことのメモ。

PHPにて文字のあいまい検索(文字のゆれ)を実装する方法

   2024/05/22  PHP

Googleで検索する際に、ちょっと間違えて入力してしまっても「もしかして○○?」のようにフォローしてくれる機能がある。これをPHPにて実装してみたい。以下にソースコード等をメモ。

 

実装方法

ソースコード

<?php
$test = array('りんご','みかん','パイナップル','オレンジ','キウイ');
$point = 0;
$per = 0;
$answer = '';

if (isset($_GET['str'])) {
    foreach ($test as $word) {
        $new_point = similar_text($word,$_GET['str'],$per);
        if (intval($per) == 100) { //100%一致した場合はループ抜ける
            $answer = '';
            break;
        }
        if ($point < $new_point && intval($per) > 80) { //一致度80%以上のもので一致度が高いものを選択
            $point = $new_point;
            $answer = $word;
        }
    }
}
?>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transtional//EN" "http://www.w3c.org/TR/html4/loose.dtd">
<meta http-equiv="content-type" content="text/html"/>
<meta cherset = "UTF-8">
<html lang="ja">
<head>
<title>タイトル</title>
</head>
<body>
    <form action="" method="get">
        <input type="text" name="str" value="<?=$_GET['str'];?>">
        <input type="submit" name="submit" value="あいまい検索"/>
    </form>
    <?=($answer) ? 'もしかして<strong>' . $answer . '</strong>' : '';?>
</body>
</html>

解説等

similar_text関数にて2つの文字列の間の類似性を検索するという内容になる。

また、similar_textの結果が37.373737%のように細かい小数で返ってきたりするのでintvalを使用している。

 

リファレンス

similar_text

https://www.php.net/manual/ja/function.similar-text.php

 

使いどころ

ユーザーの検索ログを取っておき検索件数の多い文字列を抽出して本プログラムと組み合わせるのが良さそう。

 - PHP

  関連記事

PHPで指定日から曜日を割り出す

曜日ってどうやって割り出すの? となったのでメモ。 ■リファレンス http:/ ...

PHPにてHTML / 画像ファイルをPDFファイル化する方法(mPDF)

PHPにてHTML / 画像ファイルをPDFファイル化したい。検索してみるもサー ...

PHPで「ramsey/uuid」ライブラリを用いてUUIDを生成する方法

PHPでUUID(Universally Unique Identifier)を ...

【2024年版】PHPMailerでGmailのSMTPサーバを経由してメールを送信する方法

だいぶ前に同じようなことをメモしたが、そちらの方法だと送信できずエラー内容を見た ...

PHPにてhosts設定を行った上で他サイト・サーバにアクセスする方法

開発中の案件だとhosts設定を行ってサーバにアクセスする、ということがある。作 ...