勉強したことのメモ

Webエンジニア / プログラマが勉強したことのメモ。

PHPにて文字のあいまい検索(文字のゆれ)を実装する方法

   2024/05/22  PHP

Googleで検索する際に、ちょっと間違えて入力してしまっても「もしかして○○?」のようにフォローしてくれる機能がある。これをPHPにて実装してみたい。以下にソースコード等をメモ。

 

実装方法

ソースコード

<?php
$test = array('りんご','みかん','パイナップル','オレンジ','キウイ');
$point = 0;
$per = 0;
$answer = '';

if (isset($_GET['str'])) {
    foreach ($test as $word) {
        $new_point = similar_text($word,$_GET['str'],$per);
        if (intval($per) == 100) { //100%一致した場合はループ抜ける
            $answer = '';
            break;
        }
        if ($point < $new_point && intval($per) > 80) { //一致度80%以上のもので一致度が高いものを選択
            $point = $new_point;
            $answer = $word;
        }
    }
}
?>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transtional//EN" "http://www.w3c.org/TR/html4/loose.dtd">
<meta http-equiv="content-type" content="text/html"/>
<meta cherset = "UTF-8">
<html lang="ja">
<head>
<title>タイトル</title>
</head>
<body>
    <form action="" method="get">
        <input type="text" name="str" value="<?=$_GET['str'];?>">
        <input type="submit" name="submit" value="あいまい検索"/>
    </form>
    <?=($answer) ? 'もしかして<strong>' . $answer . '</strong>' : '';?>
</body>
</html>

解説等

similar_text関数にて2つの文字列の間の類似性を検索するという内容になる。

また、similar_textの結果が37.373737%のように細かい小数で返ってきたりするのでintvalを使用している。

 

リファレンス

similar_text

https://www.php.net/manual/ja/function.similar-text.php

 

使いどころ

ユーザーの検索ログを取っておき検索件数の多い文字列を抽出して本プログラムと組み合わせるのが良さそう。

 - PHP

  関連記事

PHPにて指定した画像に対して、繰り返し透かし画像処理する方法

画像素材等のサイトで無料版の画像に対して「sample」等の透かし画像処理を行っ ...

PHPで「Warning: date(): It is not safe to…」エラーの対応方法

PHPでdate関数を使った際に「Warning: date(): It is ...

PHPにて「みんなの自動翻訳」のAPIで指定したテキストの言語判定する方法

迷惑メール対策等でメール本文が日本語のもののみ受信したい場合がある。ただ、本文内 ...

PHPにて配列の出力時にジェネレータを利用してメモリを節約する方法

PHPにて大量のデータが格納された配列をforeach等でループ処理するような場 ...

PHPでbool値(true / false)を文字列として出力する方法

PHPにてbool値(true / false)をechoで出力するとtrueは ...