勉強したことのメモ

Webエンジニア / プログラマが勉強したことのメモ。

UTF-16にエンコードされている文字列をUTF-8へデコード

   2024/03/04  PHP

エンコードされている文字列であまり見かけない感じのものがあった。UTF-8やShift-JIS、EUC-JPではなく、色々調べるとUTF-16でエンコードされていた。以下でUTF-8にデコードできた。

 

ソースコード

<?php
$body = '\u30c6\u30b9\u30c8';
$decoded = preg_replace_callback(
    '|\\\\u([0-9a-f]{4})|i', 
    function($matched){
        return mb_convert_encoding(pack('H*', $matched[1]), 'UTF-8', 'UTF-16');
    }, 
    $body
);
echo $decoded;//テストと表示される。

 

参考サイト

http://kanonji.info/blog/2014/07/09/php%E3%81%A7unicode%E3%82%A8%E3%82%B9%E3%82%B1%E3%83%BC%E3%83%97%E3%82%B7%E3%83%BC%E3%82%B1%E3%83%B3%E3%82%B9%E3%82%92%E3%83%87%E3%82%B3%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B/

 - PHP

  関連記事

CodeIgniter3でファイルキャッシュする方法
CodeIgniter3でファイルキャッシュする方法

CodeIgniterでファイルキャッシュが楽に導入できた。そこそこ使いそうなの ...

PHPでクエリ内容を取得する
PHPでクエリ内容を取得する

エラーログを確認している際によく分からない動作に なっているところがあった。 ペ ...

htmlspecialcharsを通してMySQLに格納したものを元に戻して出力
htmlspecialcharsを通してMySQLに格納したものを元に戻して出力

MySQLにHTMLタグを入れたくない場合にhtmlspecialcharsを使 ...

PHPからMySQLにシリアライズしたデータを格納
PHPからMySQLにシリアライズしたデータを格納

アンケートフォームみたいなのがあって、 今後も定期開催し、尚且つ質問内容は増減す ...

カンマ区切りの文字列で最後のカンマを排除
カンマ区切りの文字列で最後のカンマを排除

文字列をカンマ区切りにして、カンマを取り外して 配列にする際、頭もしくはお尻につ ...