PHPでサイトURLからtitleとRSS用URLを取得
2024/04/17
サイトのURLからRSS用URLとサイトタイトルを自動で取得したかった。その方法のメモ。
ソースコード
<?php function findFeedUrl( $url ){ if ( !$url ) return false; $html = file_get_contents($url); if( !$html ) return false; $title = (preg_match('/<title>(.*?)<\/title>/i', mb_convert_encoding($html, 'UTF-8', 'ASCII,JIS,UTF-8,EUC-JP,SJIS'), $result)) ? $result[1] : ''; preg_match_all('/<link\s+(.*?)\s*\/?>/is', $html, $matches); $links = $matches[1]; $finalLinks = array(); foreach ($links as $idx=>$link) { $attributes = preg_split('/\s+/s', $link); foreach ($attributes as $attribute) { $att = preg_split('/\s*=\s*/s', $attribute, 2); if(isset($att[1])) { $att[1] = preg_replace('/([\'"]?)(.*)\1/', '$2', $att[1]); $finalLink[strtolower($att[0])] = $att[1]; } } $finalLinks[$idx] = $finalLink; } $href = null; foreach ($finalLinks as $finalLink) { if (!array_key_exists('type', $finalLink)) { continue; } switch (strtolower($finalLink['type'])) { case 'application/x.atom+xml': case 'application/atom+xml': case 'application/xml': case 'text/xml': case 'application/rss+xml': case 'application/rdf+xml': if (array_key_exists('href', $finalLink)) { $href = $finalLink['href']; } break; default: break; } if ($href) { if (strstr($href, 'http://') !== false) { $fullUrl = $href; } else { $urlParts = parse_url($url); $fullUrl = "http://{$urlParts['host']}"; if (isset($urlParts['port'])) { $fullUrl .= ":{$urlParts['port']}"; } if ($href{0} != '/'){ if (isset($urlParts['path'])) { $fullUrl .= dirname($urlParts['path']); } if (substr($fullUrl, -1) != '/') { $fullUrl .= '/'; } } $fullUrl .= $href; } return array($fullUrl, $title); } } return false; } var_dump(findFeedUrl('https://taitan916.info/blog/')); //array(2) { [0]=> string(37) "https://taitan916.info/blog/?feed=rss2" [1]=> string(30) "勉強したことのメモ。" }
関連記事
-
-
PHPで日時のフォーマットをISO 8601型とDateTime型を相互に変換する方法
他社のAPI等のレスポンスで日時部分が「YYYY-MM-DDTHH:II:SSZ ...
-
-
PHP8系で「Warning: Attempt to read property "xxxxxx" 」エラーの対応方法
PHP8系&WordPress6.4.3で「Warning: Attem ...
-
-
セレクトメニューとテキストエリアの連動
やりたかった事は、 ・セレクトメニューで何れかを選択すると連動したテキストエリア ...
-
-
PHP-FPMのプロセス設定を行いサーバのメモリ消費を抑える方法
CentOS7からAlmaLlinux8に移行してから微妙にサーバのレスポンスが ...
-
-
PHPのdefine()で配列データの定義と利用方法について
他社が作成したPHPのソースコードを拝見した際に定数で配列が定義されていた。配列 ...