Sitemap(站点地图)是网站内容的模型,旨在帮助用户和搜索引擎导航网站。站点地图可以是按主题组织的页面(带链接)的分层列表,组织结构图或向搜索引擎爬行机器人提供指令的 XML 文档。
如果我们需要用PHP分析这些url地址,我们就需要先读取sitemap.xml文件。

代码

PHP自带sitemap读取的函数,可以不用fopen的方式,我们需要用的是simplexml_load_file函数。

本程序先是读取sitemap.xml文件,然后存储到数组里。

1
2
3
4
5
$xml = simplexml_load_file('sitemap.xml');
$urls = array();
foreach ($xml->url as $url) {
$urls[] = $url->loc;
}

数组$urls里包含该网站所有的地址。