使用简单的 html dom 解析器通过每个元素的两个或多个属性来查找部分
Finding part with simple html dom parser by two or more attributes per one element
我想说,我知道,很多人认为,简单的 HTML DOM 解析器对于 HTML 解析器来说是一个非常糟糕的选择。我现在仍然需要使用它。
我阅读了一些文章,其中描述了如何通过每个元素的两个或多个属性进行搜索。
他们提出了类似的东西和数组过滤的一种可能性
foreach ( tag[attr1=value] as tag1 )
{
foreach ( tag[attr2=value] as tag2 )
{
// print tag2[attr1=value,attr2=value]
}
}
foreach($dom->find('tag[attr1][attr2]') as $stuff){
echo $stuff;
}
$doc = new DOMDocument();
@$doc->loadHTML( $html );
$xpath = new DOMXpath( $doc );
$elements = $xpath->query("//*/div[@class='name'][@id='someId']" );
if ( $elements->length > 0 )
{
foreach ( $elements as $index => $node )
{
//get node detail here
}
}
我的问题是关于通过两个属性查找部分的本机可能性。我没有在手册中找到它,但并非所有内容都始终在手册中。
有没有人知道有没有这种方式或类似的tag2[attr1=value,attr2=value]或tag2[attr1=value attr2=value]等?
大概八年后,他们想出了一个更新版本。
要使用具有多个属性的简单 HTML DOM 解析器,
foreach ( tag[attr1=value] as tag1 )
{
foreach ( tag[attr2=value] as tag2 )
{
// print tag2[attr1=value,attr2=value]
}
}
foreach($dom->find('tag[attr1][attr2]') as $stuff){
echo $stuff;
}
$doc = new DOMDocument();
@$doc->loadHTML( $html );
$xpath = new DOMXpath( $doc );
$elements = $xpath->query("//*/div[@class='name'][@id='someId']" );
if ( $elements->length > 0 )
{
foreach ( $elements as $index => $node )
{
//get node detail here
}
}
据我所知,目前没有办法做到这一点。它应该由该脚本的作者或其他愿意继续开发该项目的开发人员进行编辑。不知道许可证是否允许。
foreach ( tag[attr1=value] as tag1 )
{
foreach ( tag[attr2=value] as tag2 )
{
// print tag2[attr1=value,attr2=value]
}
}
foreach($dom->find('tag[attr1][attr2]') as $stuff){
echo $stuff;
}
$doc = new DOMDocument();
@$doc->loadHTML( $html );
$xpath = new DOMXpath( $doc );
$elements = $xpath->query("//*/div[@class='name'][@id='someId']" );
if ( $elements->length > 0 )
{
foreach ( $elements as $index => $node )
{
//get node detail here
}
}
据我所知,查看了 simple_html_dom,除了嵌套的 foreach 循环之外,没有其他方法可以实现您正在寻找的功能。 tag[attr=val][attr2=val]
没有内置支持
此外,每个选择器的作用只是添加到返回的节点,永远不会从它身上拿走,所以我尝试过类似 tag.class[attr=val] or tag#id[attr=val] 的工作,它会模仿一些类似的功能。
同样,我尝试了 $html->find("div[attr=val]")->find("div[attr2=val2]") 但这也失败了,因为简单 HTML DOM 返回一个节点数组而不是一个新的树对象,这使得链接变得不可能。
最好的方法是您在问题中发布的方式。
以前从未使用过简单的 HTML DOM 解析器。但是它的主页说它以 jQuery 方式工作,所以试试 tag[attr1=value][attr2=value] (jQuery: Multiple Attribute Selector)