Php中的HTML抓取[重复]

这个问题在这里已经有答案了
如何在PHP中解析和处理HTML/XML?

(31个答案)

七年前关闭的

我一直在使用正则表达式在PHP中进行HTML抓取。这是可行的,但结果是挑剔和脆弱的。有人使用过提供更健壮解决方案的软件包吗?配置驱动的解决方案是理想的,但我并不挑剔

在从页面中删除HTML之后,我建议使用PHP简单HTML DOM解析器。它支持无效的HTML,并提供了一种处理HTML元素的非常简单的方法

发表评论