验证文档是否遵循某个HTML版本(最好是我可以指定的版本)的最佳方法是什么?我希望能够知道失败发生在哪里,比如在基于web的验证器中,除了在本机Python应用程序中
PyTidyLib是一个很好的用于HTML的python绑定。他们的例子是:
来自tidylib导入tidy_文档的
文件,错误=TINDY_文件('''<;p>;f&;otilde;o<;img src='https://stackoverflow.com/questions/35538/bar.jpg“>;”,
选项={'numeric-entities':1})
打印文档
打印错误
此外,它与传统的HTMLTidy和新的Tidy-html5兼容