使用XML包将html表拖放到R数据帧中

如何使用XML包刮取html表

以巴西足球队的维基百科页面为例。我想在R中阅读,并将“巴西队与国际足联认可球队的所有比赛列表”表作为数据框。我该怎么做

…或更短的尝试:

库(XML)
图书馆(RCurl)
图书馆(rlist)
URL<-getURL(“https://en.wikipedia.org/wiki/Brazil_national_football_team“,.opts=list(ssl.verifypeer=FALSE))
表<-readHTMLTable(URL)
表<-list.clean(表,fun=is.null,recursive=FALSE)
n、 行<-unlist(lappy(表,函数(t)dim(t)[1]))

选中的表是页面上最长的表

表格[[which.max(n.rows)]]

发表评论