Python/Web Crawling
[XPath] XPath
권멋져
2022. 8. 6. 15:20
XPath
XPath는 XML에서 사용하는 요소나 속성을 지정할 수 있다.
scrapy에서는 XPath를 통해 Element를 지정할 수 있다.
문법
- // : 최상위 Element = css selector : (.class p)
- *[@class = "class_sample"] : 속성값으로 Element 선택, @는 지정할 속성 " " 에는 속성에 대한 속성명이 입력된다.
- / : 한 단계 하위 Element = css selector : (.class > p)
- [n] : n 번째 Element
예시로 크롬 개발자 도구를 사용해 XPath를 가져오고 문법에 따른 관계를 살펴보자
Element에 우클릭 -> Copy -> Copy XPath 를 하면 클립보드에 XPath가 저장된다.
//*[@id="NM_FAVORITE"]/div[1]/ul[1]/li[2]/a
최상위 엘리먼트중에서
id가 "NM_FAVORITE 인 Element 아래
div 태그 중 첫번째 아래
ul 태그 중 첫번째 아래
li 태그 중 첫번째 아래
a 태그
가 복사해온 태그의 XPath다.