다운로드 및 회원가입
무료$5무료 쿠폰
시작하기 주요기술

【스마트 모드】【순서도 모드】상세페이지의 링크를 스크랩하는 방법 | 웹 스크래핑 툴 | ScrapeStorm

2024-01-05 16:00:35
1107 차

개요:이 글 에서는 상세페이지의 링크를 스크랩하는 방법에 대해서 설명합니다. ScrapeStorm무료 다운로드

데이터를 스크랩할 때 상세페이지의 링크를 스크랩해야 하는 경우가 많습니다. 이 글에서는 ScrapeStorm 스마트 모드를 사용하여 상세페이지의 링크를 스크랩하는 방법을 세 가지 방법으로 설명할 것입니다. 순서도 모드에서도 적용됩니다.

 

방법1: 자동 감지

스마트 모드는 리스트를 자동으로 감지합니다. 일반적으로 리스트가 감지되면 상세 페이지의 링크도 감지됩니다.

此图片的alt属性为空;文件名为auto-scrape-1500x812.png

참고: 자동 감지가 정확하지 않은 경우 수동으로 리스트를 선택할 수도 있습니다.

더 상세한 내용을 아시려면 아래의 튜얼리얼을 참고해주세요.

리스트 페이지를 스크랩하는 방법

방법2: 심층 스크래핑을 통해

리스트 감지 과정에서 상세페이지의 링크를 감지할 수 없는 경우가 종종 발생합니다. 이때 “심층 스크래핑”을 사용해서 상세페이지로 들어가 상세페이지의 링크를 스크랩할 수 있습니다.

1)  리스트가 감지된 후 상세페이지의 링크가 있는 데이터를 감지할 필드를 추가합니다. 소프트웨어가 자동으로 필드를 생성합니다.

참고: 링크가 있는 데이터는 일반적으로 글의 제목 또는 제품 이름 등입니다. 브라우저에서 조작하면 확인할 수 있습니다.

此图片的alt属性为空;文件名为scrape-in1-1500x773.png

2)생성된 필드를 마우스 오른쪽 버튼으로 클릭하고 “추출 유형”을 설정한 후 “링크 URL”을 선택합니다.

此图片的alt属性为空;文件名为scrape-in2-1500x808.png

3)“심층 스크래핑”을 클릭해서 상세페이지로 들어갑니다.

더 상세한 내용을 아시려면 아래의 튜얼리얼을 참고해주세요.

심층 스크래핑 기능의 사용법

此图片的alt属性为空;文件名为scrape-in3-1500x812.png

4)상세페이지 입력 후 임의로 필드를 추가한 후 생성된 필드를 마우스 오른쪽 버튼으로 클릭하고 “특수값”을 선택해서 “페이지 URL”을 선택합니다.

此图片的alt属性为空;文件名为scrape-in4-1500x808.png

방법3: 스플라이싱을 통해 링크 획득

위의 방법들 중 어느 것도 상세페이지의 링크를 성공적으로 스크랩 할 수 없지만 XPath정규 표현을 사용하여 상세페이지의 ID를 스크랩할 수 있다면, “데이터 처리”를 사용하여 스플라이싱해서 상세페이지의 링크를 가져올 수 있습니다.

참고: XPath 또는 정규 표현식을 모르는 경우 저희에 문의해 주세요. 저희는 주문제작 서비스도 있습니다~

此图片的alt属性为空;文件名为1-1500x757.png

此图片的alt属性为空;文件名为2-1500x812.png

필드를 마우스 오른쪽 버튼으로 클릭하고 “데이터 처리”를 선택하며 “추가”버튼을 클릭하고 “접두사 추가”를 선택합니다.

此图片的alt属性为空;文件名为3-1500x780.png

이렇게 해서 상세페이지의 링크를 얻을 수 있습니다.

此图片的alt属性为空;文件名为2-1500x812.png

정기적으로 일치하는 이메일 주소 파이썬 스크래핑 페이지를 word로 다운로드 URL 대량 생성 데이터를 자동으로 excel로 내보내기 사진 대량 다운로드 php크롤러 파이썬 다운로드 파일 동영상 대량 다운로드 페이지의 키워드를 추출하기
关闭