다운로드 및 회원가입
무료$5무료 쿠폰
시작하기 주요기술

【스마트 모드】【순서도 모드】상세페이지의 링크를 스크랩하는 방법 | 웹 스크래핑 툴 | ScrapeStorm

2024-01-05 16:00:35
1453 차

개요:이 글 에서는 상세페이지의 링크를 스크랩하는 방법에 대해서 설명합니다. ScrapeStorm무료 다운로드

데이터를 스크랩할 때 상세페이지의 링크를 스크랩해야 하는 경우가 많습니다. 이 글에서는 ScrapeStorm 스마트 모드를 사용하여 상세페이지의 링크를 스크랩하는 방법을 세 가지 방법으로 설명할 것입니다. 순서도 모드에서도 적용됩니다.

 

방법1: 자동 감지

스마트 모드는 리스트를 자동으로 감지합니다. 일반적으로 리스트가 감지되면 상세 페이지의 링크도 감지됩니다.

此图片的alt属性为空;文件名为auto-scrape-1500x812.png

참고: 자동 감지가 정확하지 않은 경우 수동으로 리스트를 선택할 수도 있습니다.

더 상세한 내용을 아시려면 아래의 튜얼리얼을 참고해주세요.

리스트 페이지를 스크랩하는 방법

방법2: 심층 스크래핑을 통해

리스트 감지 과정에서 상세페이지의 링크를 감지할 수 없는 경우가 종종 발생합니다. 이때 “심층 스크래핑”을 사용해서 상세페이지로 들어가 상세페이지의 링크를 스크랩할 수 있습니다.

1)  리스트가 감지된 후 상세페이지의 링크가 있는 데이터를 감지할 필드를 추가합니다. 소프트웨어가 자동으로 필드를 생성합니다.

참고: 링크가 있는 데이터는 일반적으로 글의 제목 또는 제품 이름 등입니다. 브라우저에서 조작하면 확인할 수 있습니다.

此图片的alt属性为空;文件名为scrape-in1-1500x773.png

2)생성된 필드를 마우스 오른쪽 버튼으로 클릭하고 “추출 유형”을 설정한 후 “링크 URL”을 선택합니다.

此图片的alt属性为空;文件名为scrape-in2-1500x808.png

3)“심층 스크래핑”을 클릭해서 상세페이지로 들어갑니다.

더 상세한 내용을 아시려면 아래의 튜얼리얼을 참고해주세요.

심층 스크래핑 기능의 사용법

此图片的alt属性为空;文件名为scrape-in3-1500x812.png

4)상세페이지 입력 후 임의로 필드를 추가한 후 생성된 필드를 마우스 오른쪽 버튼으로 클릭하고 “특수값”을 선택해서 “페이지 URL”을 선택합니다.

此图片的alt属性为空;文件名为scrape-in4-1500x808.png

방법3: 스플라이싱을 통해 링크 획득

위의 방법들 중 어느 것도 상세페이지의 링크를 성공적으로 스크랩 할 수 없지만 XPath정규 표현을 사용하여 상세페이지의 ID를 스크랩할 수 있다면, “데이터 처리”를 사용하여 스플라이싱해서 상세페이지의 링크를 가져올 수 있습니다.

참고: XPath 또는 정규 표현식을 모르는 경우 저희에 문의해 주세요. 저희는 주문제작 서비스도 있습니다~

此图片的alt属性为空;文件名为1-1500x757.png

此图片的alt属性为空;文件名为2-1500x812.png

필드를 마우스 오른쪽 버튼으로 클릭하고 “데이터 처리”를 선택하며 “추가”버튼을 클릭하고 “접두사 추가”를 선택합니다.

此图片的alt属性为空;文件名为3-1500x780.png

이렇게 해서 상세페이지의 링크를 얻을 수 있습니다.

此图片的alt属性为空;文件名为2-1500x812.png

데이터를 자동으로 excel로 내보내기 파이썬 스크래핑 파이썬 크롤러 URL 대량 생성 페이지의 키워드를 추출하기 동영상 대량 다운로드 파이썬 다운로드 파일 php크롤러 정기적으로 일치하는 이메일 주소 페이지를 word로 다운로드
关闭