다운로드 및 회원가입
무료$5무료 쿠폰
시작하기 주요기술

【스마트 모드】작업 편집창 | 웹 스크래핑 툴 | ScrapeStorm

2024-01-04 20:20:08
4733 차

개요:스마트 모드의 작업 편집창을 소개하는 글입니다. ScrapeStorm무료 다운로드

스마트 모드에서 새 작업을 만들면 페이지가 작업 편집창로 이동합니다. 이 튜토리얼에서는 스마트 모드의 작업 편집창에서 작업을 설정하는 방법을 보여 줍니다.

 

此图片的alt属性为空;文件名为editing1-1500x812.png

 

1.새로 고침

페이지를 로딩할 수 없는 상황이 발생하면 새로 고침 버튼을 클릭할 수 있습니다.

此图片的alt属性为空;文件名为refresh-1500x812.png

 

2.URL 편집

URL을 편집하려면 여기를 클릭하세요. 200개 이상이면 직접 로컬 파일을 수정하세요.
참고: 로컬 파일에서 URL을 가져오는 경우 소프트웨어에서 변경한 내용은 로컬 파일에 영향을 주지 않습니다.

URL 편집에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为edit-urls-1500x812.png

 

3. 로그인

로그인이 필요한 웹 페이지가 있으면 이 버튼을 클릭하여 로그인 기능을 사용하세요.

로그인 기능에 관한 자세한 내용은 여기를 클릭해 주세요.

此图片的alt属性为空;文件名为pre-login-1-1500x812.png

 

4. 사전 실행

사전 실행이 필요한 웹 페이지가 있으면 이 버튼을 클릭하여 사전 실행 기능을 사용하세요.

사전 실행 기능에 관한 자세한 내용은 여기를 클릭해 주세요.

此图片的alt属性为空;文件名为Pre-executed-operation-1-1500x804.png

 

5. Captcha 해결

스크래핑 작업중에 captcha인증이 필요하면 이 버튼을 클릭하여 captcha를 해결할 수 있습니다.

此图片的alt属性为空;文件名为Solve-Captcha-1-1500x805.png

 

6. 프록시 열기

홈페이지에서 captcha나 기타 방어 기능을 만났을 때, captcha 해결 기능과 함께 프록시 열기 기능을 사용할 수 있습니다.

프록시 열기에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为proxy-2-1500x809.png

 

7.웹 보안 옵션

웹 페이지에 문제가 발생한 경우 이 기능을 사용해 볼 수 있지만, 이 옵션을 활성화하면 페이지의 일부 내용이 스크랩되지 않을 수 있으니 유의하십시오. (예: iframe 내의 내용)

此图片的alt属性为空;文件名为Web-Security-Option-1-1500x809.png

 

8.고급 설정

고급 설정에서 pushState 및 차단된 URL을 볼 수 있습니다.

此图片的alt属性为空;文件名为Advanced-Settings-1-1500x807.png

此图片的alt属性为空;文件名为advanced-setting2-1500x812.png

 

9.브라우저 전환

일부 웹 페이지는 컴퓨터와 모바일 기기에서 다른 콘텐츠를 표시합니다. 소프트웨어는 기본적으로 컴퓨터 버전의 웹 페이지를 스크랩합니다. 사용자가 모바일 버전의 웹 페이지를 스크랩하려면 브라우저 모드를 전환하여 스크랩할 수 있습니다.

브라우저 모드 전환에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为Switch-Browser-1-1500x807.png

 

10.페이지 유형 설정

페이지 유형은 일반적으로 ScrapeStorm이 자동으로 인식합니다. 웹 페이지가 자동으로 인식되지 않으면 수동으로 인식하거나 xpath를 수정할 수 있습니다. ScrapeStorm은 디폴트로 목록형 페이지를 인식합니다. 상세 페이지인 경우 수동으로 수정해야 합니다.

페이지 유형 설정에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为page-1-1500x805.png

 

11. 페이징 설정

페이지 넘김 버튼은 일반적으로 ScrapeStorm이 자동으로 인식해 줍니다. 버튼이 자동으로 인식되지 않을 경우 버튼을 수동으로 선택하거나 xpath를 수정할 수 있습니다. 상세 페이지일 경우 없음을 선택할 수 있습니다.

 페이지 넘김 버튼 설정에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为paging-1-1500x807.png

 

12.스크래핑 범위 설정

이 기능을 사용하여 시작 페이지와 종료 페이지를 설정하고 데이터 스킵 및 작업 중지 조건을 설정할 수 있습니다.

스크래핑 범위 설정에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为range-1500x812.png

 

13. 필터링

데이터 필터링이 필요한 경우 이 버튼을 클릭하여 기능을 사용하십시오

데이터 필터링에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为filter-1500x812.png

 

14. 모두 비우기

ScrapeStorm이 자동으로 인식한 데이터가 만족스럽지 않은 경우 모두 비우기를 클릭하여 데이터를 지운 다음 필드 추가 기능을 사용하여 필요한 데이터를 선택할 수 있습니다.

此图片的alt属性为空;文件名为clear-1500x812.png

 

15. 심층 스크래핑

상세 페이지에서 데이터를 스크래핑해야 하는 경우 이 기능을 사용하여 스크래핑할 수 있습니다.

심층 스크래핑에 대한 자세한 내용을 보려면 여기를 클릭하세요.

此图片的alt属性为空;文件名为scrape-in-1-1500x812.png

 

16. 필드 추가

새 필드를 추가해야 할 경우 이 버튼 클릭해 추가하십시오.

此图片的alt属性为空;文件名为add-field-1500x812.png

 

17. 시작

작업이 완료되면 시작 버튼을 클릭하여 실행 설정창으로 이동할 수 있습니다.

此图片的alt属性为空;文件名为start-1500x812.png

 

18. 저장

작업 설정 과정에서 데이터가 손실되는 것을 방지하기 위해 “저장”버튼을 클릭하여 작업을 저장합니다. 또는 옆의 “시작”버튼을 클릭하여 저장할 수도 있습니다.

php크롤러 페이지를 word로 다운로드 데이터를 자동으로 excel로 내보내기 파이썬 크롤러 동영상 대량 다운로드 URL 대량 생성 정기적으로 일치하는 이메일 주소 파이썬 스크래핑 파이썬 다운로드 파일 사진 대량 다운로드
关闭