針對Python學員在爬蟲階段學習時遇到的問題統整做介紹
提供大家在遇到問題時,可以先釐清問題並初步解決!

1. 網站跳轉:
Q:輸入網站,網站會跳轉到其他頁面
EX:京東購物網站:
A:因為會跳到台灣版網頁,請參考台灣版的網頁樣式來進行爬蟲
2.大陸手機:
Q:網站申請帳號需要大陸手機
A:請同學到這個網站https://tw.yinsiduanxin.com/china-phone-number.html去獲取暫時手機號碼及驗證信
3.代理IP:
Q:想練習使用代理IP,但網站無法進入或代理IP失效
A:請同學到這個網站http://www.freeproxylists.net/zh/去使用獲取免費的代理IP
(不過基本上台灣是不用代理IP就可以爬取資料,大陸因為政策關係才會比較需要代理IP)
所以代理IP內容在台灣非必需使用
4.Code_tarena網站:
Q:想使用code_tarena網站來練習輸入帳號和密碼,但網站無法進入
A:如果學員無法登陸,可以使用以下代替網站練習:
帳號: tarenacode
密碼: code_2013
5.網頁改版問題:
Q:網站頁面改版導致爬蟲失效,程式語法需要調整
A:詳見另外一份達内報報:Python-網頁改版之爬蟲失效
6.打碼雲平台失效: Q:打碼雲網站已經失效了 A:請改使用超級鷹這個平台,並參考這個:雲端資料夾
Comments