1.爬取網頁後,從html頁面中提取客戶id、評論時間、評分、評論內容、口味、環境、服務、店鋪ID等所需字段信息,存儲在MYSQL數據庫中。
2.發現完整的評論存儲在‘div’和‘main-review’中,有些頁面口味、環境和服務並不是每個頁面都有的,所以需要使用tryexcept來防止程序中斷。
3,使用MYSQL數據庫,python使用pymysql連接MYSQL數據。需要先建立數據庫和表,然後連接和定義遊標,編寫相應的sql語句,執行事務。