利用python自動更新資料庫—總述
06-07
利用python自動更新資料庫—總述
推薦閱讀:
前言
本系列文章是基於本人在某大型互聯網公司的實踐,記錄下,以分享和交流,轉載時請註明出處,謝謝。
面向對象
資料庫維護人員、數據分析師、爬蟲開發工程師等,需要有一定python基礎,若對pandas、selenium兩個庫了解的話會更信手拈來。
背景
傳統數據更新流程為:人工登錄網站系統→選取點擊以及等待下載→數據處理→數據入庫→執行相關儲存過程(ETL)→通知相關人員已更新
以上過程存在明顯的問題:機械重複,佔用人力,耗時長。為了解決以上問題,筆者利用了python作為工具建立一套自動更新的體系,實現上述流程的自動化,具體如下:

根據上圖的設計思路,使得數據的更新效率有了較大的提高以及解放人力了。
後面幾篇文章會分成了五個小節描述下具體的實現操作,為儘可能讓更多人理解,內容由淺講起,望理解。
推薦閱讀:
※藏頭詩人李白——Python的簡單實現
※python動態的網頁數據json里沒有中文字元怎麼辦?
※如何使用python做中文情感分析
※使用python操縱metasploit簡單小記
※python3機器學習經典實例-第八章解剖時間序列和時序數據33
