技術, 實作應用 有了模型然後呢?從資料模型到數據產品 當你想打造一個「數據產品」時,僅有資料模型的解讀靜態報告是不夠的,一個更貼近使用者應用場景的解決方案是必須的。從資料科學模型到產品之間,還有哪些事情必須要顧慮?
技術, 實作應用, python 爬蟲開發者必學:讓 Python 讀懂「滑動驗證碼」 動態網頁與靜態網頁最大的不同是資料是在什麼時間點取得的,動態網頁是在瀏覽器已經取得 HTML 後,才透過 JavaScript 在需要時動態地取得資料。因此,爬蟲程式也必須要考慮動態取得資料這件事情,才有辦法正確地找到想要的資料。「滑動驗證碼(Slider Captcha)」是驗證碼機制當中常見的典型,也是防範爬蟲程式中一種難纏的對手。這一篇文章將會利用 Python 、opencv 與 Selenium 三個工具,示範如何拆解和模擬滑動驗證碼。
技術, 實作應用, python 從Python到爬蟲,給新手學習地圖與策略 資料爬蟲是資料分析的起手式,必須有好的、可用的資料才得以進行高品質的資料科學專案。而過去的資料來源多半來自於公司內部的資料庫或資料倉儲系統,仰賴於工程師跟 IT 部門的支援。但隨著 Big Data 的技術到位,實務上對於資料的要求更加大量也更加多元。因此,利用程式與資料爬蟲收集資料是目前資料來源的一個重要的管道。
開啟資料專案前,必須知道的 N 件事 「你懂資料,資料就會幫你!」當今許多企業已認知到資料的重要性,但在與眾多企業接觸的經驗中,我們發現多數人對於如何善用資料仍不清楚。本篇文章將分享:在使用資料前,有哪些重點必須注意?
如何打造高效率的資料團隊?實務上常被忽略的三大問題 資料科學家、資料分析師,以及資料工程師是組成一個資料專案團隊最基本的三種角色,但是,在實務上,資料團隊又有哪些常見的狀況需要解決呢?本篇文章,將詳細說明一個好的資料專案團隊該如何分工,才能有效因應公司的需求與應用。
身為資料科學家,R、Python 與 Julia 該怎麼選? 人工智慧發展如日中天,如何和電腦對話逐漸成為現代人必備的技能之一。然而,程式語言百百種,如何選擇自己適合的工具就很重要。這篇文章以一個資料科學家的觀點出發,分析當前熱門的三種程式語言,希望對讀者有所裨益。