時間序列分析(Time Series Analysis)(1):基本理論

時間序列分析(Time Series Analysis),可以看作是資料分析中的一種特殊資料型態,是新手資料科學家常常接到的任務,也是日常生活中很常碰到的話題。本篇我們介紹幾種時間序列分析的基礎理論,和實踐中需要注意的事項。

資料科學(Data Scientist, Data analyst)求職準備清單

資料科學家、分析師,重新進入求職市場時,需要做哪些準備?本篇我們整理一份清單,包含過往的相關文章,針對『資料』相關工作,準備尋求新的職業發展、找下一份工作的夥伴做參考。

實驗中常見錯誤:無效重複、假重複、操作副作用與誤用 p-value

在『實驗的基本概念』一文中我們介紹了『實驗』的基本要素,本篇我們來盤點在工作中,常見的實驗相關錯誤。很多時候犯這些錯誤(或是無法分辨錯誤)的人並不是資料專業,但是身處的職位還是需要了解如何正確做實驗,才能做出正確決策。

淺談 case interview(4):資料分析與資料科學

本篇我們討論資料分析師*(data analyst)崗位 case interview 的關注重點。以目錄的形式,整理這職位面試中實用的知識點、框架和參考資料,並且提供一些思路的範例給讀者參考。

『勿枉勿縱』:混淆矩陣、precision、recall 及其他

關於設定判斷標準,我們都聽過『勿枉勿縱』這個說法。一般來說我們希望模型給出答案的『正確率』最高,但是有些情況下,『正確率』不是唯一的標準。本篇介紹與『正確率』(以及『錯誤率』)相關的一些術語和概念,無論是平常工作、生活都會碰到,也是資料分析面試常常出現的考題。

Technical interview/Technical screening 除了刷題還有什麼重點

科技崗位的面試,最關鍵的就是 tech interview (coding interview),面對這一關,刷題可以說是必要條件。我們也有文章介紹刷題資源,以及『怎麼刷』的練習技巧。這篇來談談除了刷題之外,有哪些功課,可以幫助我們更順利通過  tech interview。

Side project 怎麼做 (資料科學、資料分析)

『動手做』是訓練技術能力最有效的方法,學習程式語言,數據分析,跟網站工程這類的技能,除了在工作中增加經驗值外,也可以自己做一些小計畫練練手。履歷中工作經驗不足時,做 side project 一個常見的、可行的彌補方式。

Overfitting: 如何避免過於複雜的模型

論你的目標職位是否有「資料」這個字,了解資料分析的基本概念和常見錯誤,都是重要的職場即戰力。本篇我們介紹 overfitting 這類型的資料分析偏誤。了解錯誤的成因,知道如何避免,才能讓『資料』發揮最大的作用。

Underfitting 與誤用線性關係

這個時代,萬事都離不開資料,無論你是不是相關技術職位,都需要了解分析資料和處理數據的基本原理。尤其經理人,更應該學習如何正確看待數據,才能做出正確的決策。Underfitting 和 overfitting 是在建立模型時,因為考屢因素過少或是過多產生的兩種的兩種偏誤。