時間序列分析(Time Series Analysis)(1):基本理論

時間序列分析(Time Series Analysis),可以看作是資料分析中的一種特殊資料型態,是新手資料科學家常常接到的任務,也是日常生活中很常碰到的話題。本篇我們介紹幾種時間序列分析的基礎理論,和實踐中需要注意的事項。

淺談 case interview(2):產品經理(PM)問題與分析

產品經理(product manager)在科技產業扮演非常重要的角色,也是很多人的 dream job。這個職位需要與技術人員合作,也要有商業思維、懂得客戶需求和市場生態,更需要協調團隊,溝通需求等軟實力。因此產品經理的面試中就也很常出現案例分析。

『勿枉勿縱』:混淆矩陣、precision、recall 及其他

關於設定判斷標準,我們都聽過『勿枉勿縱』這個說法。一般來說我們希望模型給出答案的『正確率』最高,但是有些情況下,『正確率』不是唯一的標準。本篇介紹與『正確率』(以及『錯誤率』)相關的一些術語和概念,無論是平常工作、生活都會碰到,也是資料分析面試常常出現的考題。

Underfitting 與誤用線性關係

這個時代,萬事都離不開資料,無論你是不是相關技術職位,都需要了解分析資料和處理數據的基本原理。尤其經理人,更應該學習如何正確看待數據,才能做出正確的決策。Underfitting 和 overfitting 是在建立模型時,因為考屢因素過少或是過多產生的兩種的兩種偏誤。

Simpson’s paradox:辛普森悖論與隱藏變因

Paradox 翻譯為『悖論』, 指的是『似非而是』:也就是那些看起來很奇怪,但是仔細想想道理是正確的現象。辛普森悖論指的是『整體趨勢與個別趨勢不同』的現象。本篇我們從辛普森悖論出發,探討這種現象成因,以及資料分析中常見的謬誤。

外商科技公司如何『訂目標』、『評考績』(1):KPI

題展現了組織如何定義 success,也一部分代表了公司的文化(culture),攸關年度的獎金,還可能決定職涯發展。

本文我們介紹 KPI  (key performance indicator) ,使用的特色與優缺點。