時間序列分析(Time Series Analysis)(1):基本理論

時間序列分析(Time Series Analysis),可以看作是資料分析中的一種特殊資料型態,是新手資料科學家常常接到的任務,也是日常生活中很常碰到的話題。本篇我們介紹幾種時間序列分析的基礎理論,和實踐中需要注意的事項。

資料科學(Data Scientist, Data analyst)求職準備清單

資料科學家、分析師,重新進入求職市場時,需要做哪些準備?本篇我們整理一份清單,包含過往的相關文章,針對『資料』相關工作,準備尋求新的職業發展、找下一份工作的夥伴做參考。

淺談 case interview(4):資料分析與資料科學

本篇我們討論資料分析師*(data analyst)崗位 case interview 的關注重點。以目錄的形式,整理這職位面試中實用的知識點、框架和參考資料,並且提供一些思路的範例給讀者參考。

Side project 怎麼做 (資料科學、資料分析)

『動手做』是訓練技術能力最有效的方法,學習程式語言,數據分析,跟網站工程這類的技能,除了在工作中增加經驗值外,也可以自己做一些小計畫練練手。履歷中工作經驗不足時,做 side project 一個常見的、可行的彌補方式。

Overfitting: 如何避免過於複雜的模型

論你的目標職位是否有「資料」這個字,了解資料分析的基本概念和常見錯誤,都是重要的職場即戰力。本篇我們介紹 overfitting 這類型的資料分析偏誤。了解錯誤的成因,知道如何避免,才能讓『資料』發揮最大的作用。

Underfitting 與誤用線性關係

這個時代,萬事都離不開資料,無論你是不是相關技術職位,都需要了解分析資料和處理數據的基本原理。尤其經理人,更應該學習如何正確看待數據,才能做出正確的決策。Underfitting 和 overfitting 是在建立模型時,因為考屢因素過少或是過多產生的兩種的兩種偏誤。

Simpson’s paradox:辛普森悖論與隱藏變因

Paradox 翻譯為『悖論』, 指的是『似非而是』:也就是那些看起來很奇怪,但是仔細想想道理是正確的現象。辛普森悖論指的是『整體趨勢與個別趨勢不同』的現象。本篇我們從辛普森悖論出發,探討這種現象成因,以及資料分析中常見的謬誤。

什麼是 Data Driven?

這幾年,data driven 可已算是個熱門關鍵字,萬物皆可 data driven,好像誰會就落伍了一樣。但是具體而言到底麼樣叫 data driven 呢?是不是只要在整個計畫中,拉上幾個資料科學家、分析師來背書就好?

如何提升技術背景 – 線上課程&bootcamps

就算沒有相關的學歷背景,也可以轉換跑道到軟體工程師、資料分析、資料科學家。這些工作因為有客觀技術要求,本身很『熱門』(職缺較多),而且也沒有太硬性的證照和法規要求,加上一些歷史因素,對於轉行者是相對很友善的。