大數據 是什麼?
Big Data — 大數據 的完整解釋
大數據指規模龐大、速度快速且多樣化的資料集合,傳統資料處理工具難以有效處理,需要專門的技術與架構來儲存、分析與應用
容易混淆
大數據 vs 一般資料庫 一般資料庫可以放資料,但大數據還要面對量大、速度快、型態雜的處理問題。
大數據 vs 資料湖 大數據是問題本身,資料湖是常見的儲存與治理方式之一。
大數據 vs AI 大數據是資料和基礎設施的挑戰,AI 是使用這些資料做預測或生成的方法。
記住這句就好
先看它要解決的是什麼問題,再看它是不是最合適的方法。
實際案例
案例 1:電商點擊紀錄 每天幾百萬筆瀏覽與點擊事件,光靠單機 Excel 很快就會卡住。
案例 2:感測器串流 工廠或車隊每秒都在送資料,系統要能持續收、存、算。
深入了解
面向 重點 特徵 常用 3V 或 5V 來描述大量、快速、多樣、真實性與價值。 架構 通常會搭配分散式儲存、分散式運算和資料治理。 目的 不是只把資料堆大,而是把它變成可分析、可決策的資產。
情境判斷
Q1(判斷題): 如果資料只有幾十萬筆,還算大數據嗎? → 不一定,要看速度、型態和處理方式,光看筆數不夠。
Q2(判斷題): 只要資料很多,就一定需要大數據架構嗎? → 也不一定,如果資料更新慢、查詢簡單,傳統工具可能就夠了。
大數據 在 iPAS 考試中的重點
根據歷年統計,大數據 相關題目 屬於高頻考範圍。
常見問題
大數據一定要上雲嗎?
不一定,但雲端常常比較容易擴充、備援和管理。
大數據和資料倉儲差在哪?
資料倉儲偏向整理好的分析資料,大數據更強調規模、速度與多樣性。
大數據最怕什麼?
最怕資料很多但品質差、治理弱,最後只剩一堆難用的垃圾資料。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定