今天,大多數 ERP 和電子商務 (e-Commerce) 系統數據都存儲為結構化數據 (Structured Data),因為它們是使用關係數據庫技術 (Relational Database, RDB) 構建的。另一方面,尤其是那些通過移動應用 (Mobile App) 技術開發的應用和系統,非結構化數據結構 (Unstructured Data) 的應用越來越普遍。
多年來,Laps 開發並接觸了許多 ERP 和電子商務系統。據我們經驗,幾年前設計和開發的許多系統也包含了大量的“非結構化數據” —— 雖然系統基本上是用 RDB 開發,但是收集和存儲在系統中的數據 (RDB 術語 :數據表、列、行, 即 tables, columns, rows) 不相關 (non-correlated),或者我們可以說有些數據沒有預定義的數據模型 (predefined model)。
許多 CEO、CFO 或高級管理人員會發現,在龐大的數據記錄中獲得有用的商業情報並不容易,部門合作可能需要付出不切實際的成本才能達成。
的確,許多公司已經存儲大量非結構化或結構化數據的系統,但這些數據並沒有充分發揮其潛力。
最近,我們完成了一個包含在線調查 (online survey) 的 ERP 和 e-Commerce 的增強項目 (enhancement project)。系統收集的數據是“非結構化的” —— 只是大量的文本、數字、選擇偏好等。你可以把它想像成一個單一的電子表格:每一列都填滿了表格中的文字、數字,每一行都包含一組客戶數據。幾年前,在普及使用機器學習 (Machine Learning) 技術出現之前,很難從成千上百的行和列 (即客戶調查答案) 中推斷出任何有價值的商業情報。
作為該項目的軟件開發人員,Laps 在 ERP 和 e-Commerce 系統中編寫了一個嵌入式模塊 (embedded module) 來收集、分析和報告“非結構化數據“。我們的模塊涵蓋以下任務:
* 清理和標準化數據 (Data Clean-up and Standardization)
* 持續數據訓練和優化機器學習模型 Machine Learning Model 參數 (hyper-parameters)
* 利用 機器學習模型 ML Model 對數據進行實時分類 (classification) 和預測 (forecast)
* 恒常的管理報告 (management reporting)
將機器學習技術應用於現有的 ERP 和電子商務系統後,客戶管理團隊可以更快地獲得更多有價值的信息和報告,並使準確性評估變得更加容易。
如果您想了解更多關於如何改善您的業務,請聯繫我們進行進一步討論。
相關閱讀 维基百科 – Unstructured Data
https://en.wikipedia.org/wiki/Unstructured_data