跳到主要內容

簡易檢索 / 詳目顯示

研究生: 蔡繡婕
Hsiu-Chieh Tsai
論文名稱: 以機器學習演算法建置C公司離職預測模型
Building employee turnover prediction model for C company with machine learning algorithm
指導教授: 鄭晉昌
Jihn-Chang Jehng
口試委員:
學位類別: 碩士
Master
系所名稱: 管理學院 - 人力資源管理研究所在職專班
Executive Master of Human Resource Management
論文出版年: 2022
畢業學年度: 110
語文別: 中文
論文頁數: 61
中文關鍵詞: 離職模型機器學習梯度提升極度梯度提升隨機森林
外文關鍵詞: turnover model, machine learning, gradient boosting, extreme gradient boosting (XGBoost), random forest
相關次數: 點閱:7下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 隨著大數據的崛起,一些標竿企業人力資源管理部門開始運用Auto ML平台並導入機器學習,應用演算法建立模型,進行員工離職率管理。本研究以台灣C公司在大陸江蘇廠的員工資料進行分析,利用梯度提升、極限梯度提升、隨機森林這三種監督式機器學習分類演算法,建立自願性離職員工預測模型,並以交叉驗證方式處理,結果顯示,梯度提升及極限梯度提升兩個模型的AUC值均達0.8以上,代表模型具有優良的鑑別力,能有效預測員工是否具有離職傾向。
    同時探討多項變數中影響員工離職之關鍵影響因素,及離職高風險群特徵。在18項自變數中找到關鍵影響因素,分別為職等為6、績效平均在2.83分以下、年資在11.4年以下、非主管職、職稱為工程師或管理師、及戶籍為江蘇省共七項,當中最有可能離職為職等6員工族群,次高為員工績效平均分數在2.83分以下。此外,研究結果顯示高風險群特徵為職等6、住在當地且大學畢業者。綜合歸納本次研究分析結果,提供C公司員工離職率管理之參考。


    With the rise of big data, the human resource management department of some benchmark enterprises have started to use Auto ML platform and introduced machine learning to build models by applying algorithms for employee turnover rate management. This study analyzed the employee data of Jiangsu plant in China of Taiwanese Company C. Using three supervised machine learning classification algorithms, namely, gradient boosting, extreme gradient boosting (XGBoost) and random forest to build a voluntary turnover prediction model, and processed it by cross-validation.
    The results showed that the AUC of both gradient boosting and extreme gradient boosting (XGBoost) models were above 0.8, indicating that the models had good discriminative ability and could effectively predict whether employees have a tendency to leave.
    The key influencing factors of multi-variables that affect employee turnover and the characteristics of the high-risk group were also investigated. Between 18 independent variables, 7 key factors were found: being in level 6 position, getting the average performance score of 2.83 or less, having 11.4 or less years of experience, being in non-supervisory position, holding a posititon title of engineer or administrator, and household being registered in Jiangsu Province. Among them, the most likely to leave is the employee who is in level 6 position, and the second highest is the employee with an average performance score of 2.83 or below.
    In addition, the results showed that the characteristics of the high-risk group are the ones who are in level 6 position, live in the local area and are graduated from university. The results of this study are summarized to provide Company C a reference for employee turnover rate management.

    摘要 i Abstract ii 誌謝 iii 目錄 iv 圖目錄 vi 表目錄 vii 一、緒論 1 1-1 研究緣起 1 1-2 研究目的 2 1-3 研究範圍 3 1-4 研究流程 3 二、文獻探討 4 2-1 離職 4 2-1-1 離職定義 4 2-1-2 離職模式 6 2-2資料採礦(Data Mining) 8 2-2-1資料採礦定義 8 2-2-2資料採礦步驟 9 2-2-3資料採礦模式 11 2-3 機器學習 13 2-3-1 機器學習定義 13 2-3-2 機器學習類型 14 三、研究方法 17 3-1 資料收集與前置處理 18 3-2 樣本資料分割 19 3-3 機器學習演算法 19 3-3-1梯度提升 19 3-3-2 極限梯度提升 19 3-3-3 隨機森林 20 3-4 模型評估 21 3-4-1混淆矩陣 21 3-4-2 ROC曲線 22 3-4-3 AUC 23 3-4-4交叉驗證 23 四、研究結果 24 4-1 敘述性統計 24 4-2 模型評估 30 4-2-1 分類器性能指標 30 4-2-2 ROC曲線 30 4-2-3 AUC 32 4-3關鍵影響因素 35 五、結論與建議 38 5-1 研究結論 38 5-2 研究限制 39 5-3管理意涵 40 參考文獻 43 一、中文文獻 43 二、英文文獻 46 三、網路資料 48

    一、中文文獻
    1.王 瑞、尹 紅、強冰冰,基於改進 XGBoost 的企業員工離職預測模型,信息技術,昆明理工大學機電工程學院,昆明 650500,第8期,2021年。
    2.王禎祥,「應用機器學習回歸模型於成衣製造業銷售預測-以T公司為例」,國立中央大學,碩士論文,民國110年。
    3.李孟潔,「以隨機森林演算法及極限梯度提升法分析台灣五十之交易策略」,國立高雄科技大學,碩士論文,民國109年。
    4.洪啟方,「工作滿足與員工離職傾向關係之研究」,國立師範大學,碩士論文,民國92年。
    5.徐晟熏,「資料探勘(Data mining)在人力資源管理上的分析與應用」,國立中央大學,碩士論文,民國104年。
    6.翁慈宗,「資料探勘的發展與挑戰」,科學發展,442期,2009年10月。
    7.許景貞,「工作滿足、組織承諾、工作績效與離職意圖之關係研究」,國立台灣科技大學,碩士論文,民國93年。
    8.黃大綱,「工作價值觀、心理契約對離職傾向之影響-以工作滿足為中介變項」,國立師範大學,碩士論文,民國102年。
    9.陳彥文,「探討資料探勘技術與機器學習方法於藥物不良反應預測模型之建立」,高雄醫學大學,碩士論文,民國110年。
    10.張漢中,「國軍主計財務軍官離職率模式構建之研究」,國防管理學院,碩士論文,民國91年。
    11.張珺,「新型冠狀病毒疫情下,探討工作負荷與離職意向關係之研究—工作倦怠為中介、社會支持為調節變項」,國立中央大學,碩士論文,民國109年。
    12.張舒涵,「大學院校約聘人員人格特質、工作滿意度及離職傾向之研究」,國立中山大學,碩士論文,民國93年。
    13.張皓偉,「以羅吉斯迴歸方析行動支付平台之B2B客戶流失」,國立成功大學,碩士論文,民國110年。
    14.張紫君,「企業員工的離職預測模型」,重慶大學,碩士論文,民國107年。
    15.溫志皓,「資料探勘應用於需求鏈協同設計與新產品開發之研究」,國防大學,碩士論文,民國94年。
    16.詹大偉,「基於電子郵件通聯之社交網路探勘」,國立交通大學,碩士論文,民國99年。
    17.齊群翔,「員工投入驅動因子對員工工作績效、離職意圖之影響-一項跨時追蹤研究」,國立中央大學,碩士論文,民國96年。
    18.蔡智丞,「運用資料探勘技術於線上遊戲成癮因素之分析」,崑山科技大學,碩士論文,民國110年。
    19.蔡雅婷,「文具產業外銷銷售預測模型之研究-以機器學習建構」,國立屏東大學,碩士論文,民國108年。
    20.鄭家勳,「高科技公司專案研發人員之離職預測模型建置」,國立中央大學,碩士論文,民國107年。
    21.劉順富,「用XGBOOST 演算法預測台灣指數期貨」,國立雲林科技大學,碩士論文,民國108年。
    22.薛佳萍,「激勵與工作危險因子對工作滿意及離職傾向之影響- 以彰化地區金屬家具加工廠為例」,國立嘉義大學,碩士論文,民國110年。
    23.賴韋勝,「使用機器學習預測基金績效」,輔仁大學,碩士論文,民國108年。
    24.顏鴻傑,「工作鑲嵌程度與員工離職傾向之關係:以國軍志願役士官為例」,中華大學,碩士論文,民國99年。
    25.戴師勇,「員工離職預測分析之研究:以某會計師事務所審計部門為例」,東吳大學,碩士論文,民國106年。
    26.簡禎富、許嘉裕,大數據分析與資料挖礦,前程文化,新北市,民國108年。

    二、英文文獻
    1.Arnold, H. J. & Feldman, D.C. , “A Multivariate Analysis of the Determinants of Job Turnover”, Journal of Applied Psychology, Vol. 67, pp. 350-360,1982.
    2.Batta Mahesh, “Machine Learning Algorithms - A Review”, International Journal of Science and Research (IJSR), January 2019.
    3.Brad Boehmke, Brandon Greenwell, “Hands-On Machine Learning with R”, Taylor&Francis, New York, November 2019.
    4.C. Lee Ventola, “Big Data and Pharmacovigilance: Data Mining for Adverse Drug Events and Interactions”, PT.43(6):340-351, 2018.
    5.Curt, H.,The Deville’s in The Detail: Techniques, Tool, and Applications for Data mining and Knowledge Discovery-Part 1. Intelligent Software Strategies, 6 (9), 3,1995.
    6.Chung, H. M., & Gray, P., “Special Section: Data Mining”, Journal of Management Information Systems”, 16(1), 11–16, 1999.
    7.D. Hand, H. Mannila, P. Smyth, "Principles of Data Mining", MIT Press, Cambridge, MA,2001.
    8.Fayyad, Usama,Piatetsky-Shapiro, Gregory,Smyth, Padhraic, “From Data Mining to Knowledge Discovery in Databases”. 1996 [17 December 2008].
    9.Frawley, W. J., Piatetsky-Shapiro, G. and Matheus, C.J. "Knowledge Discovery in Databases: An Overview", AI Magazine: pp. 213-228, 1992.
    10.H. Michael Chung & Paul Gray , ” Data Mining”, Journal of Management Information Systems, Vol. 16, No. I, pp. 11-16.,1999.
    11.Igbaria, M., & Greenhaus, J. H.,” Determinants of MIS employees’ turnover intentions: a structural equation model”, Communications of the ACM, 35(2), 34–49,1992.
    12.Jaffrey, K.S., Charles, M. F,.&Rajan,V. ”Exploring saleperson turnover: A casual
    Model”, Journal of Business Research 18(1),305-308,1989.
    13.Mobley, W. H., “Intermediate Linkages in the Relationship Between Job Satisfaction and Employee Turnover”, Journal of Applied Psychology, 62:237-240,1977.
    14.Mobley, W. H., “Employee Turnover: Cause, Consequence and Control Maine:
    Addison- Wesley”,1977.
    15.Mobley, W. H., “Employee Turnover: Causes, Consequences and Control “ Reading, MA:Addison- Wesley Pub,1982.
    16.Miller, H. E., Katerberg, R., & Hulin, C. L., “Evaluation of the Mobley, Horner, and Hollingsworth model of employee turnover”, Journal of Applied Psychology, 64(5), 509–517,1979.
    17.Mossman, D., & Peng, H. Constructing “Proper” ROCs from Ordinal Response Data Using Weighted Power Functions”, Medical Decision Making, 34(4), 523–535,2013.
    18.Norton, G. Data Mining, UNIX Review, 14(5), 9-14, 1996.
    19.Obuchowski, N. A.,”Receiver Operating Characteristic Curves and Their Use in Radiology”. Radiology, 229(1), 3–8,2003.
    20.Porter, L W.&Steers ,R.M. Mowday, R.J., & Boulian, P.V.,”Organizational commitment ,Job satisfaction, and turnover among psychiatric technicians”, Journal of Applied Psychology 59,603-609,1974.
    21.Price, J.L.,”The study of turnover. Ames: Iowa state University Press”, 1977.
    22.Punnoose Rohit,” Prediction of Employee Turnover in Organizations using Machine Learning Algorithms”, International Journal of Advanced Research in Artificial Intelligence 5(9), 22, 2016.
    23.Saradhi, V. V., & Palshikar, G. K. (2011),”Employee churn prediction. Expert Systems with Applications”, 38(3), 1999-2006.
    24.Soares-Aguiar, A., & Palma-dos-Reis, A.,”Why Do Firms Adopt E-Procurement Systems? Using Logistic Regression to Empirically Test a Conceptual Model”, IEEE Transactions on Engineering Management, 55(1), 120–133,2008.
    25.Tett, R.P.,& Meyer,J.P., “Job Satisfaction, organizational commitment, turnover Intention, and turnover: Path analyses based on meta-analytic findings”, Personnel Psychology, 46(2), 259–293,2006.
    26.Tom Fawcett, ” An introduction to ROC analysis”, Pattern Recognition Letters, 27(8), 861–874, 2006.
    27.Williams, L. J., & Hazer, J.T., “Antecedents and consequences of satisfaction and commitment in turnover models: A reanalysis using latent variable structural equation methods”, Journal of Applied Psychology,71(2),219-231,1986.
    28.Yue Zhao1, Maciej K. Hryniewicki2, Francesca Cheng2,Boyang Fu3, and Xiaoyu Zhu4 ,”Employee Turnover Prediction with Machine Learning: A Reliable Approach”,2019.
    29.Zweig, M. H., & Campbell, G.,”Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine”, Clinical Chemistry, 39(4), 561–577,1993.

    三、網路資料
    1.F度量(F-measure),國家教育研究院雙語詞彙資料庫, 取自 https://web.archive.org/web/20200703160928/https://terms.naer.edu.tw/detail/1679003/
    2.李覺白:簡介資料探勘。2018年10月17日,取自
    https://yourgene.pixnet.net/blog/post/118993558-%E7%B0%A1%E4%BB%8B%E8%B3%87%E6%96%99%E6%8E%A2%E5%8B%98。
    3.詹峻陽:人工智慧三大關鍵技術。2016年11月1日,取自https://www.bnext.com.tw/article/41534/3-key-techniques-of-ai
    4.鄭晉昌:大數據分析在人力資源管理運用上的策略思維。2021年2月2日,取自https://www.jobforum.tw/discussTopic.asp?cat=hrfriend&id=239631&vmode=all。
    5.Priyadharshini:What Is Machine Learning and How Does It Work? Nov 22, 2021.
    https://www.simplilearn.com/tutorials/machine-learning-tutorial/what-is-machine-
    learning

    QR CODE
    :::