รายงานวิจัย
สุขภาพและสวัสดิการ
ทุนสนับสนุนงานพื้นฐาน (Fundamental Fund)
2569
นวัตกรรมเพื่อสุขภาพเด็ก: ดิจิทัลแพลตฟอร์มที่ขับเคลื่อนด้วยปัญญาประดิษฐ์สำหรับการจำแนกความผิดปกติของเม็ดเลือดแดงในผู้ป่วยเด็กของโรงพยาบาลอุตรดิตถ์
Innovation in Child Health: Artificial Intelligence-Powered Digital Platform for the Classification of Red Blood Cell Disorder in Pediatric Patients at Uttaradit Hospital
แพทย์หญิงพัชรนภา จงอัจฉริยกุล
โรงพยาบาลอุตรดิตถ์ ซึ่งเป็นศูนย์กลางการให้บริการสุขภาพแก่ประชาชนในจังหวัดอุตรดิตถ์และจังหวัดใกล้เคียง และเป็นโรงพยาบาลศูนย์แห่งที่ 2 ในเขตกลุ่มจังหวัดภาคเหนือตอนล่าง นอกจากนี้ยังทำหน้าที่เป็นสถาบันร่วมผลิตแพทย์ชั้นคลินิกของคณะแพทยศาสตร์ มหาวิทยาลัยนเรศวร ตามโครงการร่วมผลิตแพทย์เพิ่มเพื่อชาวชนบท มีบทบาทสำคัญในการดูแลสุขภาพของประชากรในพื้นที่ รวมถึงการดูแลสุขภาพเด็ก ในกลุ่มงานกุมารเวชกรรม หนึ่งในภาระหน้าที่หลักของโรงพยาบาลอุตรดิตถ์ คือการให้บริการตรวจวินิจฉัยและรักษาความผิดปกติของเม็ดเลือดแดง (Red Blood Cell Disorder) ในเด็ก ซึ่งเป็นกลุ่มอาการที่ส่งผลกระทบต่อการทำงานหรือโครงสร้างของเม็ดเลือดแดง ซึ่งเป็นเซลล์ที่มีบทบาทสำคัญในการลำเลียงออกซิเจนไปยังเซลล์ต่างๆ ทั่วร่างกาย (Orkin et al., 2014) โดยความผิดปกติของเม็ดเลือดแดงสามารถจำแนกออกเป็นประเภท ได้แก่
** ภาวะเม็ดเลือดแดงขนาดเล็ก (Microcytic Red Blood Cell: MRBC): ภาวะนี้มีลักษณะร่วมกันกับพาหะธาลัสซีเมีย (Thalassemia Trait) คือ เม็ดเลือดแดงมีขนาดเล็กกว่าปกติ ซึ่งในการวินิจฉัยภาวะนี้อาจพบได้ว่าผู้ป่วยเป็นพาหะธาลัสซีเมียแต่ไม่ได้มีภาวะโลหิตจาง
** ภาวะโลหิตจางชนิดเม็ดเลือดแดงขนาดเล็ก (Microcytic Anemia: MA): สาเหตุหลักของภาวะนี้คือ ภาวะโลหิตจางจากการขาดธาตุเหล็ก (Iron Deficiency Anemia) พาหะธาลัสซีเมีย และโรคโลหิตจางธาลัสซีเมีย (Thalassemia Disease)
ภาวะโลหิตจาง (Amemia) ในเด็กเป็นภาวะที่พบได้บ่อยในเวชปฏิบัติในประเทศไทย ในตั้งแต่ปี ค.ศ. 2010 พบว่าความถี่ของการพบภาวะโลหิตจางในเด็กระหว่าง 6 - 59 เดือน คิดเป็นร้อยละ 39.8 แสดงดังภาพที่ 1 (World Health Oraganization, 2021) ผู้ป่วยที่มีภาวะโลหิตจาง หมายถึง ผู้ป่วยที่มีระดับฮีโมโกลบิน (Hemoglobin) หรือฮีมาโตคริต (Hematocrit) ต่ำกว่าค่าเฉลี่ยของเด็กปกติมากกว่า 2 เท่าของค่าเบี่ยงเบนมาตรฐาน ซึ่งผู้ป่วยเด็กที่มีภาวะโลหิตจาง องค์การอนามัยโลกได้นิยาม “ภาวะโลหิตจาง” ดังนี้ (World Health Oraganization, 2020)
o เด็กอายุ 6 เดือน ถึง 5 ปีที่มีระดับฮีโมโกลบินต่ำกว่า 11 กรัม/เดซิลิตร
o เด็กอายุ 5-12 ปีที่มีระดับฮีโมโกลบินต่ำกว่า 11.5 กรัม/เดซิลิตร
o เด็กอายุ 12-15 ปี ที่มีระดับ ฮีโมโกลบินต่ำกว่า 12 กรัม/เดซิลิตร
สาเหตุของภาวะโลหิตจางในเด็กที่พบได้บ่อย ได้แก่ ภาวะโลหิตจางจากการขาดธาตุเหล็ก เป็นภาวะโลหิตจางที่เกิดจากการขาดสารอาหาร เป็นหนึ่งในปัญหาสาธารณสุขที่พบบ่อยในหลายประเทศทั่วโลก และภาวะโลหิตจางจากโรคโลหิตจางธาลัสซีเมีย ซึ่งเป็นโรคที่ถ่ายทอดทางพันธุกรรมที่พบได้มากในทั่วทุกภาคของประเทศไทยและพบได้ทั่วโลก โดยเฉพาะอย่างยิ่งประเทศในแถบเอเชียตะวันออกเฉียงใต้ (Frangoul et al., 2021; Ferih et al., 2023) ผู้ป่วยเด็กที่มีภาวะโลหิตจางจากการขาดธาตุเหล็กจะมีอาการอ่อนเพลีย ไม่มีแรง เหนื่อยง่าย ซึม เบื่ออาหาร สำหรับผู้ป่วยที่มีภาวะโลหิตจางจากโรคโลหิตจางธาลัสซีเมียจะมีอาการตัวเหลือง ตาเหลือง และมีอาการตับม้ามโตร่วมด้วย ซึ่งหากมีการตรวจวินิจฉัยภาวะเหล่านี้ตั้งแต่ระยะแรก ผลการตรวจจะมีความสำคัญต่อการรักษาที่เหมาะสมและป้องกันภาวะแทรกซ้อนอื่น ๆ ได้
เทคโนโลยีปัญญาประดิษฐ์ (Artificial Intelligence: AI) ได้ถูกพัฒนาอย่างรวดเร็วและมีอิทธิพลต่อทุกแง่มุมของชีวิตประจำวัน ซึ่ง AI ได้ถูกนำไปใช้ในการอำนวยความสะดวกในหลากหลาย ๆ ด้าน เช่น การสืบค้น การขนส่ง การเกษตรกรรม การแพทย์ และการสาธารณสุข เป็นต้น สำหรับด้านการสืบค้น AI ได้ถูกพัฒนาเพื่อรวบรวมผลการค้นหา แนะนำเนื้อหาที่เกี่ยวข้อง และตอบคำข้อถามอย่างชาญฉลาด ตัวอย่างเช่น ChatGPT ถูกพัฒนาโดย OpenAI (OpenAI, 2022) และ Germini พัฒนาโดย Google AI ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (Large Language Model) ที่มีความสามารถหลากหลาย (Pichai & Hassabis, 2023) เป็นต้น ด้านการขนส่ง AI ถูกใช้เพื่อพัฒนารถยนต์ที่มีระบบไร้คนขับ ระบบนำทางอัจฉริยะ และบริการเรียกรถ สำหรับด้านการเกษตร AI ถูกพัฒนาเพื่อเพิ่มประสิทธิภาพการผลิต ติดตามสุขภาพของพืช และคาดการณ์สภาพอากาศ รวมถึงในปัจจุบันทางการแพทย์และสาธารณสุขได้นำเทคโนโลยีปัญญาประดิษฐ์ ที่ถูกพัฒนาขึ้นมาประยุกต์ใช้เพื่อช่วยดูแลสุขภาพกันอย่างแพร่หลายในด้านต่าง ๆ เช่น การตรวจสุขภาพ การวิเคราะห์วินิจฉัย หรือการค้นคว้าวิจัยทางการแพทย์ (Saputra et al., 2023) เป็นต้น
การเรียนรู้ของเครื่อง (Machine Learning: ML) ถือเป็นส่วนหนึ่งของปัญญาประดิษฐ์ซึ่งเป็นการศึกษาอัลกอริทึมเพื่อทำการสร้างโมเดลหรือแบบจำลองทางคณิตศาสตร์ (Mathematics Model) จากข้อมูลตัวอย่าง หรือเรียกว่า ข้อมูลฝึกสอน (Training dataset) เพื่อใช้ในการคาดการณ์หรือตัดสินใจได้อย่างชัดเจน และที่สำคัญการเรียนรู้เชิงลึก (Deep Learning: DL) เป็นส่วนหนึ่งของวิธีการการเรียนรู้ของเครื่องบนพื้นฐานของโครงข่ายปราสาทเทียม (Artificial Neural Network) และการเรียนเชิงคุณลักษณะซึ่งมุ่งเน้นที่จะสร้างโมเดลโครงข่ายประสาทเทียมที่สามารถทำการตัดสินใจด้วยการขับเคลื่อนด้วยข้อมูลได้อย่างแม่นยำ
สำหรับโมเดลที่ถูกสร้างจากอัลกอริทึมการเรียนรู้ของเครื่อง (Machine Learning Algorithms) จะมีความสามารถในการวิเคราะห์ข้อมูล ค้นหารูปแบบ (Patterns) และทำนายผลลัพธ์ ความสามารถเหล่านี้ ประกอบด้วย การจำแนกประเภทของข้อมูล (Classification) การทำนายตัวเลขที่มีความต่อเนื่อง (Regression) และการจัดกลุ่มของข้อมูล (Clustering) (Patel, 2023) การจำแนกประเภทของข้อมูลและการทำนายตัวเลขที่มีความต่อเนื่องถือเป็นการเรียนรู้แบบมีผู้สอน (Supervised Learning) ซึ่งเป็นการอาศัยข้อมูลในการฝึกฝน สำหรับการจัดกลุ่มของข้อมูลถือเป็นการเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) ซึ่งไม่จำเป็นต้องมีค่าเป้าหมายของแต่ละข้อมูลตัวอย่างในระหว่างการเรียนรู้ โครงข่ายประสาทเทียมจะได้รับข้อมูลกระตุ้นในรูปแบบต่าง ๆ และทำการจัดกลุ่มตามต้องการ โครงข่ายประสาทเทียมที่ใช้การเรียนรู้แบบไม่มีผู้สอนนี้จะเป็นการระบุกลุ่มของข้อมูลที่ใส่เข้าไป โดยจะอิงกับวิธีการจัดกลุ่มซึ่งได้เรียนรู้จากข้อมูลที่โครงข่ายเคยพบมา
จาการศึกษาที่ผ่านนักวิจัยหลายท่านได้พัฒนาการจำแนกประเภท การคัดกรอง และการวินิจฉัยเกี่ยวกับความผิดปกติของเม็ดเลือดแดง ภาวะโลหิตจางและโรคโลหิตจางธาลัสซีเมีย ดังนี้ Viprakasit & Ekwattanakit (2018) ได้นำเสนอระบบการจำแนกประเภทโรคโลหิตจางธาลัสซีเมียโดยพิจารณาจากความรุนแรงทางคลินิกแทนการใช้ข้อมูลทางพันธุกรรมทั้งหมดที่ได้รับมาจากพ่อแม่ ซึ่งเป็นตัวกำหนดลักษณะทางพันธุกรรม (Genotypes) โดยใช้เทคโนโลยี Capillary Electrophoresis และ Zultiplex Ligation-Dependent Probe Amplification แต่การศึกษานี้ไม่ได้อภิปรายข้อจำกัดของเทคโนโลยีที่ใช้เหล่านี้
Laengsri et al. (2019) ได้พัฒนาโมเดล Support vector machine (SVM) และเว็บแอปพลิเคชัน “ThalPred” เพื่อแยกความแตกต่างของพาหะธาลัสซีเมียจากภาวะโลหิตจางจากการขาดธาตุเหล็กในผู้ใหญ่ อย่างไรก็ตาม การศึกษานี้ถูกจำกัดด้วยขนาดตัวอย่างที่เล็ก โดยเฉพาะอย่างยิ่งสำหรับภาวะโลหิตจางจากการขาดธาตุเหล็กและชุดข้อมูลที่ไม่สมดุล ซึ่งอาจนำไปสู่ความเอนเอียงต่อคลาสส่วนใหญ่ได้
นอกจากการศึกษาที่กล่าวถึงก่อนหน้านี้แล้ว Karnpean et al. (2022) ได้ทำการศึกษาแบบภาคตัดขวางเพื่อวิเคราะห์ความชุกของโรคโลหิตจางธาลัสซีเมียและระบุปัจจัยเสี่ยงของโรคโลหิตจางในพื้นที่รอยต่อระหว่างชายแดนไทย ลาว และกัมพูชา ซึ่งการศึกษานี้ได้ใช้ Z-test เพื่อวิเคราะห์ความชุกของธาลัสซีเมียและการถดถอยโลจีสติก (Logistic regression: LR) เพื่อระบุปัจจัยเสี่ยง รวมถึงภาวะการขาดธาตุเหล็กและชนิดของธาลัสซีเมีย อย่างไรก็ตาม การศึกษานี้มีข้อจำกัดเนื่องจากไม่สามารถปรับแก้ปัจจัยรบกวนที่อาจเกิดขึ้นได้ เช่น อายุและเพศ เป็นต้น ในโมเดล LR ซึ่งอาจส่งผลต่อความสัมพันธ์ระหว่างโรคโลหิตจางธาลัชซีเมียและตัวแปรที่ศึกษา นอกจากนี้การศึกษายังไม่ได้เกี่ยวข้องกับการพัฒนาหรือดำเนินการเทคโนโลยีและนวัตกรรม
ในขณะเดียวกัน Saputra et al. (2023) ได้พัฒนาโมเดล Extreme Learning Machine (ELM) เพื่อจำแนกประเภทของโรคโลหิตจางธาลัสซีเมียในประเทศอินโดนีเซีย แม้ว่า ELM จะเป็นที่รู้จักในด้านการเรียนรู้ที่รวดเร็วในการฝึกสอนสูงและมีประสิทธิภาพ เมื่อเปรียบเทียบได้กับเครือข่ายประสาทเทียมแบบดั้งเดิม (Lin et al., 2015) แต่ก็มีข้อจำกัดเนื่องจากความไม่เสถียร (Instability) เนื่องจาก ELM สุ่มค่าพารามิเตอร์เริ่มต้นของชั้นประมวลผลที่ซ่อนอยู่ (Hidden Layer) ทำให้ผลลัพธ์ของโมเดลอาจมีความแปรปรวน (variance) สูง และไม่เสถียรในบางกรณี โดยเฉพาะเมื่อชุดข้อมูลมีขนาดเล็กหรือมีสัญญาณรบกวน (Noise) มากอาจส่งผลต่อความแม่นยำ นอกจากนี้การเลือกฟังก์ชันกระตุ้น (Activation Function) ที่ไม่เหมาะสมเช่น การใช้ Gaussian kernel อาจมีส่งผลกระทบต่อโมเดล ELM ด้วยเช่นกัน (Huang et al., 2006; Huérfano-Maldonado et al., 2023) ในขณะเดียวกัน Peña Cáceres et al. (2023) มุ่งเน้นไปที่การจำแนกประเภทของภาวะโลหิตจางจากการขาดธาตุเหล็กและโรคโลหิตจางธาลัชซีเมียในเด็กอายุต่ำกว่า 5 ปี โดยใช้อัลกอริทึม ML ได้แก่ DT Random Forest (RF), Gaussian Naive Bayes (GNB), SVM และ LR การศึกษานี้พบว่าโมเดล RF ให้ความแม่นยำสูงสุดในการจำแนกประเภทของโรคโลหิตจางธาลัสซีเมียในประชากรกลุ่มนี้ อย่างไรก็ตามการศึกษานี้ไม่ได้รวมกลุ่มพาหะธาลัสซีเมียในการจำแนกประเภท และไม่ได้ศึกษาเกี่ยวข้องกับการพัฒนาดิจิทัลแพลตฟอร์มสำหรับการใช้งานทางคลินิก
ในขณะที่ Zemariam et al. (2024) พบว่า RF เป็นโมเดลที่มีประสิทธิภาพมากที่สุดในการทำนายภาวะโลหิตจางในเด็กผู้หญิงชาวเอธิโอเปีย แต่อย่างไรก็ตาม RF มีข้อจำกัดคือ การศึกษานี้อาจมีแนวโน้มที่โมเดล RF สามารถเรียนรู้รูปแบบและรายละเอียดที่เฉพาะเจาะจงมากเกินไปจากชุดข้อมูลที่ใช้ฝึกสอน จนกระทั่งไม่สามารถนำไปใช้กับข้อมูลใหม่ (Unseen Data) ได้อย่างมีประสิทธิภาพ หรือเรียกว่าปัญหา Overfitting โดยเฉพาะอย่างยิ่งกับการปรับค่าไฮเปอร์พารามิเตอร์ที่ไม่เหมาะสม (Ho, 1998) นอกจากนี้หากมีข้อมูลจำนวนมากในการฝึกสอนโมเดล RF อาจต้องใช้เวลานานในการประมวลผล (Louppe, 2015) และมีความซับซ้อนสูงจนยากที่จะเข้าใจหรืออธิบายได้ว่าโมเดลใช้หลักการใดในการทำนายผลลัพธ์ (Lipton, 2017) และอาจเกิดความเอนเอียงในคลาสหรือกลุ่มส่วนใหญ่สำหรับชุดข้อมูลที่ไม่สมดุล (Chen & Breiman, 2004) ซึ่งเป็นข้อพิจารณาที่สำคัญ
จากการทบทวนวรรณกรรมที่เกี่ยวข้อง พบว่ายังไม่มีการพัฒนาโมเดลสำหรับการจำแนกและคัดกรองความผิดปกติของเม็ดเลือดแดงในผู้ป่วยเด็กที่ครอบคลุมทั้ง 3 กลุ่ม ได้แก่ กลุ่มปกติ กลุ่มที่มีภาวะเม็ดเลือดแดงขนาดเล็ก (MRBC) และกลุ่มที่มีภาวะโลหิตจางชนิดเม็ดเลือดแดงขนาดเล็ก (MA) และที่สำคัญกลุ่มงานกุมารเวชกรรม โรงพยาบาลอุตรดิตถ์ยังขาดแคลนดิจิทัลแพลตฟอร์มที่ช่วยในการคัดกรองดังกล่าว ด้วยเหตุนี้การศึกษาครั้งนี้จึงมุ่งเน้นศึกษา 4 ประเด็นหลัก ดังต่อไปนี้:
I. มุ่งเน้นประชากรเฉพาะ: งานวิจัยที่มีอยู่ไม่ได้กล่าวถึงการจำแนกความผิดปกติของเม็ดเลือดแดงเหล่านี้ในเด็ก การศึกษานี้มีวัตถุประสงค์เพื่อพัฒนาโมเดลที่เหมาะผู้ป่วยเด็กในกลุ่มเฉพาะนี้ของโรงพยาบาลอุตรดิตถ์
II. การพิจารณาการแจกแจงล็อกนอร์มัล (Lognormal Distribution) : การศึกษาก่อนหน้านี้ได้ใช้ ML สำหรับการจำแนกประเภทของภาวะโลหิตจาง แต่ไม่ได้พิจารณาการแจกแจงล็อกนอร์มัล ที่มักพบในข้อมูลทางการแพทย์ที่เกี่ยวข้องโดยเฉพาะ (Limpert et al., 2001; Haeckel & Wosniok, 2010) โดยเฉพาะอย่างยิ่งพารามิเตอร์ทางการแพทย์บางอย่าง เช่น ดัชนีเซลล์เม็ดเลือดแดง มักมีการแจกแจงแบบเบ้ขวา การศึกษาครั้งนี้จึงรวมการแจกแจงล็อกนอร์มัลเข้ากับโมเดล NB โดยมีจุดมุ่งหมายเพื่อปรับปรุงความแม่นยำของการจำแนกความผิดปกติของเม็ดเลือดแดงในผู้ป่วยเด็ก โดยสะท้อนรูปแบบข้อมูลพื้นฐานให้ดียิ่งขึ้น
III. การลดความไม่สมดุลของคลาส: เมื่อตระหนักว่ากรณีกลุ่มหรือคลาสภาวะ MA มักมีจำนวนมากกว่าภาวะอื่น ๆ ซึ่งการศึกษาครั้งนี้จะใช้ Focal Loss ภายในโมเดล MLP เพื่อแก้ไขความไม่สมดุลนี้และปรับปรุงการจำแนกประเภทความผิดปกติของเม็ดเลือดแดงที่พบได้น้อย
IV. การพัฒนาดิจิทัลแพลตฟอร์มที่ครอบคลุม: ดิจิทัลแพลตฟอร์มที่ใช้งานง่ายซึ่งรวมโมเดล ML ต่างๆ ที่ได้รับการพัฒนา เพื่อให้เป็นนวัตกรรมที่ครอบคลุมสำหรับการจำแนกและคัดกรองความผิดปกติของเม็ดเลือดแดง แพลตฟอร์มนี้มีจุดมุ่งหมายเพื่อเพิ่มความแม่นยำในการวินิจฉัยและประสิทธิภาพสำหรับผู้เชี่ยวชาญด้านสุขภาพและนักศึกษาแพทย์ต่อไป
คามผิดปกติของเม็ดเลือดแดง, ปัญญาประดิษฐ์, การจำแนกประเภท, ดิจิทัลแฟลตฟอร์ม, โมเดลการเรียนรู้ของเครื่อง