OpenAI เผยสาเหตุหลักปัญหา “Hallucinations” ในโมเดลภาษา AI พร้อมเสนอแนวทางแก้ไขครั้งใหม่
OpenAI ผู้พัฒนาเทคโนโลยีปัญญาประดิษฐ์ชั้นนำของโลก ได้เผยแพร่บทความวิจัยเรื่อง “Why Language Models Hallucinate” ที่อธิบายถึงสาเหตุหลักของปัญหา Hallucinations ในโมเดลภาษา AI ซึ่งถือเป็นหนึ่งในความท้าทายสำคัญที่สุดในการพัฒนาเทคโนโลยี AI ในปัจจุบัน ปัญหา Hallucinations หมายถึงการที่โมเดล AI สร้างข้อมูลที่ฟังดูน่าเชื่อถือแต่ไม่ตรงกับความเป็นจริง ซึ่งอาจส่งผลกระทบต่อความน่าเชื่อถือและการใช้งาน AI ในหลากหลายสาขา ตั้งแต่การศึกษา การแพทย์ ไปจนถึงการวิจัยทางวิทยาศาสตร์ สาเหตุหลักที่ 1: อคติในการฝึกและประเมินแบบดั้งเดิม การวิจัยของ OpenAI ชี้ให้เห็นว่าปัญหาหลักเกิดจากวิธีการฝึกและประเมินโมเดลแบบดั้งเดิมที่ให้รางวัลกับการเดาทายมากกว่าการยอมรับความไม่แน่นอน นักวิจัยอธิบายว่าเมื่อระบบประเมินผลโดยใช้เพียงแค่ “ความถูกต้อง” เป็นหลัก โมเดลจะมีแนวโน้มที่จะเลือกการเดาคำตอบแทนที่จะแสดงความไม่แน่นอนหรือตอบว่า “ไม่ทราบ” ปรากฏการณ์นี้เกิดขึ้นเพราะโมเดลไม่ได้รับการกระตุ้นให้ตอบ “ไม่รู้” แม้ในสถานการณ์ที่มีความไม่มั่นใจสูง แต่กลับได้รับรางวัลจากการให้คำตอบที่ “ฟังดูถูกต้อง” แม้ว่าจะไม่แน่ใจในความถูกต้องก็ตาม วิธีการประเมินแบบนี้ทำให้โมเดลเรียนรู้พฤติกรรมที่ไม่พึงประสงค์ คือการสร้างข้อมูลเท็จเพื่อหลีกเลี่ยงการแสดงความไม่รู้ นักวิจัยให้ตัวอย่างว่า หากโมเดลถูกถามเกี่ยวกับข้อมูลที่ไม่มีในฐานข้อมูลการฝึก แทนที่จะตอบว่า “ไม่ทราบข้อมูลนี้” โมเดลจะพยายามสร้างคำตอบที่ฟังดูสมเหตุสมผลขึ้นมา ซึ่งอาจนำไปสู่การเผยแพร่ข้อมูลที่ผิดพลาดหรือเป็นเท็จ สาเหตุหลักที่ 2: ปัญหาในระดับ Pretraining การวิจัยยังเผยให้เห็นว่าปัญหา … Read more