การจัดลำดับความเกี่ยวข้อง (Relevance Ranking) คืออะไร สำคัญไฉน !!! | การจัดการความรู้ภายใน หอสมุดแห่งมหาวิทยาลัยธรรมศาสตร์

การสืบค้น ถือเป็นหัวใจสำคัญของการเข้าถึงทรัพยากรสารสนเทศที่ปัจจุบันมีอยู่มากมายมหาศาล สำหรับหอสมุดแห่งมหาวิทยาลัยธรรมศาสตร์ นอกจากเครื่องมือ (Tools) ที่ใช้ในการสืบค้นหลักๆ ที่ทุกวันนี้มี 3 ช่องทางให้เลือกสืบค้นได้ตามความเหมาะ ประกอบด้วย (1) ระบบ EDS (EBSCO Discovery Service) (2) ระบบ Worldshare ILL และ (3) ระบบ OPAC ของระบบห้องสมุดอัตโนมัติ Koha

ดังนั้น การทำความเข้าใจกับตรรกะการนำเสนอผลการสืบค้นของแต่ละระบบนับเป็นสิ่งสำคัญที่บุคลากรห้องสมุดและผู้ใช้บริการควรจะทำความเข้าใจ เพราะยิ่งเรามีเครือข่ายความร่วมมือด้านทรัพยากรสารสนเทศเพิ่มมากขึ้น ยิ่งทำให้มีข้อมูลรายการทรัพยากรสารสนเทศที่มากขึ้นเช่นกัน

ในวันนี้จึงขอนำเสนอตรรกะการแสดงผลการสืบค้นของระบบ EDS ให้พวกเราชาวหอสมุดฯ ได้รับทราบกัน เข้าใจว่าหลายๆ ท่านคงจะเคยได้ยินคำว่า “Relevance Ranking” หรือ “การจัดลำดับความเกี่ยวข้อง” กันมาบ้างแล้ว

ซึ่ง EBSCOhost ได้อธิบายและให้ความรู้เกี่ยวกับเรื่องดังกล่าวไว้ดังนี้
การจัดลำดับความเกี่ยวข้อง (Relevance Ranking) คือ การแสดงผลลัพธ์เกี่ยวกับสิ่งที่เราสืบค้นมากที่สุด โดยปกติเมื่อทำการสืบค้น เรามักจะคาดหวังว่าระบบจะสามารถแสดงผลการสืบค้นที่ตรงใจและเกี่ยวข้องกับสิ่งที่เราต้องการมากที่สุดขึ้นมาเป็นอันดับแรก ๆ ของผลการสืบค้นทั้งหมด ซึ่งสำหรับ EBSCOhost ความเกี่ยวข้องจะถูกคำนวณโดยใช้ปัจจัยหลายๆ อย่าง ดังนี้

1. การให้ค่าน้ำหนักของแต่ละรายการ (Filed Weighting) เช่น หัวเรื่อง ชื่อหนังสือ คีย์เวิร์ด บทคัดย่อ ชื่อผู้แต่ง ฯลฯ ซึ่งแต่ละรายการ จะมีค่าน้ำหนักแตกต่างกัน ดังนั้นคำค้นหาที่พบในรายการที่สำคัญมากกว่าจึงจะมีคะแนนความเกี่ยวข้องที่มากกว่า

2. เนื้อหาตรงกัน คือ หากคำที่ใช้สืบค้นตรงกับรายการที่ถูกต้อง อันดับในการนำเสนอผลการสืบค้นก็จะปรากกฎเป็นลำดับแรกๆ

3. ทำการเชื่อมโยงไปยังคอนเซปต์ กล่าวคือ หากคำที่ใช้ในการสืบค้น ตรงกับคอนเซปต์ที่เป็นที่รู้จัก การสืบค้นก็จะกว้างขึ้นเพื่อไปรวมกับคำศัพท์ที่อยู่ในคอนเซปต์นั้นๆ ตัวอย่างเช่น
เมื่อพิมพ์คำค้นว่า “workplace injury” ซึ่งอยู่ในคอนเซปต์ของ work-related injuries
– ฐานข้อมูล MEDLINE จะอยู่ในหัวข้อ OCCUPATIONAL INJURIES
– ฐานข้อมูล PsycINFO จะอยู่ในหัวข้อ INDUSTRIAL ACCIDENTS
ดังนั้นถึงแม้จะอยู่ในหัวข้อต่างกัน แต่อยู่ในคอนเซปต์เดียวกัน การสืบค้นก็จะถูกขยายขึ้น เพื่อที่จะหาบันทึกที่มีความเกี่ยวข้องสูงจากหัวข้อที่อยู่ในฐานข้อมูล MEDLINE และ PsycINFO

4. ลักษณะเฉพาะ อาทิ วันที่ตีพิมพ์ ประเภทสิ่งพิมพ์ สถานะของ Peer-reviewed ความยาวของเอกสาร ฯลฯ ล้วนมีส่วนช่วยปรับคะแนนความเกี่ยวข้องให้สูงขึ้นหรือต่ำลง เช่น ผู้ใช้มักชอบบทความที่ตีพิมพ์ไม่นาน มากกว่าบทความที่ตีพิมพ์มานานแล้ว ซึ่งหมายความว่า บทความที่ใหม่กว่า จะมีคะแนนความเกี่ยวข้องมากกว่าบทความที่เก่ากว่า

ท้ายสุดนี้ การจัดลำดับความเกี่ยวข้อง ถือเป็นเรื่องซับซ้อนและเกี่ยวกับตัวเลข การสืบค้นในแต่ละครั้งจะมีการคำนวณคะแนนเพื่อการจัดลำดับ และเรียงลำดับผลการสืบค้นตามคะแนนที่ได้ ซึ่งจะคำนวณแบบ Real-time จาก Content ที่มีกว่า 1,000 ล้านฉบับ รู้แบบนี้แล้ว … เวลาสืบค้นข้อมูลก็อย่าลืมนึกถึงตรรกะที่นำเสนอนี้ เพื่อที่จะได้ไม่ต้องเสียอารมณ์ หากผลการสืบค้นไม่ได้ดั่งใจที่ต้องการ

อ้างอิง: https://www.youtube.com/watch?v=u8eDhQ0Ko2w