การตรวจสอบมีกี่ประเภท ? มันคืออะไร? คุณจะพบคำตอบสำหรับคำถามเหล่านี้และคำถามอื่นๆ ในบทความ ความถูกต้องเป็นคุณลักษณะเดียวโดยเนื้อแท้ซึ่งรวมถึงข้อมูลที่ว่าเทคโนโลยีนี้เหมาะสำหรับการวัดว่าได้รับการพัฒนาเพื่ออะไร และในทางกลับกัน ประสิทธิภาพ ประโยชน์เชิงปฏิบัติ และประสิทธิภาพคืออะไร การตรวจสอบความถูกต้องของเทคโนโลยีเรียกว่าการตรวจสอบความถูกต้อง เราจะพิจารณารายละเอียดเพิ่มเติมด้านล่าง
ดู
หลายคนถามว่า "อะไรคือการตรวจสอบ" ว่ากันว่าจิตใจที่ปราณีตไม่มีขอบเขต นักระเบียบวิธีดูจะแข่งขันกันเองในการค้นหาหรือคิดค้นประเภทและประเภทความถูกต้องมากขึ้น ช่วงนี้มีแต่ชื่ออะไรไม่ขึ้น! ปรากฎว่ามี:
- ความถูกต้องภายนอกและภายใน
- บรรจบกัน
- เลือกปฏิบัติ;
- ชัดเจน;
- factorial;
- ทำนาย;
- สร้างสรรค์;
- เกณฑ์;
- มีความหมายและอื่นๆ
ไม่มีทางที่จะเข้าใจ และยิ่งไปกว่านั้นเพื่อแยกแยะความแตกต่างอย่างสมเหตุสมผลจากอีกรูปแบบหนึ่ง ความสับสนในคำจำกัดความและการจำแนกประเภทนำไปสู่ความจริงที่ว่าผู้เขียนต่างกันระบุวิธีการปรับปรุงให้เป็นรูปแบบเดียวกันของความถูกต้อง
เกณฑ์ภายนอก
ในการดำเนินการตรวจสอบความถูกต้องของระเบียบวิธีปฏิบัติ กล่าวคือ เพื่อประเมินความสำคัญในทางปฏิบัติ ประสิทธิภาพ ประสิทธิภาพ มักใช้เกณฑ์อิสระภายนอก ซึ่งเป็นตัวบ่งชี้ถึงคุณภาพที่กำลังศึกษาในชีวิตประจำวัน เกณฑ์ดังกล่าวสามารถเป็นได้ทั้งผลสัมฤทธิ์ทางการผลิต (สำหรับเทคโนโลยีของการปฐมนิเทศทางวิชาชีพ) และผลการเรียน (สำหรับการทดสอบสติปัญญา ความสำเร็จหรือความสามารถในการเรียนรู้) และประสิทธิผลของกิจกรรมจริง - การสร้างแบบจำลอง การวาดภาพ และอื่นๆ (สำหรับการทดสอบ ทักษะพิเศษ), การประเมินส่วนตัว (สำหรับการยืนยันตัวตน).
ประเภทของเกณฑ์การตรวจสอบภายนอกมีดังนี้:
- มาตรการการปฏิบัติงาน (อาจรวมถึงจำนวนงานที่ดำเนินการ เวลาที่ใช้ในการฝึกอบรม ผลการเรียน อัตราการเติบโตของวุฒิการศึกษา และอื่นๆ)
- สัญญาณทางสรีรวิทยา (ใช้เมื่อศึกษาผลกระทบของสิ่งแวดล้อมและตัวแปรสถานการณ์อื่น ๆ ที่มีต่อจิตใจและร่างกายของมนุษย์);
- วัดความดันโลหิต อัตราชีพจร อาการเมื่อยล้า ความต้านทานไฟฟ้าของผิวหนัง และอื่นๆต่อไป;
- มาตรการอัตนัย (รวมถึงคำตอบประเภทต่างๆ ที่สะท้อนถึงทัศนคติของบุคคลหรือบางสิ่งบางอย่าง มุมมอง ความคิดเห็น ความชอบ ตามกฎแล้ว มาตรการดังกล่าวจะได้รับโดยใช้แบบสอบถาม แบบสอบถาม การสัมภาษณ์)
- สัญญาณของการเกิดอุบัติเหตุ (ใช้เมื่อวัตถุประสงค์ของการศึกษากังวล เช่น ปัญหาในการเลือกคนทำงาน เช่น ผู้ที่มีแนวโน้มน้อยที่จะเกิดอุบัติเหตุ)
ความถูกต้องเชิงประจักษ์ เกี่ยวกับอะไร
ไม่กี่คนที่รู้ว่าการตรวจสอบเชิงประจักษ์คืออะไร ในกรณีของความถูกต้องของเนื้อหา การทดสอบจะถูกประเมินโดยผู้เชี่ยวชาญ และค่าเชิงประจักษ์จะถูกวัดโดยใช้สหสัมพันธ์ทางสถิติเสมอ: คำนวณความสัมพันธ์ของค่าสองประเภท - คะแนนการทดสอบและดัชนีสำหรับพารามิเตอร์ภายนอกที่เลือกเป็นเกณฑ์ความน่าเชื่อถือ
สร้างสรรค์
ไม่ใช่ทุกคนที่รู้วิธีตรวจสอบความถูกต้องประเภทต่างๆ ความถูกต้องของโครงสร้างคืออะไร? เกี่ยวข้องกับโครงสร้างทางทฤษฎีและประกอบด้วยการค้นหาปัจจัยที่อธิบายพฤติกรรมการทดสอบประสิทธิภาพ
เป็นประเภทเฉพาะ ความถูกต้องของโครงสร้างนั้นถูกต้องตามกฎหมายในบทความโดย Mil และ Cronbach (1955) เมื่อใช้รูปแบบความถูกต้องนี้ ผู้เขียนได้ประเมินผลการสำรวจทดสอบทั้งหมดที่ไม่ได้มีวัตถุประสงค์โดยตรงในการทำนายเกณฑ์ที่สำคัญบางประการ การวิจัยมีข้อมูลเกี่ยวกับโครงสร้างทางจิตวิทยา
ความถูกต้องของเนื้อหา
เธอยังอยู่คุณถาม: "การตรวจสอบ - มันคืออะไร" พิจารณาความถูกต้องของเนื้อหา กำหนดให้แต่ละปัญหา คำถาม หรืองานในพื้นที่นั้นๆ มีโอกาสกลายเป็นไอเท็มทดสอบเท่ากัน
ความถูกต้องของเนื้อหาจะประเมินความเหมาะสมของเอนทิตีทดสอบกับพื้นที่พฤติกรรมที่วัดได้ การยืนยันที่สร้างโดยนักพัฒนาสองกลุ่มจะดำเนินการกับกลุ่มตัวอย่างที่ได้รับการตรวจสอบ ความน่าเชื่อถือของการทดสอบคำนวณโดยแบ่งคำถามออกเป็นสองโซน ส่งผลให้มีดัชนีความถูกต้องของเนื้อหา
ทำนาย
เรายังคงพิจารณาวิธีการตรวจสอบความถูกต้องต่อไป ความถูกต้องของการคาดการณ์ยังถูกกำหนดโดยเกณฑ์ภายนอกที่ค่อนข้างเชื่อถือได้ แต่ข้อมูลเกี่ยวกับเขาจะถูกรวบรวมหลังจากการตรวจสอบเสร็จสิ้น
เกณฑ์มาตรฐานภายนอกมักจะเป็นอาชีพของบุคคล ดังแสดงในการประเมินใดๆ สำหรับประเภทของอาชีพที่เขาได้รับเลือกโดยพิจารณาจากผลการตรวจวินิจฉัย
แม้ว่าวิธีนี้จะเหมาะสมที่สุดสำหรับงานเครื่องมือวินิจฉัย - การทำนายความสำเร็จในอนาคต แต่ก็ใช้ยากมาก ความแม่นยำของการพยากรณ์ขึ้นอยู่กับเวลาที่กำหนดสำหรับการคาดการณ์ดังกล่าว ยิ่งเวลาผ่านไปหลังจากการวัดค่า ยิ่งต้องคำนึงถึงปัจจัยต่างๆ มากขึ้นเมื่อประเมินค่าที่คาดการณ์ของเทคโนโลยี อย่างไรก็ตาม แทบจะเป็นไปไม่ได้เลยที่จะคำนึงถึงปัจจัยทั้งหมดที่ส่งผลต่อการคาดการณ์
ย้อนหลัง
เห็นด้วย การตรวจสอบเป็นกระบวนการที่ซับซ้อนมาก เป็นที่ทราบกันดีว่ามีการเปิดเผยความถูกต้องย้อนหลังบนพื้นฐานของเกณฑ์สะท้อนถึงสภาวะของคุณภาพหรือเหตุการณ์ในอดีต สามารถใช้เพื่อรับแหล่งเทคโนโลยีคาดการณ์ได้ทันที ดังนั้น เพื่อแก้ไขขอบเขตที่ผลลัพธ์ที่ดีของการทดสอบทักษะสอดคล้องกับการเรียนรู้อย่างรวดเร็ว เราสามารถเปรียบเทียบความคิดเห็นของผู้เชี่ยวชาญก่อนหน้า การประเมินประสิทธิภาพ และอื่นๆ ในบุคคลที่มีดัชนีการวินิจฉัยต่ำและสูงในขณะนั้น
เลือกปฏิบัติและบรรจบกัน
ประเภทของการตรวจสอบเป็นที่สนใจของหลาย ๆ คน มาดูกันว่าความถูกต้องของการเลือกปฏิบัติและการบรรจบกันคืออะไร กลยุทธ์ในการแนะนำรายการที่กำหนดไว้ในการทดสอบขึ้นอยู่กับว่านักจิตวิทยาเปิดเผยโครงสร้างการวินิจฉัยอย่างไร หาก Eysenck กำหนดคุณภาพ "neuroticism" ว่าไม่ขึ้นกับ introversion-extroversion แสดงว่าแบบสอบถามของเขาควรแสดงถึงตำแหน่งที่เท่าเทียมกันที่จะได้รับการอนุมัติจากผู้ที่มีอาการทางประสาทและคนเก็บตัว
หากในทางปฏิบัติปรากฎว่าสิ่งของจากจตุภาค "introversion-neuroticism" จะมีผลเหนือกว่าในงานนั้น จากนั้นจากตำแหน่งของทฤษฎีของ Eysenck นี่หมายความว่าตัวบ่งชี้ "โรคประสาท" นั้นเต็มไปด้วยตัวบ่งชี้ที่ไม่เกี่ยวข้อง - "การเก็บตัว" ผลที่เหมือนกันจะปรากฏขึ้นเมื่อมีอคติในตัวอย่าง - หากมีคนเก็บตัวที่มีอาการทางประสาทมากกว่าคนพิเศษที่เหมือนกัน
เพื่อหลีกเลี่ยงความสลับซับซ้อนเช่นนี้ นักจิตวิทยาจึงเต็มใจที่จะจัดการกับประเด็นเชิงประจักษ์ที่แจ้งเพียงปัจจัยเดียวเท่านั้น แต่ในความเป็นจริงข้อกำหนดนี้ไม่เคยเป็นจริง: ดัชนีเชิงประจักษ์แต่ละรายการจะไม่ถูกกำหนดโดยปัจจัยที่เราต้องการเท่านั้น แต่ยังรวมถึงผู้อื่นด้วย - ไม่เกี่ยวข้องกับปัญหาการวัด
ดังนั้น สำหรับปัจจัยที่กำหนดแนวความคิดเป็นมุมฉากกับการวัด (เกิดขึ้นในชุดค่าผสมทั้งหมด) ผู้สร้างการทดสอบจำเป็นต้องใช้กลยุทธ์ในการปรับสมดุลที่ผิดพลาดเมื่อเลือกรายการ
ความสอดคล้องของคะแนนกับตัวบ่งชี้ที่วัดได้รับประกันความถูกต้องของการลู่เข้าของการทดสอบ ความสม่ำเสมอของรายการที่เกี่ยวกับแหล่งที่มาที่ไม่เกี่ยวข้องทำให้เกิดความถูกต้องในการเลือกปฏิบัติ โดยสังเกตจากประสบการณ์พบว่าไม่มีความเกี่ยวข้องอย่างมีนัยสำคัญกับการทดสอบ ซึ่งวัดคุณภาพเฉพาะทางแนวคิด
ชุดเครื่องมือ
ในชุดวิธีการตรวจสอบทั่วไป ผู้เขียนมักจะรวมถึง:
- ไม่ทางการ (จากเทคนิคง่ายๆ เพื่อตรวจสอบรายการทางเลือกในแบบสอบถามอย่างละเอียด ไปจนถึงขั้นตอนที่ซับซ้อนมากขึ้นสำหรับการวิเคราะห์ทีละขั้นตอนตามทฤษฎี)
- จัดรูปแบบ ซึ่งรวมถึงขั้นตอนและเทคโนโลยีของสถิติทางคณิตศาสตร์: การทดสอบสมมติฐานทางสถิติ การคำนวณค่าประมาณ การวิเคราะห์สหสัมพันธ์ การสร้างช่วงความเชื่อมั่น การประเมินความสัมพันธ์ระหว่างตัวแปร การกระจาย แฟกทอเรียล การถดถอยและการวิเคราะห์โครงสร้าง และอื่นๆ บน.
เครื่องมือสร้าง
แล้วการตรวจสอบคืออะไร? เครื่องมือตรวจสอบความถูกต้องที่ซับซ้อนถูกสร้างขึ้นครั้งแรกโดยนักจิตวิทยา ย้อนกลับไปในปี 2502 เทคนิคพิเศษได้รับการพัฒนาโดย D. Fiske และ D. Campbell (สหรัฐอเมริกา) เธอได้รับภาษาอังกฤษที่เป็นธรรมชาติอย่างสมบูรณ์ แต่ไม่สามารถแปลเป็นภาษาของเรา ชื่อ: multi-method-multi-damn matrix (MTMM) เมทริกซ์นี้เป็นตารางความสัมพันธ์ ประกอบด้วยสิ่งประดิษฐ์ที่น่าสนใจมาก ๆ สองอย่าง ซึ่งหนึ่งในนั้นมีจุดประสงค์เพื่อเปิดเผยความจริงที่บรรจบกัน และอีกอันเพื่อความจริงที่แบ่งแยก
ผู้เขียนแย้งว่าทุกคนสามารถพิสูจน์การยอมรับภายในได้หาก:
- values ระหว่างที่ถือว่าการเชื่อมต่อทางทฤษฎีในระดับสูงจะพบระดับที่เหมือนกันในเชิงประจักษ์ (การบรรจบกัน);
- ค่าที่ไม่เกี่ยวข้องทางทฤษฎีจะกลายเป็นไม่เกี่ยวข้องเชิงประจักษ์หลังจากดำเนินการทดสอบ (การเลือกปฏิบัติ)
โดยสรุปแล้ว ความเที่ยงตรงแบบหลอมรวมควรระบุว่ามีความคล้ายคลึงกันมากระหว่างพนักงานสองทีม เช่น คนงานก่อสร้างและคนงานในสายการผลิต ในแง่ของโอกาสในตลาดแรงงานมากกว่าระหว่างเจ้าของและพนักงาน หากพบความสัมพันธ์ที่ตั้งใจในทางทฤษฎีโดยสังเกต ตัวอย่างของคุณถูกต้อง
ความถูกต้องของการเลือกปฏิบัติแสดงระดับของการระบุปรากฏการณ์ต่างๆ หากต้องการใช้ตัวอย่างเดียวกันของตลาดแรงงาน อาจมีคนคาดหวังว่าทฤษฎีที่มีรูปแบบที่ดีสามารถแยกแยะระหว่างโอกาสของเจ้าของและพนักงานในตลาดแรงงานได้ คุณไม่สามารถสร้างความสับสนได้ และทฤษฎีของคุณสามารถแยกแยะได้
หากคุณสร้างมาตราส่วนที่ใช้วัดความสามารถทางคณิตศาสตร์ ในกรณีของดัชนีชี้วัดความสามารถทางคณิตศาสตร์ที่เข้ากันได้ควรสัมพันธ์กันอย่างดีกับทักษะทั่วไปของบุคคล ถ้าในระดับทฤษฎีความสัมพันธ์ดังกล่าวมีและไม่ดี - ด้วยความสามารถด้านสุนทรียศาสตร์ที่ต้องใช้พรสวรรค์ที่แตกต่างไปจากเดิมอย่างสิ้นเชิงจากบุคคลมากกว่าทักษะการนับ ถ้าแน่นอนทฤษฎีของคุณประกาศความสัมพันธ์ต่ำ
ประเภท
การตรวจสอบเป็นกระบวนการปรับแต่ง ปรับปรุงวิธีการทางจิตวินิจฉัยที่สร้างขึ้น งานพื้นฐานของมันคือเพื่อให้แน่ใจว่าเทคโนโลยีวิเคราะห์สิ่งที่นักพัฒนาต้องการอย่างแน่นอน มีการแยกความแตกต่างระหว่างการตรวจสอบเชิงทฤษฎีและเชิงปฏิบัติ
สำหรับประเภทแรก ปัญหาสำคัญคือความสัมพันธ์ระหว่างปรากฏการณ์ทางจิตกับดัชนี ซึ่งปรากฏการณ์เหล่านี้พยายามที่จะเป็นที่รู้จัก แสดงให้เห็นว่าผลลัพธ์ของวิธีการและความตั้งใจเชิงนามธรรมของผู้เขียนเหมือนกัน
ในการสร้างความถูกต้องเชิงนามธรรม เป็นเรื่องยากมากที่จะหาเกณฑ์อิสระที่อยู่นอกระเบียบวิธี ในประวัติศาสตร์ของจิตวินิจฉัยในระยะแรก ดังนั้น การพึ่งพาแนวคิดสัญชาตญาณที่วัดผลการทดสอบคือ
- วิธีหนึ่งถือว่าใช้ได้หากเป็นเพียง "ชัดเจน"
- การพิสูจน์ความถูกต้องนั้นมาจากความเชื่อของผู้สำรวจว่าเทคโนโลยีของเขาสามารถ "เข้าใจผู้ถูกทดสอบ" ได้
- โครงการนี้ถือว่าใช้ได้เพราะทฤษฎีที่อยู่เบื้องหลังเทคโนโลยีนั้น "ค่อนข้างดี"
ต่อไปเริ่มค้นหาหลักฐานที่มีเหตุผลทางวิทยาศาสตร์ ควรสังเกตที่นี่ว่าการสะสมของเทคโนโลยีที่คาดเดาไม่ได้ด้วยการพิสูจน์และรู้จักความถูกต้อง หากนักจิตวินิจฉัยโรคสร้างแผนสำหรับการประเมินคุณภาพและเป็นที่รู้กันว่าเทคโนโลยีอื่นๆ ที่ใช้งานได้จริงมุ่งเป้าไปที่การประเมินแบบเดียวกัน คุณก็ศึกษาความสัมพันธ์ เปรียบเทียบผลลัพธ์ตามวิธีการของคนอื่นและวิธีของคุณเองได้
หากค่าสัมประสิทธิ์สหสัมพันธ์สูงเกินไป โครงร่างที่สร้างขึ้นจะมีความถูกต้องเชิงนามธรรมที่น่าประทับใจ หากคุณสงสัยเกี่ยวกับสิ่งที่เทคโนโลยีประเมิน ให้เปรียบเทียบผลลัพธ์กับผลลัพธ์สำหรับแผนงานที่ถูกต้องของผู้อื่นซึ่งรับรู้คุณสมบัติที่อยู่ติดกัน (น่าสงสัย) หากค่าสหสัมพันธ์มีขนาดใหญ่เกินคาด ก็สามารถสรุปได้ว่าวิธีการประมาณการไม่ใช่สิ่งที่คาดหวัง
ดังนั้น หากมีแผนอื่นที่มุ่งวัดบรรทัดฐานเดียวกันหรือที่เกี่ยวข้องกันทุกประการ เราสามารถกำหนดความถูกต้องของการเลือกปฏิบัติและการบรรจบกัน
ความแตกต่าง
แล้วการตรวจสอบคืออะไร? กล่าวง่ายๆ ก็คือ นี่คือการแก้ไขผลิตภัณฑ์เพื่อดูว่าตรงกับคุณลักษณะที่ประกาศไว้อย่างไร นั่นคือการตรวจสอบสมาร์ทโฟนจะไม่ผ่านจนกว่าจะถึงเวลานั้น จนกว่าลูกค้าจะแน่ใจว่ามีกล้องและที่เก็บของที่พวกเขายินดีจ่าย
เกณฑ์การตรวจสอบคือการวัดคุณภาพจิตที่เป็นอิสระและตรงจากการทดสอบที่กำลังถูกตรวจสอบและเป้าหมายของโครงการจิตวินิจฉัย
ความถูกต้องในปัจจุบัน - คุณลักษณะของการทดสอบซึ่งสะท้อนถึงความสามารถในการแยกแยะระหว่างวิชาต่างๆ บนพื้นฐานของคุณลักษณะการวินิจฉัยที่เป็นเป้าหมายของการศึกษาในเรื่องนี้วิธีการ
ความถูกต้องของการแข่งขันนั้นประเมินโดยสหสัมพันธ์ของการทดสอบที่สร้างขึ้นกับการทดสอบอื่นๆ ซึ่งความถูกต้องจะสัมพันธ์กับพารามิเตอร์ที่วัดได้ ความถูกต้องเชิงอนุพันธ์สามารถอธิบายได้จากตัวอย่างการทดสอบดอกเบี้ย