ใช้ไม่ได้กับลักษณะการกระเจิง ลักษณะของการกระจายทางสถิติ ระบบการให้ปุ๋ยในการปลูกพืชหมุนเวียน

สำหรับตัวอย่าง เป็นไปได้ที่จะกำหนดคุณลักษณะเชิงตัวเลขจำนวนหนึ่งที่คล้ายกับคุณลักษณะเชิงตัวเลขพื้นฐานของตัวแปรสุ่มในทฤษฎีความน่าจะเป็น (ความคาดหวังทางคณิตศาสตร์ การกระจายตัว ส่วนเบี่ยงเบนมาตรฐาน โหมด ค่ามัธยฐาน) และมีความหมายบางประการ (ซึ่งจะเป็น ชัดเจนในภายหลัง) ค่าโดยประมาณ

ให้แจกแจงทางสถิติของปริมาตรตัวอย่าง nสำหรับความถี่และความถี่สัมพัทธ์:

x ฉัน

x 1

x 2

x เค

n ฉัน

n 1

n 2

n เค


x ฉัน

x 1

x 2

x เค

ฉัน

1

2

เค

ค่าเฉลี่ยตัวอย่างค่าเฉลี่ยเลขคณิตของตัวเลือกทั้งหมดเรียกว่า:

หากเราป้อนตัวประกอบใต้เครื่องหมายผลรวม เราจะได้สูตรสำหรับค่าเฉลี่ยตัวอย่างในรูปของความถี่สัมพัทธ์:

.

โปรดทราบว่าในกรณีของอนุกรมช่วงเวลา ค่าเฉลี่ยตัวอย่างจะคำนวณโดยใช้สูตรเดียวกัน (หากเป็นตัวเลข) เอ็กซ์ 1 , … , เอ็กซ์ เคใช้จุดกึ่งกลางของช่วงเวลา: , … ,.

ความแปรปรวนตัวอย่างคือค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนกำลังสองของค่าตัวอย่างจากค่าเฉลี่ยตัวอย่าง:

ด้วยการแนะนำปัจจัยใต้เครื่องหมายผลรวมอีกครั้ง เราจะได้สูตรสำหรับการกระจายตัวของตัวอย่างในแง่ของความถี่สัมพัทธ์:

การแปลงอย่างง่ายนำไปสู่สูตรที่สะดวกยิ่งขึ้นในการคำนวณความแปรปรวนตัวอย่าง

,

โดยที่ค่าเฉลี่ยตัวอย่างของกำลังสองของตัวแปรสุ่มที่กำลังศึกษาคือ

หากตัวอย่างแสดงด้วยชุดข้อมูลทางสถิติตามช่วงเวลา สูตรสำหรับความแปรปรวนตัวอย่างจะยังคงเหมือนเดิม โดยที่ตามปกติจะเป็นตัวเลข เอ็กซ์ 1 , … , เอ็กซ์ เคจุดกึ่งกลางของช่วงเวลาจะถูกนำไปใช้: , … ,.

ตัวอย่างค่าเบี่ยงเบนมาตรฐานเรียกว่ารากที่สองของความแปรปรวนตัวอย่าง

.

ขอบเขตของการเปลี่ยนแปลง คือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดในกลุ่มตัวอย่าง หากมีการจัดอันดับตัวเลือกในกลุ่มตัวอย่าง (เรียงลำดับจากน้อยไปมาก)

.

ค่าสัมประสิทธิ์ของการแปรผันกำหนดโดยสูตร

.

แฟชั่น โอซีรีย์รูปแบบคือตัวแปรที่มีความถี่สูงสุด (หรือความถี่สัมพัทธ์)

ค่ามัธยฐาน ของอนุกรมรูปแบบคือตัวเลขที่อยู่ตรงกลาง สำหรับชุดข้อมูลแยกที่มีเลขคี่ ตัวเลือกค่ามัธยฐานจะเท่ากับตัวเลือกตรงกลาง หากจำนวนของตัวแปรเป็นเลขคู่ เมดินาจะเท่ากับค่าเฉลี่ย (นั่นคือ ผลรวมครึ่งหนึ่ง) ของตัวแปรกลางสองตัว

คุณลักษณะทางสถิติหลักของชุดการวัด (ชุดการเปลี่ยนแปลง) รวมถึงคุณลักษณะของตำแหน่ง (คุณลักษณะโดยเฉลี่ย หรือแนวโน้มศูนย์กลางของกลุ่มตัวอย่าง) ลักษณะการกระจายตัว (ความแปรผัน หรือการสั่น) และลักษณะของรูปร่างของการกระจาย

ถึง ลักษณะตำแหน่งรวมถึงค่าเฉลี่ยเลขคณิต (ค่าเฉลี่ย) โหมด และค่ามัธยฐาน

ถึงลักษณะการกระเจิง(ความแปรผันหรือความผันผวน) ได้แก่ ช่วงของการแปรผัน การกระจายตัว ส่วนเบี่ยงเบนกำลังสอง (มาตรฐาน) ค่าคลาดเคลื่อนของค่าเฉลี่ยเลขคณิต (ค่าคลาดเคลื่อนโดยเฉลี่ย) ค่าสัมประสิทธิ์ของการแปรผัน เป็นต้น

ไปจนถึงลักษณะของรูปทรงรวมถึงค่าสัมประสิทธิ์ความเบ้ การวัดความเบ้ และความโด่ง

51. การประมาณค่าพารามิเตอร์ของประชากรทั่วไป การประมาณค่าจุดและช่วงเวลา ช่วงความเชื่อมั่น ระดับความสำคัญ

การประมาณค่าพารามิเตอร์ประชากร

มีการประมาณค่าจุดและช่วงเวลาของพารามิเตอร์ทั่วไป

จุด หมายเลขหนึ่ง- การประเมินดังกล่าวรวมถึง ตัวอย่างเช่น

เพื่อให้การประมาณทางสถิติให้ค่าประมาณ "ดี" ของพารามิเตอร์ที่ประมาณไว้ จะต้องเป็น:

    ไม่มีที่อยู่;

    มีประสิทธิภาพ;

    ร่ำรวย.

การประมาณเรียกว่าไม่เอนเอียงหากความคาดหวังทางคณิตศาสตร์ของการกระจายตัวอย่างเกิดขึ้นพร้อมกับค่าของพารามิเตอร์ทั่วไป

การประมาณจุดเรียกว่ามีประสิทธิภาพหากมีความแปรปรวนน้อยที่สุดของการกระจายตัวอย่างเมื่อเปรียบเทียบกับค่าประมาณอื่นที่คล้ายคลึงกัน เช่น แสดงความแปรผันแบบสุ่มน้อยที่สุด

การประมาณค่าแบบจุดจะเรียกว่าสอดคล้องกัน หากขนาดของประชากรตัวอย่างเพิ่มขึ้น ก็มีแนวโน้มที่จะมีค่าของพารามิเตอร์ทั่วไป

ตัวอย่างเช่น,ค่าเฉลี่ยตัวอย่างเป็นการประมาณค่าเฉลี่ยทั่วไปที่สม่ำเสมอและเป็นกลาง สำหรับตัวอย่างจากประชากรปกติ การประมาณค่านี้ก็ใช้ได้ผลเช่นกัน

ด้วยขนาดตัวอย่างที่น้อย การประมาณจุดอาจแตกต่างกันอย่างมากจากพารามิเตอร์ที่ประมาณไว้ เช่น นำไปสู่ข้อผิดพลาดร้ายแรง ด้วยเหตุนี้หากขนาดตัวอย่างน้อยก็ควรใช้ การประมาณช่วงเวลา

ช่วงเวลาเรียกว่าประมาณการที่ถูกกำหนดไว้ ตัวเลขสองตัวสิ้นสุดช่วงเวลา ช่วงความมั่นใจ.

การประมาณช่วงช่วยให้เราสามารถสร้างความแม่นยำและความน่าเชื่อถือของการประมาณการได้

ในการประมาณค่าพารามิเตอร์ทั่วไปโดยใช้ช่วงความเชื่อมั่น จำเป็นต้องมีค่าสามค่า:

ตัวอย่างเช่น ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยทั่วไปจะพบได้จากสูตร: ที่ระดับนัยสำคัญ .

ช่วงความเชื่อมั่น- คำที่ใช้ในสถิติทางคณิตศาสตร์สำหรับการประมาณค่าช่วงของพารามิเตอร์ทางสถิติ ซึ่งเป็นที่นิยมสำหรับกลุ่มตัวอย่างขนาดเล็กมากกว่าการประมาณค่าแบบจุด

ระดับความสำคัญ - นี่คือความน่าจะเป็นที่เราถือว่าความแตกต่างมีนัยสำคัญ แต่จริงๆ แล้วมันเป็นแบบสุ่ม

เมื่อเราระบุว่าความแตกต่างมีนัยสำคัญที่ระดับนัยสำคัญ 5% หรือเมื่อใด < 0,05 แล้วเราหมายถึงความน่าจะเป็นที่ไม่น่าเชื่อถือคือ 0.05

เมื่อเราระบุว่าความแตกต่างมีนัยสำคัญที่ระดับนัยสำคัญ 1% หรือเมื่อใด < 0,01 แล้วเราหมายถึงความน่าจะเป็นที่ไม่น่าเชื่อถือคือ 0.01

หากเราแปลทั้งหมดนี้เป็นภาษาที่เป็นทางการมากขึ้น ระดับนัยสำคัญคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่าง ทั้งที่มันเป็นเรื่องจริง

ข้อผิดพลาดในการปฏิเสธสมมติฐานว่างเมื่อเป็นจริงเรียกว่าข้อผิดพลาดประเภท 1 (ดูตารางที่ 1)

โต๊ะ 1. สมมติฐานว่างและทางเลือกและเงื่อนไขการทดสอบที่เป็นไปได้

ความน่าจะเป็นของข้อผิดพลาดดังกล่าวมักจะแสดงเป็น α. โดยพื้นฐานแล้ว เราจะต้องระบุในวงเล็บไม่ใช่ p < 0.05 หรือหน้า < 0.01 และ α < 0.05 หรือ α < 0,01.

หากมีโอกาสผิดพลาดได้ α จากนั้นความน่าจะเป็นของการตัดสินใจที่ถูกต้อง: 1-α ยิ่ง α น้อยเท่าไร ความน่าจะเป็นในการตัดสินใจที่ถูกต้องก็จะยิ่งมากขึ้นเท่านั้น

ในอดีตก็ได้รับการยอมรับในทางจิตวิทยาว่า ระดับต่ำสุดนัยสำคัญทางสถิติคือระดับ 5% (p≤0.05): เพียงพอคือระดับ 1% (p≤0.01) และค่าสูงสุดคือระดับ 0.1% (p≤0.001) ดังนั้นในตารางค่าวิกฤตจึงมักจะเป็น ค่าของเกณฑ์ที่สอดคล้องกับระดับนัยสำคัญทางสถิติจะได้รับp≤0.05และp≤0.01บางครั้ง - p≤0.001 สำหรับเกณฑ์บางอย่าง ตารางจะระบุระดับนัยสำคัญที่แน่นอนของค่าเชิงประจักษ์ที่แตกต่างกัน ตัวอย่างเช่น สำหรับ φ*=1.56 p=O.06

อย่างไรก็ตาม จนกว่าระดับนัยสำคัญทางสถิติจะถึง p=0.05 เราก็ยังไม่มีสิทธิ์ปฏิเสธสมมติฐานว่าง เราจะปฏิบัติตามกฎต่อไปนี้ในการปฏิเสธสมมติฐานที่ไม่มีความแตกต่าง (Ho) และยอมรับสมมติฐานที่มีนัยสำคัญทางสถิติของความแตกต่าง (H 1)

เหตุผลประการหนึ่งในการทำการวิเคราะห์ทางสถิติคือจำเป็นต้องคำนึงถึงอิทธิพลของปัจจัยสุ่ม (การรบกวน) ที่มีต่อตัวบ่งชี้ที่กำลังศึกษาซึ่งนำไปสู่การกระเจิง (กระจัดกระจาย) ของข้อมูล การแก้ปัญหาที่มีข้อมูลกระจัดกระจายเกี่ยวข้องกับความเสี่ยง เนื่องจากแม้ว่าคุณจะใช้ข้อมูลที่มีอยู่ทั้งหมด คุณก็ทำไม่ได้ทำนายสิ่งที่จะเกิดขึ้นในอนาคต ในการจัดการกับสถานการณ์ดังกล่าวอย่างเพียงพอ ขอแนะนำให้เข้าใจลักษณะของความเสี่ยงและสามารถกำหนดระดับการกระจายตัวของชุดข้อมูลได้มีลักษณะตัวเลขสามประการที่อธิบายการวัดการกระจายตัว ได้แก่ ค่าเบี่ยงเบนมาตรฐาน ช่วง และสัมประสิทธิ์ของการแปรผัน (ความแปรปรวน)
ต่างจากตัวบ่งชี้ทั่วไป (ค่าเฉลี่ย ค่ามัธยฐาน โหมด) ที่แสดงลักษณะศูนย์กลาง โดยจะแสดงลักษณะการกระเจิง ใกล้แค่ไหนค่าแต่ละค่าของชุดข้อมูลจะอยู่ที่ศูนย์กลางนี้ คำจำกัดความของส่วนเบี่ยงเบนมาตรฐานส่วนเบี่ยงเบนมาตรฐาน
(ส่วนเบี่ยงเบนมาตรฐาน) คือการวัดค่าเบี่ยงเบนสุ่มของค่าข้อมูลจากค่าเฉลี่ย ในชีวิตจริง nข้อมูลส่วนใหญ่มีลักษณะการกระเจิง เช่น แต่ละค่าจะอยู่ห่างจากค่าเฉลี่ย เป็นไปไม่ได้ที่จะใช้ค่าเบี่ยงเบนมาตรฐานเป็นลักษณะทั่วไปของการกระเจิงโดยเพียงแค่หาค่าเฉลี่ยความเบี่ยงเบนของข้อมูล เพราะส่วนหนึ่งของการเบี่ยงเบนจะเป็นค่าบวก และอีกส่วนหนึ่งจะเป็นค่าลบ และด้วยเหตุนี้ ผลลัพธ์ของการหาค่าเฉลี่ยจึงอาจเท่ากับ ศูนย์.หากต้องการกำจัดเครื่องหมายลบ ให้ใช้เทคนิคมาตรฐาน: คำนวณก่อน การกระจายตัวเป็นผลรวมของการเบี่ยงเบนกำลังสองหารด้วย ( n–1) จากนั้นจึงนำรากที่สองมาจากค่าผลลัพธ์ n–1) ซึ่งให้การแก้ไขความสุ่มของกลุ่มตัวอย่างเอง
66,7%


เมื่อมีการกระจายชุดข้อมูลตามปกติ ค่าเบี่ยงเบนมาตรฐานจะมีความหมายพิเศษ

ในรูปด้านล่าง จะมีการทำเครื่องหมายที่ด้านใดด้านหนึ่งของค่าเฉลี่ยที่ระยะหนึ่ง สอง และสามส่วนเบี่ยงเบนมาตรฐาน ตามลำดับ

จากตัวเลขแสดงให้เห็นว่าประมาณ 66.7% (สองในสาม) ของค่าทั้งหมดอยู่ในค่าเบี่ยงเบนมาตรฐานหนึ่งค่าที่ด้านใดด้านหนึ่งของค่าเฉลี่ย 95% ของค่าอยู่ในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย และข้อมูลเกือบทั้งหมด (99.7%) จะอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าจากค่าเฉลี่ย

คุณสมบัติของค่าเบี่ยงเบนมาตรฐานสำหรับข้อมูลที่แจกแจงแบบปกตินี้เรียกว่า "กฎสองในสาม"

ในบางสถานการณ์ เช่น การวิเคราะห์การควบคุมคุณภาพผลิตภัณฑ์ มักมีการกำหนดขีดจำกัดเพื่อให้การสังเกต (0.3%) ที่มีค่าเบี่ยงเบนมาตรฐานมากกว่าสามค่าจากค่าเฉลี่ยถือเป็นปัญหาที่คุ้มค่า

ขออภัย หากข้อมูลไม่เป็นไปตามการแจกแจงแบบปกติ กฎที่อธิบายไว้ข้างต้นจะไม่สามารถนำมาใช้ได้

ปัจจุบันมีข้อจำกัดที่เรียกว่ากฎของเชบีเชฟซึ่งสามารถนำไปใช้กับการแจกแจงแบบไม่สมมาตร (เบ้)

สร้างชุดข้อมูลเริ่มต้นของ SV ตารางที่ 1 แสดงการเปลี่ยนแปลงของกำไรรายวันในตลาดหลักทรัพย์ซึ่งบันทึกในวันทำการตั้งแต่วันที่ 31 กรกฎาคมถึง 9 ตุลาคม 2530 สร้างชุดข้อมูลเริ่มต้นของ SV ตารางที่ 1 แสดงการเปลี่ยนแปลงของกำไรรายวันในตลาดหลักทรัพย์ซึ่งบันทึกในวันทำการตั้งแต่วันที่ 31 กรกฎาคมถึง 9 ตุลาคม 2530 สร้างชุดข้อมูลเริ่มต้นของ SV ตารางที่ 1 แสดงการเปลี่ยนแปลงของกำไรรายวันในตลาดหลักทรัพย์ซึ่งบันทึกในวันทำการตั้งแต่วันที่ 31 กรกฎาคมถึง 9 ตุลาคม 2530
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
ตารางที่ 1. การเปลี่ยนแปลงของกำไรรายวันในตลาดหลักทรัพย์
วันที่ กำไรรายวัน
เปิดตัว Excel สร้างไฟล์
คลิกปุ่มบันทึกบนแถบเครื่องมือมาตรฐาน เปิดโฟลเดอร์สถิติในกล่องโต้ตอบที่ปรากฏขึ้นและตั้งชื่อไฟล์ Scattering Characteristics.xls
ตั้งป้ายกำกับ 6. บน Sheet1 ในเซลล์ A1 ให้ตั้งค่าป้ายกำกับ Daily Profit 7. และในช่วง A2:A49 ให้ป้อนข้อมูลจากตารางที่ 1
ตั้งค่าฟังก์ชันค่าเฉลี่ย
8. ในเซลล์ D1 ให้ป้อนป้ายกำกับ ค่าเฉลี่ย ในเซลล์ D2 ให้คำนวณค่าเฉลี่ยโดยใช้ฟังก์ชันทางสถิติ AVERAGE ตั้งค่าฟังก์ชัน STANDARDEVกำไรรายวันเฉลี่ยอยู่ที่ 0.04% (กำไรรายวันเฉลี่ยคือ -0.0004) ซึ่งหมายความว่ากำไรรายวันเฉลี่ยสำหรับช่วงเวลาที่พิจารณาอยู่ที่ประมาณศูนย์ เช่น ตลาดคงอัตราเฉลี่ยไว้
ค่าเบี่ยงเบนมาตรฐานกลายเป็น 0.0118 ซึ่งหมายความว่าหนึ่งดอลลาร์ ($1) ที่ลงทุนในตลาดหุ้นเปลี่ยนแปลงโดยเฉลี่ย 0.0118 ดอลลาร์ต่อวัน กล่าวคือ การลงทุนของเขาอาจส่งผลให้ได้กำไรหรือขาดทุน 0.0118 ดอลลาร์ มาตรวจสอบว่ามูลค่ากำไรรายวันที่ระบุในตารางที่ 1 เป็นไปตามกฎหรือไม่ การกระจายตัวตามปกติ

1. คำนวณช่วงเวลาที่สอดคล้องกับค่าเบี่ยงเบนมาตรฐานด้านใดด้านหนึ่งของค่าเฉลี่ย

2. ในเซลล์ D7, D8 และ F8 ให้ตั้งค่าป้ายกำกับตามลำดับ: ค่าเบี่ยงเบนมาตรฐานหนึ่งค่า ขอบเขตล่าง ขอบเขตบน

3. ในเซลล์ D9 ให้ป้อนสูตร = -0.0004 – 0.0118 และในเซลล์ F9 ให้ป้อนสูตร = -0.0004 + 0.0118 4. ได้ผลลัพธ์ที่แม่นยำถึงทศนิยมตำแหน่งที่สี่ 5. กำหนดจำนวนมูลค่ากำไรรายวันที่อยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งค่า ขั้นแรก กรองข้อมูล โดยปล่อยให้มูลค่ากำไรรายวันอยู่ในช่วง [-0.0121, 0.0114] เมื่อต้องการทำสิ่งนี้ ให้เลือกเซลล์ใดๆ ในคอลัมน์ A ที่มีมูลค่ากำไรรายวัน แล้วรันคำสั่ง:

Data®Filter®ตัวกรองอัตโนมัติ

เปิดเมนูโดยคลิกลูกศรในส่วนหัว กำไรรายวันและเลือก (เงื่อนไข...) ในกล่องโต้ตอบ Custom AutoFilter ให้ตั้งค่าตัวเลือกตามที่แสดงด้านล่าง คลิกตกลง

หากต้องการนับจำนวนข้อมูลที่กรอง ให้เลือกช่วงมูลค่ากำไรรายวัน คลิกขวาที่พื้นที่ว่างในแถบสถานะ และเลือกจำนวนค่าจากเมนูบริบท อ่านผลลัพธ์ ตอนนี้แสดงข้อมูลต้นฉบับทั้งหมดโดยการรันคำสั่ง: Data®Filter®Display All และปิดตัวกรองอัตโนมัติโดยใช้คำสั่ง: Data®Filter®AutoFilter 6. คำนวณเปอร์เซ็นต์ของมูลค่ากำไรรายวันที่อยู่ห่างจากค่าเฉลี่ยหนึ่งส่วนเบี่ยงเบนมาตรฐาน เมื่อต้องการทำเช่นนี้ ให้วางป้ายกำกับในเซลล์ H8, เปอร์เซ็นต์, และในเซลล์ H9 ให้โปรแกรมสูตรคำนวณเปอร์เซ็นต์และรับผลลัพธ์ที่แม่นยำถึงทศนิยมหนึ่งตำแหน่ง 7. คำนวณช่วงมูลค่ากำไรรายวันภายในค่าเบี่ยงเบนมาตรฐานสองค่าจากค่าเฉลี่ย ในเซลล์ D11, D12 และ F12 ให้ตั้งค่าป้ายกำกับตาม:

8. กำหนดจำนวนมูลค่ากำไรรายวันที่อยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าโดยการกรองข้อมูลก่อน

9. คำนวณเปอร์เซ็นต์ของมูลค่ากำไรรายวันที่อยู่ห่างจากค่าเฉลี่ย 2 ส่วน เมื่อต้องการทำเช่นนี้ ให้ใส่ป้ายกำกับในเซลล์ H12 กำไรรายวันและในเซลล์ H13 ให้โปรแกรมสูตรคำนวณเปอร์เซ็นต์แล้วได้ผลลัพธ์ที่แม่นยำถึงทศนิยมหนึ่งตำแหน่ง

10. คำนวณช่วงมูลค่ากำไรรายวันภายในค่าเบี่ยงเบนมาตรฐานสามค่าจากค่าเฉลี่ย ในเซลล์ D15, D16 และ F16 ให้ตั้งค่าป้ายกำกับตาม: สามส่วนเบี่ยงเบนมาตรฐาน, เปอร์เซ็นต์, และในเซลล์ H9 ให้โปรแกรมสูตรคำนวณเปอร์เซ็นต์และรับผลลัพธ์ที่แม่นยำถึงทศนิยมหนึ่งตำแหน่ง- ป้อนสูตรการคำนวณในเซลล์ D17 และ F17 และรับผลลัพธ์ที่แม่นยำถึงทศนิยมตำแหน่งที่สี่

11. กำหนดจำนวนมูลค่ากำไรรายวันที่อยู่ภายในสามส่วนเบี่ยงเบนมาตรฐานโดยการกรองข้อมูลก่อน คำนวณเปอร์เซ็นต์ของมูลค่ากำไรรายวัน เมื่อต้องการทำเช่นนี้ ให้ใส่ป้ายกำกับในเซลล์ H16 กำไรรายวันและในเซลล์ H17 ให้ตั้งโปรแกรมสูตรคำนวณเปอร์เซ็นต์แล้วได้ผลลัพธ์ที่แม่นยำถึงทศนิยมหนึ่งตำแหน่ง

13. สร้างฮิสโตแกรมของผลตอบแทนหุ้นรายวันในตลาดหลักทรัพย์ และวางไว้พร้อมกับตารางการกระจายความถี่ในพื้นที่ J1:S20 แสดงบนฮิสโตแกรมถึงค่าเฉลี่ยโดยประมาณและช่วงเวลาที่สอดคล้องกับค่าเบี่ยงเบนมาตรฐานหนึ่ง สอง และสามจากค่าเฉลี่ย ตามลำดับ

สำหรับการวิเคราะห์ผลลัพธ์ตัวอย่างทางคณิตศาสตร์และสถิติ การรู้เฉพาะคุณลักษณะของตำแหน่งเพียงอย่างเดียวนั้นไม่เพียงพอ ค่าเฉลี่ยเดียวกันสามารถระบุลักษณะตัวอย่างที่แตกต่างกันโดยสิ้นเชิงได้

ดังนั้นนอกจากสถิติแล้วยังพิจารณาด้วย ลักษณะการกระเจิง (รูปแบบต่างๆ หรือ ความผันผวน ) ผลลัพธ์.

1. ช่วงของการเปลี่ยนแปลง

คำนิยาม. ในขอบเขต ความแปรผันคือความแตกต่างระหว่างผลลัพธ์ตัวอย่างที่ใหญ่ที่สุดและเล็กที่สุด ซึ่งแสดงโดย และถูกกำหนดไว้แล้ว

=เอ็กซ์สูงสุด - เอ็กซ์นาที

ค่าข้อมูลของตัวบ่งชี้นี้มีขนาดเล็ก แม้ว่าขนาดตัวอย่างจะน้อย แต่ก็ง่ายต่อการประเมินความแตกต่างระหว่างผลลัพธ์ที่ดีที่สุดและแย่ที่สุดของนักกีฬา

2. ความแปรปรวน

คำนิยาม. ความแปรปรวน เรียกว่ากำลังสองเฉลี่ยของการเบี่ยงเบนของค่าคุณลักษณะจากค่าเฉลี่ยเลขคณิต

สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม ความแปรปรวนจะถูกกำหนดโดยสูตร

ที่ไหน เอ็กซ์ ฉัน– ค่าของแอตทริบิวต์ - ค่าเฉลี่ยเลขคณิต

สำหรับข้อมูลที่จัดกลุ่มตามช่วงเวลา ความแปรปรวนจะถูกกำหนดโดยสูตร

,

ที่ไหน เอ็กซ์ ฉัน– มูลค่าเฉลี่ย ฉัน ช่วงเวลาการจัดกลุ่ม n ฉัน– ความถี่ช่วง

เพื่อให้การคำนวณง่ายขึ้นและเพื่อหลีกเลี่ยงข้อผิดพลาดในการคำนวณเมื่อปัดเศษผลลัพธ์ (โดยเฉพาะอย่างยิ่งเมื่อเพิ่มขนาดตัวอย่าง) จึงมีการใช้สูตรอื่นๆ เพื่อกำหนดค่าความแปรปรวนด้วย หากคำนวณค่าเฉลี่ยเลขคณิตแล้ว สูตรต่อไปนี้จะถูกใช้สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม:

 2 =
,

สำหรับข้อมูลที่จัดกลุ่ม:

.

สูตรเหล่านี้ได้มาจากสูตรก่อนหน้าโดยการเปิดเผยกำลังสองของผลต่างใต้เครื่องหมายผลรวม

ในกรณีที่คำนวณค่าเฉลี่ยเลขคณิตและความแปรปรวนพร้อมกัน จะใช้สูตร:

สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม:

 2 =
,

สำหรับข้อมูลที่จัดกลุ่ม:

.

3. ค่าเฉลี่ยกำลังสอง(มาตรฐาน)ส่วนเบี่ยงเบน

คำนิยาม. จัตุรัสเฉลี่ย (มาตรฐาน ) ส่วนเบี่ยงเบน กำหนดลักษณะระดับความเบี่ยงเบนของผลลัพธ์จากค่าเฉลี่ยในหน่วยสัมบูรณ์ เนื่องจากต่างจากการกระจายตัวตรงที่มีหน่วยการวัดเหมือนกับผลการวัด กล่าวอีกนัยหนึ่ง ค่าเบี่ยงเบนมาตรฐานจะแสดงความหนาแน่นของการกระจายผลลัพธ์ในกลุ่มที่อยู่รอบๆ ค่าเฉลี่ย หรือความเป็นเนื้อเดียวกันของกลุ่ม

สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม ค่าเบี่ยงเบนมาตรฐานสามารถกำหนดได้โดยใช้สูตร

 =
,

 =
หรือ =
.

สำหรับข้อมูลที่จัดกลุ่มตามช่วงเวลา ค่าเบี่ยงเบนมาตรฐานจะถูกกำหนดโดยสูตร:

,

หรือ
.

4. ข้อผิดพลาดของค่าเฉลี่ยเลขคณิต (ข้อผิดพลาดโดยเฉลี่ย)

ค่าเฉลี่ยเลขคณิตผิดพลาด ระบุลักษณะความผันผวนของค่าเฉลี่ยและคำนวณโดยสูตร:

.

ดังที่เห็นได้จากสูตร เมื่อขนาดตัวอย่างเพิ่มขึ้น ความคลาดเคลื่อนของค่าเฉลี่ยจะลดลงตามสัดส่วนรากที่สองของปริมาตรตัวอย่าง

5. ค่าสัมประสิทธิ์ของการแปรผัน

ค่าสัมประสิทธิ์ของการแปรผัน ถูกกำหนดให้เป็นอัตราส่วนของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยเลขคณิต โดยแสดงเป็นเปอร์เซ็นต์:

.

เชื่อกันว่าหากค่าสัมประสิทธิ์การแปรผันไม่เกิน 10% ตัวอย่างนั้นก็ถือได้ว่าเป็นเนื้อเดียวกันนั่นคือได้มาจากประชากรทั่วไปหนึ่งกลุ่ม

วัตถุประสงค์ของการทำงาน

ทำความคุ้นเคยกับปรากฏการณ์การกระเจิงและเรียนรู้ที่จะกำหนดลักษณะของมัน

อุปกรณ์

1. เรตดิสก์ 1 .

2. เรตดิสก์ 2 .

3. ไมโครมิเตอร์.

4. ยืน

1. ข้อมูลทั่วไป

เมื่อชุดชิ้นส่วนถูกผลิตขึ้นโดยใช้กระบวนการทางเทคโนโลยีเดียวกัน โดยคนงานคนเดียวกัน สถานที่ทำงานเดียวกัน ภายใต้เงื่อนไขเดียวกัน ค่าเบี่ยงเบนในค่าของพารามิเตอร์ความแม่นยำของชิ้นส่วนจากต้นแบบในอุดมคติและจากกันและกัน สังเกต นี้ ปรากฏการณ์ได้รับชื่อแล้ว กระเจิง

ในทุกขั้นตอน กระบวนการทางเทคโนโลยีการผลิตชิ้นส่วนนั้นถูกต้อง จำนวนมากการเปลี่ยนแปลงปัจจัยสุ่มและเป็นระบบอย่างต่อเนื่องหรือไม่ต่อเนื่อง

ปัจจัยที่เป็นระบบมี:

– ถาวร (เช่น ข้อผิดพลาดในรูปทรงของพื้นผิวที่กำลังกลึง เกิดจากการนำของเครื่องกลึงไม่ขนานกับแกนสปินเดิล ข้อผิดพลาดในการวัด ฯลฯ)

- การเปลี่ยนแปลงตามกฎหมายบางประการ ย = ฉ(x) (ตัวอย่างเช่น การสึกหรอของเครื่องมือตามขนาด การเปลี่ยนรูปเนื่องจากความร้อนของเครื่องจักร ฯลฯ)

ปัจจัยสุ่มมีลักษณะเป็นส่วนใหญ่ขาดการเชื่อมต่อระหว่างกันและความไม่มั่นคง (ตัวอย่างเช่นการวิดพื้นแบบยืดหยุ่นของการเชื่อมโยงของระบบเอดส์)

ในทางปฏิบัติ ปรากฏการณ์การกระจายตัวของคุณลักษณะคุณภาพใดๆ จะได้รับการศึกษาโดยใช้แผนภาพกระจาย ซึ่งช่วยให้สามารถกำหนดคุณลักษณะทั้งหมดได้

เพื่อสร้าง พล็อตกระจายตามแกน abscissa คือหมายเลขลำดับของการวัดชิ้นส่วนและตามแกนกำหนดในรูปแบบของจุดคือค่าที่ได้รับของจำนวนการวัดชิ้นส่วนที่สอดคล้องกัน (รูปที่ 1.1) เส้นสองเส้นจะถูกลากผ่านจุดที่สอดคล้องกับค่าการวัดสูงสุดและต่ำสุด ขนานกันและกับแกนแอบซิสซา ระยะห่างระหว่างเส้นเหล่านี้เป็นลักษณะแรกของการกระเจิงของค่าและเรียกว่า สนามเร่ร่อน ω = Aไม่มี นาโนเมตร . คุณลักษณะนี้จำเป็นต้องเสริมด้วยพิกัดของจุดศูนย์กลางของสนามกระเจิง – ∆ ω ซึ่งเป็นระยะห่างระหว่างจุดศูนย์กลางของสนามจรจัดและค่าที่ระบุ จะกำหนดตำแหน่งของสนามเร่ร่อนที่สัมพันธ์กับค่าที่ระบุ

คุณลักษณะที่สองของปรากฏการณ์การกระเจิงคือเส้นโค้งการกระเจิงในทางปฏิบัติและพารามิเตอร์ที่กำหนด ในการสร้างเส้นโค้งการกระเจิงในทางปฏิบัติ จำเป็นต้องมีสนามหลงทาง ω บนแผนภาพกระจาย ให้แบ่งเป็นช่วง 7...11 ด้วยเส้นขนานกับแกนแอบซิสซา ในแต่ละช่วงเวลา ให้นับจำนวนผลการวัดที่รวมอยู่ในนั้น (ความถี่สัมบูรณ์ ที)และพรรณนาปริมาณนี้เป็นรูปสี่เหลี่ยมผืนผ้าที่มีความกว้างเท่ากับค่าของช่วงและความสูงเท่ากับความถี่สัมบูรณ์ ต.

แผนภาพผลลัพธ์เรียกว่า กระจายฮิสโตแกรมโดยแสดงความถี่สัมบูรณ์ เราได้รับในรูปแบบของเส้นตรงที่อยู่ตรงกลางของแต่ละช่วงเวลา (พิกัดที่โหลด) และเชื่อมต่อจุดบนกับส่วนของเส้นตรง เส้นขาด, เรียกว่า เส้นโค้งการกระเจิงในทางปฏิบัติค่าการวัด (รูปที่ 2.1)


มะเดื่อ. 1.1. พล็อตกระจายและการปฏิบัติ

เส้นโค้งการกระจายค่าการวัด

พารามิเตอร์ที่กำหนดลักษณะของเส้นโค้งการกระเจิงเชิงปฏิบัติคือ:

1. สมการเส้นโค้งการกระเจิง y = φ(เอ็กซ์). สำหรับปัญหาการประเมินความแม่นยำส่วนใหญ่ในเทคโนโลยีวิศวกรรมเครื่องกล การกระจายค่าปัจจุบัน เอ็กซ์ฉัน ปฏิบัติตามกฎปกติ (กฎของเกาส์) ซึ่ง

นอกจากกฎของเกาส์แล้วค่าปัจจุบัน x ฉันสามารถแจกแจงได้ตามกฎความน่าจะเป็นที่เท่ากัน กฎซิมป์สัน กฎชาร์ลีเยอร์ เป็นต้น

2. ศูนย์การจัดกลุ่มตัวแปรสุ่มคือค่าเฉลี่ยที่มีค่าจำนวนมากที่สุด กล่าวอีกนัยหนึ่ง ศูนย์การจัดกลุ่มคือค่าของตัวแปรสุ่มที่เป็นของส่วนส่วนใหญ่ในชุดงาน ตำแหน่งของศูนย์การจัดกลุ่มถูกกำหนดโดยพิกัดของศูนย์การจัดกลุ่ม (ความคาดหวังทางคณิตศาสตร์) (x).

3. ส่วนเบี่ยงเบนมาตรฐาน σ,แสดงความหนาแน่นของการจัดกลุ่มค่าปัจจุบันสัมพันธ์กับศูนย์กลางของการจัดกลุ่ม (เอ็กซ์). แบบกราฟิก σ ปรากฎเป็น Abscissa สองตัวที่มีระยะห่างเท่ากันจากค่า (x) ตามจำนวน σ, ลักษณะนี้ทำหน้าที่เป็นตัววัดการกระจายตัว

4. ค่าสัมประสิทธิ์ความไม่สมมาตรสัมพัทธ์ a,แสดงให้เห็นการเปลี่ยนแปลงของศูนย์รวมกลุ่ม (เอ็กซ์) สัมพันธ์กับศูนย์กลางของสนามเร่ร่อน สำหรับ ปริมาณที่ไม่ต่อเนื่องมูลค่าปัจจุบัน เอ็กซ์ฉัน ลักษณะเฉพาะ (x), σ และ ถูกกำหนดโดยความเท่าเทียมกัน:

ที่ไหน (x ฉัน) = ที/เอ็น จำนวนค่าการวัดที่ตกอยู่ในช่วงที่สอดคล้องกันโดยแสดงเป็นเปอร์เซ็นต์หรือเศษส่วนของจำนวนค่าที่วัดได้ทั้งหมด (ความถี่สัมพัทธ์)

ลักษณะการกระจายตัวที่คำนวณได้ของค่าการวัดจะแสดงเป็นกราฟิกโดยคำนึงถึงสิ่งนั้น ที่ม. ขวาน µ 0.4/ σ , y σ µ 0.24/σ (รูปที่ 2.2)

ข้าว. 2.2. ลักษณะของปรากฏการณ์การกระเจิง: (x); σ ;



2. การสั่งงาน

งานห้องปฏิบัติการดำเนินการโดยสองทีม ศึกษาปรากฏการณ์การกระเจิงในงานนี้โดยใช้ตัวอย่างชิ้นส่วนสองชุด ๆ ละ 50 ชิ้นที่มีค่าระบุ 1 , 2 .

ติดตั้งชิ้นงาน (50 ครั้ง) ลงในหัวจับแบบสามขากรรไกร และวัดระยะการเคลื่อนที่ตามแนวแกน

เมื่อติดตั้งจะต้องกดชิ้นส่วนให้แน่นโดยให้พื้นผิวด้านท้ายเข้ากับอุปกรณ์และระหว่างการติดตั้งซ้ำ ๆ จะต้องหมุนชิ้นส่วนรอบแกนในมุมที่กำหนด

บันทึกผลการวัดหลังการติดตั้งชิ้นส่วนแต่ละครั้ง

จากผลการวัด ให้สร้างแผนภูมิกระจาย ฮิสโตแกรม และเส้นโค้งการกระเจิงคล้ายกับขั้นตอนที่ 2 .

กำหนดพารามิเตอร์ที่กำหนดลักษณะของเส้นโค้งการกระเจิง คล้ายกับขั้นตอนที่ 3 .

เปรียบเทียบผลการทดลองและสรุปผล

สร้างแผนภาพแสดงคุณลักษณะเหล่านี้ของปรากฏการณ์การกระเจิง (รูปที่ 2.2)

1. ชื่อ วัตถุประสงค์ และอุปกรณ์ของงาน

2. ผลการวัดชิ้นส่วนที่มีค่าระบุ 1 .

3. แผนภาพกระจายและลักษณะของปรากฏการณ์การกระเจิง

4. ผลการวัดชิ้นส่วนที่มีค่าระบุ 2 .

5. แผนภาพกระจายและลักษณะของปรากฏการณ์การกระเจิง

6. ข้อสรุป

4. คำถามเพื่อความปลอดภัย

1. ปรากฏการณ์การกระเจิงคืออะไร?

2. ด้วยความช่วยเหลือจากการศึกษาปรากฏการณ์การกระเจิง

3. บอกลักษณะของปรากฏการณ์การกระเจิง

4. ปัจจัยใดบ้างที่ทำงานในระหว่างกระบวนการผลิตชิ้นส่วน?

5. ปัจจัยเชิงระบบที่รับผิดชอบในแผนภาพกระจายมีอะไรบ้าง?

6. ปัจจัยสุ่มที่รับผิดชอบในแผนภาพกระจายคืออะไร?

7. เหตุใดจำนวนช่วงเวลาจึงควรเป็นเลขคี่เมื่อสร้างเส้นโค้งการกระเจิงในทางปฏิบัติ

8. สนามเร่ร่อนคืออะไร?

9. พิกัดตรงกลางสนามกระจายคือข้อใด

10. เหตุใดเราจึงต้องมีพิกัดตรงกลางสนามกระจาย?

11. ศูนย์รวมกลุ่มคืออะไร?

12. ความคาดหวังทางคณิตศาสตร์คืออะไร?

13. ความคาดหวังทางคณิตศาสตร์แสดงให้เห็นอะไร?

14. อะไรคือการวัดการกระจายตัว?

15. ตั้งชื่อคุณลักษณะของกระบวนการทางเทคโนโลยี

16. ตั้งชื่อลักษณะของปรากฏการณ์การกระเจิงเมื่อประมวลผลชิ้นส่วนเป็นชุด

พร้อมด้วยมูลค่าความเสี่ยงที่เป็นไปได้มากที่สุด สำคัญมีการแพร่กระจายของค่าความเสี่ยงที่เป็นไปได้สัมพันธ์กับค่ากลาง เมื่อคำนึงถึงการแพร่กระจายของตัวบ่งชี้ก็เป็นสิ่งจำเป็นเช่นกันเมื่อแก้ไขปัญหาการติดตามทางสังคมและสุขอนามัย

ลักษณะทั่วไปของการแพร่กระจายของตัวแปรสุ่มคือความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนของตัวแปรสุ่ม ξ แสดงเป็น ดี(ξ) (ใช้สัญกรณ์ด้วย วี(ξ) และ ซิ 2(ξ)) แสดงลักษณะเฉพาะของค่าที่เป็นไปได้มากที่สุดของค่าเบี่ยงเบนกำลังสองของตัวแปรสุ่มจากค่าคาดหวังทางคณิตศาสตร์

สำหรับการรับค่าตัวแปรสุ่มแบบไม่ต่อเนื่อง x ฉันด้วยความน่าจะเป็น เอ่อ ฉันความแปรปรวนถูกกำหนดให้เป็นผลรวมถ่วงน้ำหนักของความแปรปรวนของไนเตรต x ฉันจากความคาดหวังทางคณิตศาสตร์ ξ โดยมีค่าสัมประสิทธิ์การถ่วงน้ำหนักเท่ากับความน่าจะเป็นที่สอดคล้องกัน:

ด(ξ) =

สำหรับตัวแปรสุ่มต่อเนื่อง ξ ความแปรปรวนจะถูกกำหนดโดยสูตร:

ด(ξ) =

การกระจายตัวมีคุณสมบัติที่สำคัญในทางปฏิบัติดังต่อไปนี้:

1. ความแปรปรวนของตัวแปรสุ่มใดๆ ไม่เป็นลบ:

ง(ξ) ≥ 0

2. ความแปรปรวน ค่าคงที่เท่ากับ 0:

ง(ค) = 0

ที่ไหน C เป็นค่าคงที่

3. ความแปรปรวนของตัวแปรสุ่ม ξ เท่ากับความแตกต่างระหว่างความคาดหวังทางคณิตศาสตร์ของกำลังสองของตัวแปรสุ่มนี้กับกำลังสองของความคาดหวังทางคณิตศาสตร์ ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. การเพิ่มค่าคงที่ให้กับตัวแปรสุ่มจะไม่เปลี่ยนความแปรปรวน การคูณตัวแปรสุ่มด้วยค่าคงที่ จะนำไปสู่การคูณความแปรปรวนด้วย 2 :

D(aξ + b) = a 2 D(ξ),

ที่ไหน และ - ค่าคงที่

5. ความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระเท่ากับผลรวมของความแปรปรวน:

โดยที่ ξ และ η เป็นตัวแปรสุ่มอิสระ

ค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม ξ (ใช้คำว่า "ค่าเบี่ยงเบนมาตรฐาน" ด้วย) คือตัวเลข σ (ξ) เท่ากัน รากที่สองจากความแปรปรวน ξ:

ค่าเบี่ยงเบนมาตรฐานจะวัดค่าเบี่ยงเบนของตัวแปรสุ่มจากความคาดหวังทางคณิตศาสตร์ของมันในปริมาณเดียวกับที่ตัวแปรสุ่มถูกวัดเอง (ซึ่งตรงข้ามกับความแปรปรวน ซึ่งมิติจะเท่ากับกำลังสองของมิติของตัวแปรสุ่มดั้งเดิม) . สำหรับการแจกแจงแบบปกติ ค่าเบี่ยงเบนมาตรฐานจะเท่ากับพารามิเตอร์ σ ดังนั้นความคาดหวังทางคณิตศาสตร์และส่วนเบี่ยงเบนมาตรฐานจึงแสดงถึงชุดคุณลักษณะที่สมบูรณ์ของการแจกแจงแบบปกติ และกำหนดประเภทของความหนาแน่นของการแจกแจงโดยเฉพาะ สำหรับการแจกแจงนอกเหนือจากปกติ ตัวบ่งชี้คู่นี้ไม่ใช่ลักษณะการแจกแจงที่มีประสิทธิผลเท่าเทียมกัน


ค่าสัมประสิทธิ์ของการแปรผันยังใช้เป็นคุณลักษณะของการกระเจิงของตัวแปรสุ่มอีกด้วย ค่าสัมประสิทธิ์ของการแปรผันของตัวแปรสุ่ม ξ ซึ่งมีความคาดหวังทางคณิตศาสตร์ที่ไม่เป็นศูนย์คือตัวเลข วี(ξ) เท่ากับอัตราส่วนของค่าเบี่ยงเบนมาตรฐาน ξ ต่อค่าคาดหวังทางคณิตศาสตร์:

ค่าสัมประสิทธิ์ของการแปรผันจะวัดการกระจายตัวของตัวแปรสุ่มโดยเป็นเพียงเศษส่วนของความคาดหวังทางคณิตศาสตร์ และมักแสดงเป็นเปอร์เซ็นต์ของค่าหลัง ไม่ควรใช้คุณลักษณะนี้หากความคาดหวังทางคณิตศาสตร์ใกล้กับ 0 หรือน้อยกว่าค่าเบี่ยงเบนมาตรฐานอย่างมาก (ในกรณีนี้ ข้อผิดพลาดเล็กๆ น้อยๆ ในการพิจารณาความคาดหวังทางคณิตศาสตร์ทำให้เกิดข้อผิดพลาดสูงสำหรับค่าสัมประสิทธิ์ของการแปรผัน) รวมทั้งหาก ประเภทของการกระจายความหนาแน่นแตกต่างอย่างมากจากแบบเกาส์เซียน

ค่าสัมประสิทธิ์ความไม่สมมาตร ( เช่น) กำหนดการเบี่ยงเบนระดับที่ 3 ของตัวแปรสุ่มจากความคาดหวังทางคณิตศาสตร์ และถูกกำหนดโดยสูตร:

ในทางปฏิบัติ ตัวบ่งชี้นี้ใช้เพื่อประเมินความสมมาตรของการแจกแจง สำหรับการกระจายแบบสมมาตรใดๆ จะเท่ากับ 0 หากความหนาแน่นของการกระจายไม่สมมาตร (ซึ่งมักเป็นกรณีที่ประเมินความเสี่ยงต่อการเสียชีวิตและความเสี่ยงที่เกี่ยวข้องกับมลภาวะทางน้ำและอากาศ) ค่าสัมประสิทธิ์ความไม่สมมาตรเชิงบวกจะสอดคล้องกับกรณีที่เมื่อ ไหล่ซ้ายของเส้นโค้งความหนาแน่นชันกว่าด้านขวาและเป็นลบ - ในกรณีที่ไหล่ขวาชันกว่าด้านซ้าย (รูปที่ 4.17)

สำหรับการแจกแจงแบบเบ้ ค่าเบี่ยงเบนมาตรฐานไม่ใช่การวัดการกระจายตัวของตัวแปรสุ่มที่ดี เพื่อระบุลักษณะการกระจายตัวในกรณีนี้ คุณสามารถใช้ตัวบ่งชี้ เช่น ควอไทล์ ควอนไทล์ และเปอร์เซ็นไทล์ได้

ควอไทล์แรกของตัวแปรสุ่ม ξ ที่มีฟังก์ชันการแจกแจง F(x) คือตัวเลข คำถามที่ 1ซึ่งเป็นคำตอบของสมการ

ฉ(ค 1) = 1/4

นั่นคือตัวเลขที่มีความน่าจะเป็นที่ ξ รับค่าน้อยกว่า คำถามที่ 1มีค่าเท่ากับ 1/4 ความน่าจะเป็นที่จะรับค่าที่มากขึ้น คำถามที่ 1เท่ากับ 3/4

ควอไทล์ที่สอง ( คำถามที่ 2) ของตัวแปรสุ่มเรียกว่าค่ามัธยฐาน และตัวที่สาม ( คำถามที่ 3) - วิธีแก้สมการ

ฉ(ค 3) = 3/4

ควอไทล์แบ่งแกน x ออกเป็น 4 ช่วง: [-∞, คำถามที่ 1], [คำถามที่ 1 , คำถามที่ 2], [คำถามที่ 2 , คำถามที่ 3] และ [ คำถามที่ 3, + ∞] โดยแต่ละตัวแปรสุ่มมีค่าความน่าจะเป็นเท่ากัน และตัวเลขที่ล้อมรอบด้วยแกนแอบซิสซาและกราฟความหนาแน่นของการแจกแจงตกเป็น 4 พื้นที่ที่มีพื้นที่เดียวกัน และช่วงเวลาระหว่างควอร์ไทล์ที่หนึ่งและสามประกอบด้วย 50% ของการแจกแจงของตัวแปรสุ่ม สำหรับการแจกแจงแบบสมมาตร ควอร์ไทล์ที่หนึ่งและสามอยู่ห่างจากค่ามัธยฐานเท่ากัน

การสั่งซื้อเชิงปริมาณ ตัวแปรสุ่ม ξ พร้อมฟังก์ชันการแจกแจง F(x) คือตัวเลข เอ็กซ์ซึ่งเป็นคำตอบของสมการ

ดังนั้นควอร์ไทล์จึงเป็นควอไทล์ที่มีลำดับ 0.25, 0.5 และ 0.75 หากลำดับของควอนไทล์ p แสดงเป็นเปอร์เซ็นต์ แสดงว่าค่าที่สอดคล้องกัน เอ็กซ์เรียกว่าเปอร์เซ็นไทล์หรือ - เปอร์เซ็นต์คะแนนการกระจาย

ในรูป รูปที่ 4.18 แสดงจุดการกระจาย 2.5 และ 97.5 เปอร์เซ็นต์ พร้อมด้วยควอนไทล์ ระหว่างจุดเหล่านี้ 95% ของการแจกแจงของตัวแปรสุ่มนั้นมีความเข้มข้น ดังนั้นช่วงระหว่างจุดเหล่านี้จึงเรียกว่าช่วงความเชื่อมั่น 95% ของค่าเฉลี่ย (โดยเฉพาะเมื่อประเมินความเสี่ยง - ช่วงความเชื่อมั่น 95% ของความเสี่ยง)

ภารกิจที่ 2ข้อมูลใดต่อไปนี้เกี่ยวกับตัวแปรสุ่ม ξ ช่วยให้เราสามารถปฏิเสธสมมติฐานที่ว่ามีการกระจายตามกฎปกติ:

ก) ξ - ตัวแปรสุ่มแบบไม่ต่อเนื่อง

b) ความคาดหวังทางคณิตศาสตร์ ξ เป็นลบ

c) การแจกแจงของ ξ เป็นแบบ Unimodal;

d) ความคาดหวังทางคณิตศาสตร์ของ ξ ไม่เท่ากับค่ามัธยฐาน

e) ค่าสัมประสิทธิ์ความไม่สมมาตร ξ เป็นลบ

f) ค่าเบี่ยงเบนมาตรฐานของ ξ มากกว่าที่คาดไว้ทางคณิตศาสตร์

g) ξ แสดงลักษณะการกระจายของระยะเวลาของโรคทางเดินหายใจเฉียบพลันในพื้นที่ศึกษา

h) ξ ระบุลักษณะการกระจายของอายุขัยในพื้นที่ศึกษา

i) ค่ามัธยฐาน ξ ไม่ตรงกับจุดศูนย์กลางของช่วงเวลาระหว่างควอร์ไทล์ที่หนึ่งและสาม

คำตอบ: สมมติฐาน กฎหมายปกติการแจกแจงของตัวแปรสุ่มเข้ากันไม่ได้กับคำสั่ง a), d), e), h), i)

ข้าว. 4.17.การพึ่งพาระหว่างเครื่องหมาย รูปที่.4.18.ควอไทล์และเปอร์เซ็นไทล์:

สัมประสิทธิ์ความไม่สมมาตรและภาพประกอบรูปร่างโดยใช้ฟังก์ชัน

ฟังก์ชันความหนาแน่นของการกระจาย

บทความที่เกี่ยวข้อง