นิทานเด็กออนไลน์ เทพนิยายที่ชื่นชอบ “ผู้หญิงช่างพูด”
ชายชราและหญิงชราเป็นคนช่างพูด เทพนิยาย!! .... กาลครั้งหนึ่ง มีชายชราและหญิงชราคนหนึ่ง หญิงชราไม่สามารถกลั้นลิ้นของเธอได้...
อนุญาต เอ็กซ์ 1 , เอ็กซ์ 2 , ..., เอ็กซ์ n--ปริมาณการสุ่มตัวอย่าง ปจากประชากรที่มีฟังก์ชันการกระจาย เอฟ(x). หากคุณจัดเรียงข้อมูลตัวอย่างตามลำดับที่ไม่ลดลง ระบบจะเรียกชุดข้อมูลผลลัพธ์ ซีรี่ส์รูปแบบ: เอ็กซ์ (1) , เอ็กซ์ (2) , ..., เอ็กซ์ (n)
ตัวอย่างที่ 1 หากตัวอย่างของเล่มที่ 4 เป็นดังนี้: 4, -2, 3, 1 ดังนั้นชุดรูปแบบต่างๆ จะมีลักษณะดังนี้: -2, 1, 3, 4
คำจำกัดความ 1. ฟังก์ชันการแจกแจงเชิงประจักษ์ F เรียกว่า(x) ตัวแปรสุ่มแบบไม่ต่อเนื่อง ซึ่งมีตารางการแจกแจงมีรูปแบบดังนี้
ดังแสดงใน 2.2.1 ฟังก์ชันการแจกแจงของตัวแปรสุ่มแบบไม่ต่อเนื่อง
มีแบบฟอร์มดังนี้
กล่าวอีกนัยหนึ่ง เอฟ n (x) = วี/เอ็น,ที่ไหน โวลต์--จำนวนค่าตัวอย่างเหล่านั้น เอ็กซ์ ฉัน , ซึ่งมีขนาดเล็กกว่า เอ็กซ์
ดังที่เห็นได้จากกราฟฟังก์ชัน เอฟ n (x) เป็นแบบขั้นบันไดและมีความไม่ต่อเนื่องที่จุดต่างๆ เอ็กซ์ (ฉัน)และขนาดของการกระโดดคือ 1 /nหากค่านิยมตรงกัน เอ็กซ์ ฉัน , เลขที่ ถ้า เคค่านิยม เอ็กซ์ (ฉัน)ตรงกัน แล้วขนาดของการกระโดด ณ จุดนี้เท่ากับ เค/เอ็น.
พฤติกรรมที่จำกัดเป็นที่สนใจ เอฟ n (x) ที่ ป.
ทฤษฎีบท 1 ให้ X 1 , เอ็กซ์ 2 , ..., เอ็กซ์ n --ขนาดตัวอย่าง n จากประชากรตามฟังก์ชันการกระจาย F(x)- แล้วเมื่อ n co สำหรับ x ใดๆ 1 ยุติธรรม
เอฟ n (x) ป เอฟ(x),
หรืออีกนัยหนึ่งสำหรับสิ่งใด ๆ > 0,
การพิสูจน์. อนุญาต
ตัวแปรสุ่มแบบไม่ต่อเนื่องโดยที่ P( ฉัน == 0) = ถามและพี( ฉัน = 1) = พี, ไอ = 1. 2..... ป.มันง่ายที่จะเห็นว่า
จากนั้นตามกฎของจำนวนมาก (ดู 2.7.2) สำหรับฟังก์ชันการแจกแจงเชิงประจักษ์ เอฟ n (x) = 1/n n ผม=1 ฉัน ที่ nเราได้รับ
เอฟ n (x) ป เอฟ(x),
ก่อนที่จะกำหนดทฤษฎีบทอื่น เราจะให้คำจำกัดความต่อไปนี้
คำจำกัดความ 2 ลำดับของตัวแปรสุ่ม 1 , 2 , …, n , … มาบรรจบกันด้วยความน่าจะเป็น 1 (หนึ่ง) (หรือเกือบจะแน่นอน) หากมีความเท่าเทียมกันดังต่อไปนี้
ตอนนี้ให้เรากำหนด (โดยไม่ต้องพิสูจน์ สามารถพบได้ใน) ทฤษฎีบทต่อไปนี้
ทฤษฎีบท 2 (กลิเวนโก - คันเทลลี) ภายใต้เงื่อนไขของทฤษฎีบทที่แล้ว มันจะเป็นความจริง
ผลลัพธ์เหล่านี้แสดงให้เห็นโดยรวมแล้ว ปฟังก์ชันการแจกแจงเชิงประจักษ์ให้ค่าประมาณที่ดีกับฟังก์ชันการแจกแจงทางทฤษฎี เอฟ(x).
ตัวอย่างปริมาณ ปจากประชากรที่มีการกระจายอย่างต่อเนื่อง เอฟ(x) ในทางปฏิบัติมักมีการจัดกลุ่มกัน ในกรณีนี้จะไม่ใช่ค่าตัวอย่างที่ระบุ แต่เป็นจำนวนค่าตัวอย่างที่อยู่ในช่วงของพาร์ติชั่นเฉพาะบางส่วนของประชากรทั่วไป (พาร์ติชั่นของชุดค่าที่เป็นไปได้ของตัวแปรสุ่ม ที่มีฟังก์ชันการกระจาย เอฟ(x) - ตามกฎแล้วช่วงเวลาจะมีความยาวเท่ากัน ชม.ถ้าเราแสดงโดย n ฉันจำนวนค่าตัวอย่างที่รวมอยู่ใน ฉัน- ช่วงเวลา จากนั้นช่วงเวลานี้จะถูกใช้เป็นฐานของสี่เหลี่ยมความสูง n ฉัน /นะตัวเลขผลลัพธ์ที่เรียกว่า ฮิสโตแกรมตัวอย่างพื้นที่ของแต่ละสี่เหลี่ยมฮิสโตแกรมเท่ากับความถี่ n ฉัน /nกลุ่มที่เกี่ยวข้อง ที่มีขนาดใหญ่ ปพื้นที่นี้จะประมาณเท่ากับความน่าจะเป็นที่จะตกอยู่ในช่วงเวลาที่สอดคล้องกันนั่นคือ จะประมาณเท่ากับอินทิกรัลของความหนาแน่นของการแจกแจง p( ที) คำนวณในช่วงเวลานี้ ดังนั้น ส่วนบนของโครงร่างฮิสโตแกรมจึงประมาณความหนาแน่นของการกระจายได้ดี
ตัวอย่างที่ 2 ทดสอบความไวของช่องที่ 1 น=ทีวี 40 เครื่อง ข้อมูลการทดสอบจะแสดงในตารางต่อไปนี้ โดยบรรทัดแรกระบุช่วงความไวเป็นไมโครโวลต์ บรรทัดที่สองคือจำนวนโทรทัศน์ที่พบความไวในช่วงเวลานี้:
นี่คือความยาวของช่วงเวลา ชั่วโมง = 50. มาสร้างฮิสโตแกรมกันดีกว่า
วิธีการประมวลผล ED ขึ้นอยู่กับแนวคิดพื้นฐานของทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ ซึ่งรวมถึงแนวคิดเกี่ยวกับประชากรทั่วไป ตัวอย่าง ฟังก์ชันการแจกแจงเชิงประจักษ์
ภายใต้ ประชากรทั่วไปเข้าใจค่าพารามิเตอร์ที่เป็นไปได้ทั้งหมดที่สามารถบันทึกได้ในระหว่างการสังเกตวัตถุแบบไม่จำกัดเวลาเซตดังกล่าวประกอบด้วยองค์ประกอบจำนวนอนันต์ จากการสังเกตวัตถุ ชุดค่าพารามิเตอร์ที่จำกัดในปริมาณจะถูกสร้างขึ้น x 1 , x 2 , …, xn. จากมุมมองที่เป็นทางการ ข้อมูลดังกล่าวเป็นตัวแทน ตัวอย่าง จากประชาชนทั่วไป.
เราจะถือว่าตัวอย่างมีการพัฒนาที่สมบูรณ์ก่อนเหตุการณ์ของระบบ (ไม่มีการเซ็นเซอร์) ค่าที่สังเกตได้ x ฉัน เรียกว่า ตัวเลือก และหมายเลขของพวกเขาคือ ขนาดตัวอย่าง n. เพื่อที่จะได้ข้อสรุปใดๆ จากผลการสังเกต จะต้องมีตัวอย่าง ตัวแทน(ตัวแทน) เช่น เป็นตัวแทนสัดส่วนของประชากรทั่วไปอย่างถูกต้อง เป็นไปตามข้อกำหนดนี้หากขนาดตัวอย่างมีขนาดใหญ่เพียงพอ และแต่ละองค์ประกอบในประชากรมีความน่าจะเป็นที่เท่ากันที่จะรวมไว้ในตัวอย่าง
ปล่อยให้ตัวอย่างผลลัพธ์มีค่า xสังเกตพารามิเตอร์ 1 รายการ n 1 ครั้งค่า x 2 – n 2 ครั้ง แปลว่า xเค – nเค ครั้งหนึ่ง, n 1 +น 2 + … +nเค=n.
เรียกว่าชุดของค่าที่เขียนตามลำดับจากน้อยไปหามาก ซีรีย์การเปลี่ยนแปลง, ปริมาณ n ฉัน – ความถี่และความสัมพันธ์กับขนาดตัวอย่าง nฉัน=n ฉัน /n – ความถี่สัมพัทธ์(ความถี่) แน่นอนว่าผลรวมของความถี่สัมพัทธ์เท่ากับความสามัคคี
การกระจายหมายถึงความสอดคล้องระหว่างตัวแปรที่สังเกตได้กับความถี่หรือความถี่ของพวกมัน อนุญาต nx
– จำนวนการสังเกตซึ่งค่าสุ่มของพารามิเตอร์ เอ็กซ์น้อย x.ความถี่ของเหตุการณ์ เอ็กซ์
การแจกแจง: เอฟn(x) ฟังก์ชันที่ไม่ลดลง ค่าของมันจะอยู่ในส่วน ;
ถ้า x 1 คือค่าที่น้อยที่สุดของพารามิเตอร์ และ xเค – ยิ่งใหญ่ที่สุดแล้ว เอฟn(x)= 0, เมื่อไร x<x 1 , และ เอฟป(xเค)= 1 เมื่อ x>=xเค.
การทำงาน เอฟn(x) ถูกกำหนดโดย ED ซึ่งเป็นสาเหตุว่าทำไมจึงถูกเรียก ฟังก์ชันการกระจายเชิงประจักษ์. ต่างจากฟังก์ชันเชิงประจักษ์ เอฟn(x) ฟังก์ชันการกระจาย เอฟ (x) ของประชากรเรียกว่าฟังก์ชันการแจกแจงเชิงทฤษฎีมันไม่ได้ระบุลักษณะความถี่ แต่เป็นความน่าจะเป็นของเหตุการณ์ เอ็กซ์<x- จากทฤษฎีบทของเบอร์นูลลี จะได้ความถี่ตามนั้น เอฟn(x) มีแนวโน้มความน่าจะเป็นต่อความน่าจะเป็น เอฟ(x) พร้อมกำลังขยายไม่จำกัด n- ดังนั้นเมื่อมีการสังเกตจำนวนมาก ฟังก์ชันการแจกแจงทางทฤษฎี เอฟ(x) สามารถแทนที่ได้ด้วยฟังก์ชันเชิงประจักษ์ เอฟn(x).
กราฟของฟังก์ชันเชิงประจักษ์ เอฟn(x) เป็นเส้นขาด ในช่องว่างระหว่างสมาชิกที่อยู่ติดกันของซีรีส์รูปแบบต่างๆ เอฟn(x) คงที่ เมื่อผ่านจุดแกน xเท่ากับสมาชิกตัวอย่าง เอฟn(x) เกิดการไม่ต่อเนื่องเพิ่มขึ้นทันทีด้วยค่า 1/ nและหากมีเหตุบังเอิญ ลการสังเกต - บน ล/n.
ตัวอย่างที่ 2.1- สร้างชุดความแปรผันและกราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ตามผลการสังเกต ตาราง 2.1.
ตารางที่ 2.1
ฟังก์ชันเชิงประจักษ์ที่ต้องการ รูปที่ 2.1:
ข้าว. 2.1. ฟังก์ชันการกระจายเชิงประจักษ์
ด้วยขนาดตัวอย่างขนาดใหญ่ (แนวคิดของ "ปริมาณมาก" ขึ้นอยู่กับเป้าหมายและวิธีการประมวลผล ในกรณีนี้ เราจะพิจารณา ปใหญ่ถ้า n>40) เพื่อความสะดวกในการประมวลผลและจัดเก็บข้อมูล หันไปจัดกลุ่ม ED ตามช่วงเวลาควรเลือกจำนวนช่วงเวลาเพื่อให้ค่าพารามิเตอร์ที่หลากหลายในการรวมสะท้อนให้เห็นในขอบเขตที่ต้องการและในขณะเดียวกันรูปแบบการกระจายจะไม่ถูกบิดเบือนจากความผันผวนของความถี่สุ่มในแต่ละหมวดหมู่ มีแนวปฏิบัติหลวมๆในการเลือก ปริมาณ yและ ขนาด ชม. ช่วงเวลาดังกล่าว โดยเฉพาะ:
แต่ละช่วงต้องมีองค์ประกอบอย่างน้อย 5–7 รายการ ในระดับที่รุนแรง อนุญาตให้มีเพียงสององค์ประกอบเท่านั้น
จำนวนช่วงเวลาไม่ควรมากหรือเล็กมาก ขั้นต่ำ ค่า y ต้องมีอย่างน้อย 6 – 7ด้วยขนาดตัวอย่างไม่เกินหลายร้อยองค์ประกอบจึงมีคุณค่า y ตั้งค่าไว้ในช่วงตั้งแต่ 10 ถึง 20สำหรับขนาดตัวอย่างที่ใหญ่มาก ( n>1000) จำนวนช่วงเวลาอาจเกินค่าที่ระบุ นักวิจัยบางคนแนะนำให้ใช้อัตราส่วนนี้ y=1.441*ln( n)+1;
ด้วยความไม่สม่ำเสมอที่ค่อนข้างเล็กในความยาวของช่วงเวลาจึงสะดวกในการเลือกค่าเดียวกันและเท่ากับค่า
ชั่วโมง= (xสูงสุด – xนาที)/ปี
ที่ไหน xสูงสุด – สูงสุดและ x min – ค่าต่ำสุดของพารามิเตอร์ หากกฎการกระจายไม่เท่ากันอย่างมีนัยสำคัญ ความยาวของช่วงเวลาสามารถตั้งค่าให้มีขนาดเล็กลงในพื้นที่ที่มีการเปลี่ยนแปลงอย่างรวดเร็วในความหนาแน่นของการกระจาย
หากมีความไม่สม่ำเสมออย่างมีนัยสำคัญ ควรกำหนดองค์ประกอบตัวอย่างให้มีจำนวนเท่ากันโดยประมาณในแต่ละหมวดหมู่ จากนั้นความยาวของช่วงเวลาหนึ่งจะถูกกำหนดโดยค่าสุดขีดขององค์ประกอบตัวอย่างที่จัดกลุ่มไว้ในช่วงเวลานี้เช่น จะแตกต่างกันตามช่วงเวลาที่ต่างกัน (ในกรณีนี้ เมื่อสร้างฮิสโตแกรม จำเป็นต้องมีการทำให้เป็นมาตรฐานตามความยาวของช่วงเวลา - มิฉะนั้นความสูงของแต่ละองค์ประกอบของฮิสโตแกรมจะเท่ากัน)
การจัดกลุ่มผลการสังเกตตามช่วงเวลาจะช่วยให้: การกำหนดช่วงของการเปลี่ยนแปลงในพารามิเตอร์ เอ็กซ์- การเลือกจำนวนช่วงเวลาและขนาด นับสำหรับทุกคน ฉัน-ช่วงเวลาที่ [ xฉัน–xฉัน+1 ] ความถี่ nฉัน หรือความถี่สัมพัทธ์ (ความถี่ n ฉัน) ตัวเลือกจะอยู่ในช่วง เป็นผลให้เกิดการเป็นตัวแทนของ ED ในรูปแบบ ช่วงเวลาหรืออนุกรมทางสถิติ.
ในรูปแบบกราฟิก ชุดข้อมูลทางสถิติจะแสดงในรูปแบบของฮิสโตแกรม รูปหลายเหลี่ยม และเส้นขั้นบันได บ่อยครั้ง ฮิสโตแกรมแสดงเป็นรูปสี่เหลี่ยมผืนผ้าซึ่งมีฐานเป็นช่วงความยาว ชม.และความสูงจะเท่ากับความถี่ที่สอดคล้องกันอย่างไรก็ตาม วิธีการนี้ไม่ถูกต้อง ความสูง ฉัน-สี่เหลี่ยมที่ z ฉันควรเลือกให้เท่าเทียมกัน nฉัน/ (นะ- ฮิสโตแกรมดังกล่าวสามารถตีความได้ว่าเป็นการแสดงกราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ ฉn(x) ในนั้นพื้นที่รวมของสี่เหลี่ยมทั้งหมดจะเป็นหนึ่งเดียว ฮิสโตแกรมช่วยในการเลือกประเภทของฟังก์ชันการแจกแจงทางทฤษฎีสำหรับการประมาณค่า ED
รูปหลายเหลี่ยมเรียกว่าเส้นขาด ซึ่งเป็นส่วนที่เชื่อมต่อจุดกับพิกัดตามแกนแอบซิสซาเท่ากับจุดกึ่งกลางของช่วง และตามแกนกำหนดเท่ากับความถี่ที่สอดคล้องกัน ฟังก์ชันการแจกแจงเชิงประจักษ์จะแสดงเป็นเส้นขาดแบบขั้น: ส่วนของเส้นแนวนอนจะถูกลากไปในแต่ละช่วงเวลาที่ความสูงเป็นสัดส่วนกับความถี่สะสมในช่วงเวลาปัจจุบัน ความถี่สะสมจะเท่ากับผลรวมของความถี่ทั้งหมด โดยเริ่มจากความถี่แรกและจนถึงช่วงนี้ด้วย
ตัวอย่างที่ 2.2- มีผลลัพธ์ของค่าการลดทอนสัญญาณการบันทึก xฉัน ที่ความถี่ 1,000 Hz ของช่องสวิตช์ของเครือข่ายโทรศัพท์ ค่าเหล่านี้ซึ่งวัดเป็น dB จะแสดงในรูปแบบของชุดรูปแบบต่างๆ ในตาราง 2.3. มีความจำเป็นต้องสร้างชุดข้อมูลทางสถิติ
ตารางที่ 2.3
ฉัน | |||||||||||
xฉัน | 25,79 | 25,98 | 25,98 | 26,12 | 26,13 | 26,49 | 26,52 | 26,60 | 26,66 | 26,69 | 26,74 |
ฉัน | |||||||||||
xฉัน | 26,85 | 26,90 | 26,91 | 26,96 | 27,02 | 27,11 | 27,19 | 27,21 | 27,28 | 27,30 | 27,38 |
ฉัน | |||||||||||
xฉัน | 27,40 | 27,49 | 27,64 | 27,66 | 27,71 | 27,78 | 27,89 | 27,89 | 28,01 | 28,10 | 28,11 |
ฉัน | |||||||||||
xฉัน | 28,37 | 28,38 | 28,50 | 28,63 | 28,67 | 28,90 | 28,99 | 28,99 | 29,03 | 29,12 | 29,28 |
สารละลาย- ควรเลือกจำนวนหลักของชุดข้อมูลทางสถิติให้น้อยที่สุดเท่าที่จะทำได้เพื่อให้แน่ใจว่ามีจำนวนการเข้าชมเพียงพอในแต่ละชุด ลองใช้ y = 6 มากำหนดขนาดของตัวเลขกัน
ชั่วโมง =(xสูงสุด – xนาที)/y =(29.28 – 25.79)/6 = 0.58
มาจัดกลุ่มการสังเกตตามหมวดหมู่ ตาราง 2.4.
ตารางที่ 2.4
ฉัน | ||||||
xฉัน | 25,79 | 26,37 | 26,95 | 27,5 3 | 28,12 | 28,70 |
nฉัน | ||||||
n ฉัน=nฉัน/n | 0,114 | 0,205 | 0,227 | 0,205 | 0,11 4 | 0,136 |
z ฉัน =NIH | 0,196 | 0,353 | 0,392 | 0,353 | 0,196 | 0,235 |
จากอนุกรมทางสถิติ เราจะสร้างฮิสโตแกรม รูปที่ 1 2.2 และกราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ รูปที่. 2.3.
กราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ รูปที่ 1 2.3 แตกต่างจากกราฟที่แสดงในรูปที่ 2.1 ความเท่าเทียมกันของขั้นตอนการเปลี่ยนแปลงของตัวเลือกและขนาดของขั้นตอนการเพิ่มของฟังก์ชัน (เมื่อสร้างโดยใช้ชุดรูปแบบต่างๆ ขั้นตอนการเพิ่มขึ้นจะเป็นจำนวนทวีคูณ
1/ nและตามชุดทางสถิติ - ขึ้นอยู่กับความถี่ในหมวดหมู่เฉพาะ)
การแสดง ED ที่ได้รับการพิจารณานั้นเป็นการแสดงเริ่มต้นสำหรับการประมวลผลและการคำนวณพารามิเตอร์ต่างๆ ในภายหลัง
ค่าเฉลี่ยตัวอย่าง
ให้แยกตัวอย่างขนาด n เพื่อศึกษาประชากรทั่วไปเกี่ยวกับคุณลักษณะเชิงปริมาณ X
ค่าเฉลี่ยตัวอย่างคือค่าเฉลี่ยเลขคณิตของคุณลักษณะในประชากรตัวอย่าง
ความแปรปรวนตัวอย่าง
เพื่อสังเกตการกระจายตัวของลักษณะเชิงปริมาณของค่าตัวอย่างรอบค่าเฉลี่ย จะมีการแนะนำคุณลักษณะสรุป - ความแปรปรวนของตัวอย่าง
ความแปรปรวนตัวอย่างคือค่าเฉลี่ยเลขคณิตของกำลังสองของการเบี่ยงเบนของค่าที่สังเกตได้ของคุณลักษณะจากค่าเฉลี่ย
หากค่าทั้งหมดของคุณลักษณะตัวอย่างแตกต่างกันแล้ว
แก้ไขความแปรปรวนแล้ว
ความแปรปรวนตัวอย่างเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเอนเอียง กล่าวคือ ความคาดหวังทางคณิตศาสตร์ของความแปรปรวนตัวอย่างไม่เท่ากับค่าความแปรปรวนทั่วไปโดยประมาณ แต่จะเท่ากับ
หากต้องการแก้ไขความแปรปรวนตัวอย่าง ให้คูณด้วยเศษส่วน
ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างพบได้จากสูตร
โดยที่ ตัวอย่างค่าเบี่ยงเบนมาตรฐานของค่า และ .
ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างแสดงความใกล้ชิดของความสัมพันธ์เชิงเส้นระหว่าง และ : ยิ่งใกล้กับเอกภาพมากเท่าใด ความสัมพันธ์เชิงเส้นระหว่าง และ ก็จะยิ่งแข็งแกร่งมากขึ้นเท่านั้น
23. รูปหลายเหลี่ยมความถี่คือเส้นขาดที่แต่ละส่วนเชื่อมต่อกัน ในการสร้างรูปหลายเหลี่ยมความถี่ รูปแบบต่างๆ จะถูกพล็อตบนแกน Abscissa และความถี่ที่สอดคล้องกันจะถูกพล็อตบนแกนพิกัด และจุดต่างๆ จะเชื่อมต่อกันด้วยส่วนของเส้นตรง
รูปหลายเหลี่ยมความถี่สัมพัทธ์ถูกสร้างขึ้นในลักษณะเดียวกัน ยกเว้นว่าความถี่สัมพัทธ์จะถูกพล็อตบนแกนพิกัด
ฮิสโตแกรมความถี่คือรูปขั้นบันไดที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงความยาว h บางส่วน และความสูงเท่ากับอัตราส่วน ในการสร้างฮิสโตแกรมความถี่ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa ที่ระยะห่าง (ความสูง) จะถูกวาดไว้เหนือพวกมัน พื้นที่ของสี่เหลี่ยม i-th เท่ากับผลรวมของความถี่ของช่วงเวลา i-o ดังนั้นพื้นที่ของฮิสโตแกรมความถี่จึงเท่ากับผลรวมของความถี่ทั้งหมดนั่นคือ ขนาดตัวอย่าง.
ฟังก์ชันการกระจายเชิงประจักษ์
ที่ไหน ไม่มี- จำนวนค่าตัวอย่างน้อยกว่า x; n- ขนาดตัวอย่าง.
22ให้เรานิยามแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์กัน
.แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ ประชากรและกลุ่มตัวอย่าง อนุกรมความแปรผัน อนุกรมทางสถิติ ตัวอย่างที่จัดกลุ่ม ชุดสถิติที่จัดกลุ่ม รูปหลายเหลี่ยมความถี่ ฟังก์ชันการกระจายตัวอย่างและฮิสโตแกรม
ประชากร– ชุดวัตถุที่มีอยู่ทั้งหมด
ตัวอย่าง– ชุดวัตถุที่สุ่มเลือกจากประชากรทั่วไป
เรียกว่าลำดับของตัวเลือกที่เขียนตามลำดับจากน้อยไปหามาก แปรผันบริเวณใกล้เคียง และรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ - ชุดสถิติ: สุ่มเลือกจากประชากรทั่วไป
รูปหลายเหลี่ยมความถี่เรียกว่าเส้นขาดซึ่งเป็นส่วนที่เชื่อมต่อจุดต่างๆ
ฮิสโตแกรมความถี่เป็นรูปขั้นบันไดที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงย่อยของความยาว h และความสูงเท่ากับอัตราส่วน
ฟังก์ชันการกระจายตัวอย่าง (เชิงประจักษ์)เรียกใช้ฟังก์ชัน ฉ*(x) ซึ่งกำหนดสำหรับแต่ละค่า เอ็กซ์ความถี่สัมพัทธ์ของเหตุการณ์ เอ็กซ์< x.
หากมีการศึกษาคุณลักษณะต่อเนื่องบางอย่าง อนุกรมรูปแบบต่างๆ อาจประกอบด้วยตัวเลขจำนวนมาก ในกรณีนี้จะสะดวกกว่าในการใช้งาน ตัวอย่างที่จัดกลุ่ม- เพื่อให้ได้มาซึ่งช่วงเวลาที่มีค่าที่สังเกตได้ทั้งหมดของคุณลักษณะจะถูกแบ่งออกเป็นช่วงความยาวบางส่วนที่เท่ากันหลายช่วง ชม.แล้วค้นหาช่วงเวลาย่อยแต่ละช่วง ฉัน– ผลรวมของความถี่ของตัวแปรที่รวมอยู่ใน ฉันช่วงเวลาที่.
20. ไม่ควรเข้าใจกฎแห่งจำนวนมากเช่นเดียวกับกฎทั่วไปข้อใดข้อหนึ่งที่เกี่ยวข้องกับจำนวนมาก กฎของจำนวนมากเป็นชื่อทั่วไปสำหรับทฤษฎีบทหลาย ๆ ข้อ ซึ่งตามมาด้วยจำนวนการทดลองที่เพิ่มขึ้นอย่างไม่จำกัด ค่าเฉลี่ยมีแนวโน้มที่จะมีค่าคงที่ที่แน่นอน
ซึ่งรวมถึงทฤษฎีบทของ Chebyshev และ Bernoulli ทฤษฎีบทของเชบีเชฟเป็นกฎทั่วไปที่สุดของจำนวนจำนวนมาก
การพิสูจน์ทฤษฎีบทซึ่งรวมกันเป็นคำว่า "กฎของจำนวนมาก" นั้นขึ้นอยู่กับความไม่เท่าเทียมกันของ Chebyshev ซึ่งสร้างความน่าจะเป็นที่จะเบี่ยงเบนไปจากความคาดหวังทางคณิตศาสตร์:
19การแจกแจงแบบเพียร์สัน (ไค - สแควร์) - การแจกแจงของตัวแปรสุ่ม
ตัวแปรสุ่มอยู่ที่ไหน X 1, X 2,…, Xnเป็นอิสระและมีการกระจายตัวเหมือนกัน เอ็น(0,1) ในกรณีนี้จำนวนเทอมคือ nเรียกว่า “จำนวนองศาอิสระ” ของการแจกแจงแบบไคสแควร์
การแจกแจงแบบไคสแควร์ใช้ในการประมาณค่าความแปรปรวน (โดยใช้ช่วงความเชื่อมั่น) เมื่อทดสอบสมมติฐานของข้อตกลง ความสม่ำเสมอ ความเป็นอิสระ
การกระจาย ที t ของนักเรียนคือการแจกแจงของตัวแปรสุ่ม
ตัวแปรสุ่มอยู่ที่ไหน ยูและ เอ็กซ์เป็นอิสระ, ยูมีการแจกแจงแบบปกติมาตรฐาน เอ็น(0.1) และ เอ็กซ์– การกระจายไค – กำลังสอง c nระดับความอิสระ. โดยที่ nเรียกว่า “จำนวนองศาอิสระ” ของการแจกแจงนักศึกษา
ใช้ในการประมาณค่าความคาดหวังทางคณิตศาสตร์ ค่าพยากรณ์ และคุณลักษณะอื่น ๆ โดยใช้ช่วงความเชื่อมั่น การทดสอบสมมติฐานเกี่ยวกับค่าความคาดหวังทางคณิตศาสตร์ ค่าสัมประสิทธิ์การถดถอย
การแจกแจงแบบฟิชเชอร์คือการแจกแจงของตัวแปรสุ่ม
การแจกแจงแบบฟิชเชอร์จะใช้เมื่อทดสอบสมมติฐานเกี่ยวกับความเพียงพอของแบบจำลองในการวิเคราะห์การถดถอย ความเท่าเทียมกันของความแปรปรวน และในปัญหาอื่นๆ ของสถิติประยุกต์
18การถดถอยเชิงเส้นเป็นเครื่องมือทางสถิติที่ใช้ในการทำนายราคาในอนาคตโดยอาศัยข้อมูลในอดีต และมักจะใช้เพื่อพิจารณาว่าเมื่อใดที่ราคามีความร้อนสูงเกินไป วิธีกำลังสองน้อยที่สุดใช้เพื่อสร้างเส้นตรงที่ "เหมาะสมที่สุด" ผ่านชุดจุดมูลค่าราคา จุดราคาที่ใช้เป็นอินพุตสามารถเป็นอย่างใดอย่างหนึ่งต่อไปนี้: เปิด, ปิด, สูง, ต่ำ,
17. ตัวแปรสุ่มสองมิติคือชุดลำดับของตัวแปรสุ่มสองตัวหรือ
ตัวอย่าง: มีการโยนลูกเต๋าสองลูก – จำนวนแต้มที่ทอยบนลูกเต๋าลูกที่หนึ่งและลูกที่สองตามลำดับ
วิธีสากลในการระบุกฎการแจกแจงของตัวแปรสุ่มแบบสองมิติคือฟังก์ชันการแจกแจง
15.m.o ตัวแปรสุ่มแบบไม่ต่อเนื่อง
คุณสมบัติ:
1) ม(ค) = ค, ค- คงที่;
2) ม(CX) = ซี.เอ็ม.(เอ็กซ์);
3) ม(เอ็กซ์ 1 + เอ็กซ์ 2) = ม(เอ็กซ์ 1) + ม(เอ็กซ์ 2), ที่ไหน เอ็กซ์ 1, เอ็กซ์ 2- ตัวแปรสุ่มอิสระ
4) ม(เอ็กซ์ 1 เอ็กซ์ 2) = ม(เอ็กซ์ 1)ม(เอ็กซ์ 2).
ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์ของพวกเขา กล่าวคือ
ความคาดหวังทางคณิตศาสตร์ของความแตกต่างระหว่างตัวแปรสุ่มจะเท่ากับความแตกต่างของความคาดหวังทางคณิตศาสตร์ของพวกเขา กล่าวคือ
ความคาดหวังทางคณิตศาสตร์ของผลิตภัณฑ์ของตัวแปรสุ่มจะเท่ากับผลคูณของความคาดหวังทางคณิตศาสตร์ของพวกเขา กล่าวคือ
หากค่าทั้งหมดของตัวแปรสุ่มเพิ่มขึ้น (ลดลง) ด้วยตัวเลข C เท่ากัน ความคาดหวังทางคณิตศาสตร์ของมันจะเพิ่มขึ้น (ลดลง) ด้วยจำนวนเดียวกัน
14. เอ็กซ์โปเนนเชียล(เอ็กซ์โปเนนเชียล)กฎหมายการกระจาย เอ็กซ์มีกฎการแจกแจงแบบเอกซ์โปเนนเชียลพร้อมพารามิเตอร์ γ >0 หากความหนาแน่นของความน่าจะเป็นมีรูปแบบ:
มูลค่าที่คาดหวัง: .
การกระจายตัว: .
กฎการกระจายแบบเอ็กซ์โปเนนเชียลมีบทบาทสำคัญในทฤษฎีการเข้าคิวและทฤษฎีความน่าเชื่อถือ
13. กฎการแจกแจงแบบปกติมีลักษณะเป็นความถี่ความล้มเหลว a (t) หรือความหนาแน่นของความน่าจะเป็นของความล้มเหลว f (t) ของรูปแบบ:
, (5.36)
โดยที่ σ คือค่าเบี่ยงเบนมาตรฐานของ SV x;
ม x– ความคาดหวังทางคณิตศาสตร์ของ SV x- พารามิเตอร์นี้มักเรียกว่าจุดศูนย์กลางการกระจายตัวหรือค่า SV ที่เป็นไปได้มากที่สุด เอ็กซ์.
x– ตัวแปรสุ่มซึ่งสามารถพิจารณาเป็นเวลา ค่ากระแส ค่าแรงดันไฟฟ้า และอาร์กิวเมนต์อื่นๆ
กฎปกติคือกฎสองพารามิเตอร์ ในการเขียนซึ่งคุณต้องรู้ m xและ σ
การแจกแจงแบบปกติ (การแจกแจงแบบเกาส์เซียน) ใช้เพื่อประเมินความน่าเชื่อถือของผลิตภัณฑ์ที่ได้รับผลกระทบจากปัจจัยสุ่มจำนวนหนึ่ง ซึ่งแต่ละปัจจัยจะมีผลกระทบต่อผลลัพธ์เล็กน้อย
12. กฎหมายการกระจายเครื่องแบบ- ตัวแปรสุ่มต่อเนื่อง เอ็กซ์มีกฎหมายการกระจายแบบสม่ำเสมอในส่วน [ ก, ข] หากความหนาแน่นของความน่าจะเป็นคงที่ในส่วนนี้และเท่ากับศูนย์ด้านนอกนั่นคือ
การกำหนด: .
มูลค่าที่คาดหวัง: .
การกระจายตัว: .
ค่าสุ่ม เอ็กซ์กระจายตามกฎหมายเดียวกันในส่วนที่เรียกว่า หมายเลขสุ่มจาก 0 ถึง 1 ทำหน้าที่เป็นวัสดุเริ่มต้นในการรับตัวแปรสุ่มตามกฎการแจกแจงใดๆ กฎการกระจายแบบสม่ำเสมอใช้ในการวิเคราะห์ข้อผิดพลาดในการปัดเศษเมื่อทำการคำนวณเชิงตัวเลข ในชุดปัญหาการเข้าคิว ในการสร้างแบบจำลองทางสถิติของการสังเกตภายใต้การแจกแจงที่กำหนด
11. คำนิยาม.ความหนาแน่นของการกระจายความน่าจะเป็นของตัวแปรสุ่มต่อเนื่อง X เรียกว่าฟังก์ชัน ฉ(x)– อนุพันธ์อันดับหนึ่งของฟังก์ชันการแจกแจง F(x)
ความหนาแน่นของการกระจายเรียกอีกอย่างว่า ฟังก์ชันดิฟเฟอเรนเชียล- ในการอธิบายตัวแปรสุ่มแบบไม่ต่อเนื่อง ความหนาแน่นของการแจกแจงเป็นสิ่งที่ยอมรับไม่ได้
ความหมายของความหนาแน่นของการแจกแจงคือ แสดงว่าตัวแปรสุ่ม X ปรากฏขึ้นในย่านใกล้เคียงจุดใดจุดหนึ่งบ่อยเพียงใด เอ็กซ์เมื่อทำการทดลองซ้ำ
หลังจากแนะนำฟังก์ชันการแจกแจงและความหนาแน่นของการแจกแจงแล้ว จะสามารถให้คำจำกัดความต่อไปนี้ของตัวแปรสุ่มต่อเนื่องได้
10. ความหนาแน่นของความน่าจะเป็น ความหนาแน่นของการแจกแจงความน่าจะเป็นของตัวแปรสุ่ม x คือฟังก์ชัน p(x) โดยที่
และสำหรับก< b вероятность события a < x < b равна
.
ถ้า p(x) ต่อเนื่องกัน แล้วสำหรับค่า ∆x ที่น้อยเพียงพอ ความน่าจะเป็นของอสมการ x< X < x+∆x приближенно равна p(x) ∆x (с точностью до малых более высокого порядка). Функция распределения F(x) случайной величины x, связана с плотностью распределения соотношениями
และถ้า F(x) สามารถหาอนุพันธ์ได้
การหาฟังก์ชันการกระจายเชิงประจักษ์
ให้ $X$ เป็นตัวแปรสุ่ม $F(x)$ คือฟังก์ชันการแจกแจงของตัวแปรสุ่มที่กำหนด เราจะทำการทดลอง $n$ กับตัวแปรสุ่มที่กำหนดภายใต้เงื่อนไขเดียวกัน โดยเป็นอิสระจากกัน ในกรณีนี้เราได้รับลำดับของค่า $x_1,\ x_2\ $, ... ,$\ x_n$ ซึ่งเรียกว่าตัวอย่าง
คำจำกัดความ 1
แต่ละค่า $x_i$ ($i=1,2\ $, ... ,$ \ n$) เรียกว่าตัวแปร
ค่าประมาณหนึ่งของฟังก์ชันการแจกแจงทางทฤษฎีคือฟังก์ชันการแจกแจงเชิงประจักษ์
คำจำกัดความ 3
ฟังก์ชันการแจกแจงเชิงประจักษ์ $F_n(x)$ เป็นฟังก์ชันที่กำหนดสำหรับแต่ละค่า $x$ ความถี่สัมพัทธ์ของเหตุการณ์ $X \
โดยที่ $n_x$ คือจำนวนตัวเลือกที่น้อยกว่า $x$, $n$ คือขนาดตัวอย่าง
ความแตกต่างระหว่างฟังก์ชันเชิงประจักษ์และฟังก์ชันทางทฤษฎีก็คือ ฟังก์ชันทางทฤษฎีจะกำหนดความน่าจะเป็นของเหตุการณ์ $X
ให้เราพิจารณาคุณสมบัติพื้นฐานหลายประการของฟังก์ชันการแจกแจง
ช่วงของฟังก์ชัน $F_n\left(x\right)$ คือส่วน $$
$F_n\left(x\right)$ เป็นฟังก์ชันที่ไม่ลดลง
$F_n\left(x\right)$ เป็นฟังก์ชันต่อเนื่องทางซ้าย
$F_n\left(x\right)$ เป็นฟังก์ชันคงที่ทีละชิ้นและเพิ่มเฉพาะจุดของค่าของตัวแปรสุ่ม $X$
ให้ $X_1$ เป็นตัวเลือกที่เล็กที่สุดและ $X_n$ เป็นตัวเลือกที่ใหญ่ที่สุด จากนั้น $F_n\left(x\right)=0$ สำหรับ $(x\le X)_1$ และ $F_n\left(x\right)=1$ สำหรับ $x\ge X_n$
ให้เราแนะนำทฤษฎีบทที่เชื่อมโยงฟังก์ชันทางทฤษฎีและเชิงประจักษ์
ทฤษฎีบท 1
ให้ $F_n\left(x\right)$ เป็นฟังก์ชันการแจกแจงเชิงประจักษ์ และ $F\left(x\right)$ เป็นฟังก์ชันการแจกแจงทางทฤษฎีของกลุ่มตัวอย่างทั่วไป จากนั้นความเท่าเทียมกันจะคงอยู่:
\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]
ตัวอย่างที่ 1
ให้การกระจายตัวอย่างมีข้อมูลต่อไปนี้บันทึกโดยใช้ตาราง:
ภาพที่ 1.
ค้นหาขนาดตัวอย่าง สร้างฟังก์ชันการแจกแจงเชิงประจักษ์ แล้วลงจุด
ขนาดตัวอย่าง: $n=5+10+15+20=50$
ตามคุณสมบัติ 5 เราได้สิ่งนั้นสำหรับ $x\le 1$ $F_n\left(x\right)=0$ และสำหรับ $x>4$ $F_n\left(x\right)=1$
มูลค่า $x
มูลค่า $x
มูลค่า $x
ดังนั้นเราจึงได้:
รูปที่ 2.
รูปที่ 3.
ตัวอย่างที่ 2
สุ่มเลือก 20 เมืองจากเมืองทางตอนกลางของรัสเซียซึ่งได้รับข้อมูลค่าโดยสารระบบขนส่งสาธารณะดังต่อไปนี้: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.
สร้างฟังก์ชันการแจกแจงเชิงประจักษ์สำหรับตัวอย่างนี้แล้วลงจุด
มาเขียนค่าตัวอย่างตามลำดับจากน้อยไปมากแล้วคำนวณความถี่ของแต่ละค่า เราได้รับตารางต่อไปนี้:
รูปที่ 4.
ขนาดตัวอย่าง: $n=20$.
ตามคุณสมบัติ 5 เราได้สิ่งนั้นสำหรับ $x\le 12$ $F_n\left(x\right)=0$ และสำหรับ $x>15$ $F_n\left(x\right)=1$
มูลค่า $x
มูลค่า $x
มูลค่า $x
ดังนั้นเราจึงได้:
รูปที่ 5.
ลองพล็อตการกระจายเชิงประจักษ์:
รูปที่ 6.
ความคิดริเริ่ม: $92.12\%$.
ซีรี่ส์รูปแบบต่างๆ รูปหลายเหลี่ยมและฮิสโตแกรม
ช่วงการจัดจำหน่าย- แสดงถึงการกระจายอย่างเป็นระเบียบของหน่วยประชากรที่กำลังศึกษาออกเป็นกลุ่มตามลักษณะเฉพาะที่แตกต่างกัน
ขึ้นอยู่กับลักษณะเฉพาะที่เป็นรากฐานของการก่อตัวของซีรีย์การจัดจำหน่าย ที่มาและการเปลี่ยนแปลงแถวการแจกจ่าย:
§ เรียกว่าชุดการแจกแจงที่สร้างขึ้นโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปน้อยของค่าลักษณะเชิงปริมาณ แปรผัน.
ชุดรูปแบบการแจกแจงประกอบด้วยสองคอลัมน์:
คอลัมน์แรกระบุค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันซึ่งเรียกว่า ตัวเลือกและถูกกำหนดไว้ ตัวเลือกแบบไม่ต่อเนื่อง - แสดงเป็นจำนวนเต็ม ตัวเลือกช่วงเวลามีตั้งแต่และถึง คุณสามารถสร้างชุดความแปรผันแบบแยกหรือแบบช่วงเวลาได้ ขึ้นอยู่กับประเภทของตัวเลือก
คอลัมน์ที่สองประกอบด้วย จำนวนตัวเลือกเฉพาะแสดงในรูปของความถี่หรือความถี่:
ความถี่- เหล่านี้เป็นตัวเลขสัมบูรณ์ซึ่งแสดงจำนวนครั้งโดยรวมของมูลค่าที่กำหนดของคุณลักษณะที่เกิดขึ้นซึ่งแสดงถึง ผลรวมของความถี่ทั้งหมดจะต้องเท่ากับจำนวนหน่วยในประชากรทั้งหมด
ความถี่() คือความถี่ที่แสดงเป็นเปอร์เซ็นต์ของทั้งหมด ผลรวมของความถี่ทั้งหมดที่แสดงเป็นเปอร์เซ็นต์จะต้องเท่ากับ 100% ในเศษส่วนของหนึ่ง
การแสดงกราฟิกของซีรีย์การจัดจำหน่าย
ชุดการจัดจำหน่ายจะถูกนำเสนอด้วยภาพโดยใช้ภาพกราฟิก
ชุดการจัดจำหน่ายมีดังต่อไปนี้:
§ รูปหลายเหลี่ยม
§ ฮิสโตแกรม
§ สะสม
รูปหลายเหลี่ยม
เมื่อสร้างรูปหลายเหลี่ยม ค่าของคุณลักษณะที่แตกต่างกันจะถูกพล็อตบนแกนนอน (แกน x) และความถี่หรือความถี่จะถูกพล็อตบนแกนตั้ง (แกน y)
1. รูปหลายเหลี่ยมในรูป 6.1 อิงตามข้อมูลจากการสำรวจสำมะโนประชากรขนาดเล็กของรัสเซียในปี 1994
แผนภูมิแท่ง
ในการสร้างฮิสโตแกรมค่าของขอบเขตของช่วงเวลาจะถูกระบุตามแกน abscissa และสร้างสี่เหลี่ยมขึ้นอยู่กับความสูงซึ่งเป็นสัดส่วนกับความถี่ (หรือความถี่)
ในรูป 6.2. แสดงฮิสโตแกรมการกระจายตัวของประชากรรัสเซียในปี 1997 ตามกลุ่มอายุ
รูปที่ 1. การกระจายตัวของประชากรรัสเซียตามกลุ่มอายุ
ฟังก์ชันการกระจายเชิงประจักษ์ สมบัติ
ให้ทราบการกระจายความถี่ทางสถิติของคุณลักษณะเชิงปริมาณ X ให้เราแสดงด้วยจำนวนการสังเกตโดยสังเกตค่าของคุณลักษณะนั้นน้อยกว่า x และด้วยจำนวนการสังเกตทั้งหมด แน่นอนว่าความถี่สัมพัทธ์ของเหตุการณ์ X ฟังก์ชันการกระจายเชิงประจักษ์ (ฟังก์ชันการกระจายตัวอย่าง) คือฟังก์ชันที่กำหนดสำหรับแต่ละค่า x ความถี่สัมพัทธ์ของเหตุการณ์ X ตรงกันข้ามกับฟังก์ชันการแจกแจงเชิงประจักษ์ของกลุ่มตัวอย่าง ฟังก์ชันการแจกแจงประชากรเรียกว่าฟังก์ชันการแจกแจงทางทฤษฎี ความแตกต่างระหว่างฟังก์ชันเหล่านี้ก็คือ ฟังก์ชันทางทฤษฎีจะกำหนดความน่าจะเป็นของเหตุการณ์ X เมื่อ n เพิ่มขึ้น ความถี่สัมพัทธ์ของเหตุการณ์ X คุณสมบัติพื้นฐาน ปล่อยให้ผลลัพธ์เบื้องต้นได้รับการแก้ไข จากนั้นคือฟังก์ชันการกระจายของการแจกแจงแบบไม่ต่อเนื่องที่กำหนดโดยฟังก์ชันความน่าจะเป็นต่อไปนี้: ที่ไหน และ - จำนวนองค์ประกอบตัวอย่างเท่ากับ . โดยเฉพาะถ้าองค์ประกอบทั้งหมดของกลุ่มตัวอย่างแตกต่างกันแล้ว . ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้คือ: . ดังนั้นค่าเฉลี่ยตัวอย่างจึงเป็นค่าเฉลี่ยทางทฤษฎีของการกระจายตัวอย่าง ในทำนองเดียวกัน ความแปรปรวนตัวอย่างคือความแปรปรวนทางทฤษฎีของการกระจายตัวอย่าง ตัวแปรสุ่มมีการแจกแจงแบบทวินาม: ฟังก์ชันการกระจายตัวอย่างเป็นการประมาณค่าฟังก์ชันการกระจายอย่างเป็นกลาง: . ความแปรปรวนของฟังก์ชันการแจกแจงตัวอย่างมีรูปแบบดังนี้ . ตามกฎที่เข้มงวดของจำนวนจำนวนมาก ฟังก์ชันการกระจายตัวอย่างมาบรรจบกันกับฟังก์ชันการกระจายเชิงทฤษฎีเกือบจะแน่นอน: เกือบจะแน่นอนที่ ฟังก์ชันการกระจายตัวอย่างเป็นการประมาณค่าปกติแบบไม่แสดงกำกับของฟังก์ชันการกระจายตามทฤษฎี ถ้าอย่างนั้น ตามการจำหน่ายที่.