ฟังก์ชันเชิงประจักษ์และกราฟ ฟังก์ชันการกระจายเชิงประจักษ์ ฟังก์ชันการกระจายเชิงประจักษ์ สมบัติ

อนุญาต เอ็กซ์ 1 , เอ็กซ์ 2 , ..., เอ็กซ์ n--ปริมาณการสุ่มตัวอย่าง จากประชากรที่มีฟังก์ชันการกระจาย เอฟ(x). หากคุณจัดเรียงข้อมูลตัวอย่างตามลำดับที่ไม่ลดลง ระบบจะเรียกชุดข้อมูลผลลัพธ์ ซีรี่ส์รูปแบบ: เอ็กซ์ (1) , เอ็กซ์ (2) , ..., เอ็กซ์ (n)

ตัวอย่างที่ 1 หากตัวอย่างของเล่มที่ 4 เป็นดังนี้: 4, -2, 3, 1 ดังนั้นชุดรูปแบบต่างๆ จะมีลักษณะดังนี้: -2, 1, 3, 4

คำจำกัดความ 1. ฟังก์ชันการแจกแจงเชิงประจักษ์ F เรียกว่า(x) ตัวแปรสุ่มแบบไม่ต่อเนื่อง ซึ่งมีตารางการแจกแจงมีรูปแบบดังนี้

ดังแสดงใน 2.2.1 ฟังก์ชันการแจกแจงของตัวแปรสุ่มแบบไม่ต่อเนื่อง

มีแบบฟอร์มดังนี้

กล่าวอีกนัยหนึ่ง เอฟ n (x) = วี/เอ็น,ที่ไหน โวลต์--จำนวนค่าตัวอย่างเหล่านั้น เอ็กซ์ ฉัน , ซึ่งมีขนาดเล็กกว่า เอ็กซ์

ดังที่เห็นได้จากกราฟฟังก์ชัน เอฟ n (x) เป็นแบบขั้นบันไดและมีความไม่ต่อเนื่องที่จุดต่างๆ เอ็กซ์ (ฉัน)และขนาดของการกระโดดคือ 1 /nหากค่านิยมตรงกัน เอ็กซ์ ฉัน , เลขที่ ถ้า เคค่านิยม เอ็กซ์ (ฉัน)ตรงกัน แล้วขนาดของการกระโดด ณ จุดนี้เท่ากับ เค/เอ็น.

พฤติกรรมที่จำกัดเป็นที่สนใจ เอฟ n (x) ที่ .

ทฤษฎีบท 1 ให้ X 1 , เอ็กซ์ 2 , ..., เอ็กซ์ n --ขนาดตัวอย่าง n จากประชากรตามฟังก์ชันการกระจาย F(x)- แล้วเมื่อ n co สำหรับ x ใดๆ 1 ยุติธรรม

เอฟ n (x) เอฟ(x),

หรืออีกนัยหนึ่งสำหรับสิ่งใด ๆ > 0,

การพิสูจน์. อนุญาต


ตัวแปรสุ่มแบบไม่ต่อเนื่องโดยที่ P( ฉัน == 0) = ถามและพี( ฉัน = 1) = พี, ไอ = 1. 2..... ป.มันง่ายที่จะเห็นว่า


จากนั้นตามกฎของจำนวนมาก (ดู 2.7.2) สำหรับฟังก์ชันการแจกแจงเชิงประจักษ์ เอฟ n (x) = 1/n n ผม=1 ฉัน ที่ nเราได้รับ

เอฟ n (x) เอฟ(x),

ก่อนที่จะกำหนดทฤษฎีบทอื่น เราจะให้คำจำกัดความต่อไปนี้

คำจำกัดความ 2 ลำดับของตัวแปรสุ่ม 1 , 2 , …, n , … มาบรรจบกันด้วยความน่าจะเป็น 1 (หนึ่ง) (หรือเกือบจะแน่นอน) หากมีความเท่าเทียมกันดังต่อไปนี้

ตอนนี้ให้เรากำหนด (โดยไม่ต้องพิสูจน์ สามารถพบได้ใน) ทฤษฎีบทต่อไปนี้

ทฤษฎีบท 2 (กลิเวนโก - คันเทลลี) ภายใต้เงื่อนไขของทฤษฎีบทที่แล้ว มันจะเป็นความจริง

ผลลัพธ์เหล่านี้แสดงให้เห็นโดยรวมแล้ว ฟังก์ชันการแจกแจงเชิงประจักษ์ให้ค่าประมาณที่ดีกับฟังก์ชันการแจกแจงทางทฤษฎี เอฟ(x).

ตัวอย่างปริมาณ จากประชากรที่มีการกระจายอย่างต่อเนื่อง เอฟ(x) ในทางปฏิบัติมักมีการจัดกลุ่มกัน ในกรณีนี้จะไม่ใช่ค่าตัวอย่างที่ระบุ แต่เป็นจำนวนค่าตัวอย่างที่อยู่ในช่วงของพาร์ติชั่นเฉพาะบางส่วนของประชากรทั่วไป (พาร์ติชั่นของชุดค่าที่เป็นไปได้ของตัวแปรสุ่ม ที่มีฟังก์ชันการกระจาย เอฟ(x) - ตามกฎแล้วช่วงเวลาจะมีความยาวเท่ากัน ชม.ถ้าเราแสดงโดย n ฉันจำนวนค่าตัวอย่างที่รวมอยู่ใน ฉัน- ช่วงเวลา จากนั้นช่วงเวลานี้จะถูกใช้เป็นฐานของสี่เหลี่ยมความสูง n ฉัน /นะตัวเลขผลลัพธ์ที่เรียกว่า ฮิสโตแกรมตัวอย่างพื้นที่ของแต่ละสี่เหลี่ยมฮิสโตแกรมเท่ากับความถี่ n ฉัน /nกลุ่มที่เกี่ยวข้อง ที่มีขนาดใหญ่ พื้นที่นี้จะประมาณเท่ากับความน่าจะเป็นที่จะตกอยู่ในช่วงเวลาที่สอดคล้องกันนั่นคือ จะประมาณเท่ากับอินทิกรัลของความหนาแน่นของการแจกแจง p( ที) คำนวณในช่วงเวลานี้ ดังนั้น ส่วนบนของโครงร่างฮิสโตแกรมจึงประมาณความหนาแน่นของการกระจายได้ดี

ตัวอย่างที่ 2 ทดสอบความไวของช่องที่ 1 น=ทีวี 40 เครื่อง ข้อมูลการทดสอบจะแสดงในตารางต่อไปนี้ โดยบรรทัดแรกระบุช่วงความไวเป็นไมโครโวลต์ บรรทัดที่สองคือจำนวนโทรทัศน์ที่พบความไวในช่วงเวลานี้:

นี่คือความยาวของช่วงเวลา ชั่วโมง = 50. มาสร้างฮิสโตแกรมกันดีกว่า

วิธีการประมวลผล ED ขึ้นอยู่กับแนวคิดพื้นฐานของทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ ซึ่งรวมถึงแนวคิดเกี่ยวกับประชากรทั่วไป ตัวอย่าง ฟังก์ชันการแจกแจงเชิงประจักษ์

ภายใต้ ประชากรทั่วไปเข้าใจค่าพารามิเตอร์ที่เป็นไปได้ทั้งหมดที่สามารถบันทึกได้ในระหว่างการสังเกตวัตถุแบบไม่จำกัดเวลาเซตดังกล่าวประกอบด้วยองค์ประกอบจำนวนอนันต์ จากการสังเกตวัตถุ ชุดค่าพารามิเตอร์ที่จำกัดในปริมาณจะถูกสร้างขึ้น x 1 , x 2 , …, xn. จากมุมมองที่เป็นทางการ ข้อมูลดังกล่าวเป็นตัวแทน ตัวอย่าง จากประชาชนทั่วไป.

เราจะถือว่าตัวอย่างมีการพัฒนาที่สมบูรณ์ก่อนเหตุการณ์ของระบบ (ไม่มีการเซ็นเซอร์) ค่าที่สังเกตได้ x ฉัน เรียกว่า ตัวเลือก และหมายเลขของพวกเขาคือ ขนาดตัวอย่าง n. เพื่อที่จะได้ข้อสรุปใดๆ จากผลการสังเกต จะต้องมีตัวอย่าง ตัวแทน(ตัวแทน) เช่น เป็นตัวแทนสัดส่วนของประชากรทั่วไปอย่างถูกต้อง เป็นไปตามข้อกำหนดนี้หากขนาดตัวอย่างมีขนาดใหญ่เพียงพอ และแต่ละองค์ประกอบในประชากรมีความน่าจะเป็นที่เท่ากันที่จะรวมไว้ในตัวอย่าง

ปล่อยให้ตัวอย่างผลลัพธ์มีค่า xสังเกตพารามิเตอร์ 1 รายการ n 1 ครั้งค่า x 2 – n 2 ครั้ง แปลว่า xเค nเค ครั้งหนึ่ง, n 1 +น 2 + … +nเค=n.

เรียกว่าชุดของค่าที่เขียนตามลำดับจากน้อยไปหามาก ซีรีย์การเปลี่ยนแปลง, ปริมาณ n ฉัน – ความถี่และความสัมพันธ์กับขนาดตัวอย่าง nฉัน=n ฉัน /n ความถี่สัมพัทธ์(ความถี่) แน่นอนว่าผลรวมของความถี่สัมพัทธ์เท่ากับความสามัคคี

การกระจายหมายถึงความสอดคล้องระหว่างตัวแปรที่สังเกตได้กับความถี่หรือความถี่ของพวกมัน อนุญาต nx – จำนวนการสังเกตซึ่งค่าสุ่มของพารามิเตอร์ เอ็กซ์น้อย x.ความถี่ของเหตุการณ์ เอ็กซ์ เท่ากับ nx/n- อัตราส่วนนี้เป็นฟังก์ชันของ xและขนาดตัวอย่าง: เอฟ n(x)=นx/n. ขนาด เอฟn(x) มีคุณสมบัติทั้งหมดของฟังก์ชัน:

การแจกแจง: เอฟn(x) ฟังก์ชันที่ไม่ลดลง ค่าของมันจะอยู่ในส่วน ;

ถ้า x 1 คือค่าที่น้อยที่สุดของพารามิเตอร์ และ xเค – ยิ่งใหญ่ที่สุดแล้ว เอฟn(x)= 0, เมื่อไร x<x 1 , และ เอฟ(xเค)= 1 เมื่อ x>=xเค.

การทำงาน เอฟn(x) ถูกกำหนดโดย ED ซึ่งเป็นสาเหตุว่าทำไมจึงถูกเรียก ฟังก์ชันการกระจายเชิงประจักษ์. ต่างจากฟังก์ชันเชิงประจักษ์ เอฟn(x) ฟังก์ชันการกระจาย เอฟ (x) ของประชากรเรียกว่าฟังก์ชันการแจกแจงเชิงทฤษฎีมันไม่ได้ระบุลักษณะความถี่ แต่เป็นความน่าจะเป็นของเหตุการณ์ เอ็กซ์<x- จากทฤษฎีบทของเบอร์นูลลี จะได้ความถี่ตามนั้น เอฟn(x) มีแนวโน้มความน่าจะเป็นต่อความน่าจะเป็น เอฟ(x) พร้อมกำลังขยายไม่จำกัด n- ดังนั้นเมื่อมีการสังเกตจำนวนมาก ฟังก์ชันการแจกแจงทางทฤษฎี เอฟ(x) สามารถแทนที่ได้ด้วยฟังก์ชันเชิงประจักษ์ เอฟn(x).

กราฟของฟังก์ชันเชิงประจักษ์ เอฟn(x) เป็นเส้นขาด ในช่องว่างระหว่างสมาชิกที่อยู่ติดกันของซีรีส์รูปแบบต่างๆ เอฟn(x) คงที่ เมื่อผ่านจุดแกน xเท่ากับสมาชิกตัวอย่าง เอฟn(x) เกิดการไม่ต่อเนื่องเพิ่มขึ้นทันทีด้วยค่า 1/ nและหากมีเหตุบังเอิญ การสังเกต - บน /n.

ตัวอย่างที่ 2.1- สร้างชุดความแปรผันและกราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ตามผลการสังเกต ตาราง 2.1.

ตารางที่ 2.1

ฟังก์ชันเชิงประจักษ์ที่ต้องการ รูปที่ 2.1:

ข้าว. 2.1. ฟังก์ชันการกระจายเชิงประจักษ์

ด้วยขนาดตัวอย่างขนาดใหญ่ (แนวคิดของ "ปริมาณมาก" ขึ้นอยู่กับเป้าหมายและวิธีการประมวลผล ในกรณีนี้ เราจะพิจารณา ใหญ่ถ้า n>40) เพื่อความสะดวกในการประมวลผลและจัดเก็บข้อมูล หันไปจัดกลุ่ม ED ตามช่วงเวลาควรเลือกจำนวนช่วงเวลาเพื่อให้ค่าพารามิเตอร์ที่หลากหลายในการรวมสะท้อนให้เห็นในขอบเขตที่ต้องการและในขณะเดียวกันรูปแบบการกระจายจะไม่ถูกบิดเบือนจากความผันผวนของความถี่สุ่มในแต่ละหมวดหมู่ มีแนวปฏิบัติหลวมๆในการเลือก ปริมาณ yและ ขนาด ชม. ช่วงเวลาดังกล่าว โดยเฉพาะ:

แต่ละช่วงต้องมีองค์ประกอบอย่างน้อย 5–7 รายการ ในระดับที่รุนแรง อนุญาตให้มีเพียงสององค์ประกอบเท่านั้น

จำนวนช่วงเวลาไม่ควรมากหรือเล็กมาก ขั้นต่ำ ค่า y ต้องมีอย่างน้อย 6 – 7ด้วยขนาดตัวอย่างไม่เกินหลายร้อยองค์ประกอบจึงมีคุณค่า y ตั้งค่าไว้ในช่วงตั้งแต่ 10 ถึง 20สำหรับขนาดตัวอย่างที่ใหญ่มาก ( n>1000) จำนวนช่วงเวลาอาจเกินค่าที่ระบุ นักวิจัยบางคนแนะนำให้ใช้อัตราส่วนนี้ y=1.441*ln( n)+1;

ด้วยความไม่สม่ำเสมอที่ค่อนข้างเล็กในความยาวของช่วงเวลาจึงสะดวกในการเลือกค่าเดียวกันและเท่ากับค่า

ชั่วโมง= (xสูงสุด – xนาที)/ปี

ที่ไหน xสูงสุด – สูงสุดและ x min – ค่าต่ำสุดของพารามิเตอร์ หากกฎการกระจายไม่เท่ากันอย่างมีนัยสำคัญ ความยาวของช่วงเวลาสามารถตั้งค่าให้มีขนาดเล็กลงในพื้นที่ที่มีการเปลี่ยนแปลงอย่างรวดเร็วในความหนาแน่นของการกระจาย

หากมีความไม่สม่ำเสมออย่างมีนัยสำคัญ ควรกำหนดองค์ประกอบตัวอย่างให้มีจำนวนเท่ากันโดยประมาณในแต่ละหมวดหมู่ จากนั้นความยาวของช่วงเวลาหนึ่งจะถูกกำหนดโดยค่าสุดขีดขององค์ประกอบตัวอย่างที่จัดกลุ่มไว้ในช่วงเวลานี้เช่น จะแตกต่างกันตามช่วงเวลาที่ต่างกัน (ในกรณีนี้ เมื่อสร้างฮิสโตแกรม จำเป็นต้องมีการทำให้เป็นมาตรฐานตามความยาวของช่วงเวลา - มิฉะนั้นความสูงของแต่ละองค์ประกอบของฮิสโตแกรมจะเท่ากัน)

การจัดกลุ่มผลการสังเกตตามช่วงเวลาจะช่วยให้: การกำหนดช่วงของการเปลี่ยนแปลงในพารามิเตอร์ เอ็กซ์- การเลือกจำนวนช่วงเวลาและขนาด นับสำหรับทุกคน ฉัน-ช่วงเวลาที่ [ xฉันxฉัน+1 ] ความถี่ nฉัน หรือความถี่สัมพัทธ์ (ความถี่ n ฉัน) ตัวเลือกจะอยู่ในช่วง เป็นผลให้เกิดการเป็นตัวแทนของ ED ในรูปแบบ ช่วงเวลาหรืออนุกรมทางสถิติ.

ในรูปแบบกราฟิก ชุดข้อมูลทางสถิติจะแสดงในรูปแบบของฮิสโตแกรม รูปหลายเหลี่ยม และเส้นขั้นบันได บ่อยครั้ง ฮิสโตแกรมแสดงเป็นรูปสี่เหลี่ยมผืนผ้าซึ่งมีฐานเป็นช่วงความยาว ชม.และความสูงจะเท่ากับความถี่ที่สอดคล้องกันอย่างไรก็ตาม วิธีการนี้ไม่ถูกต้อง ความสูง ฉัน-สี่เหลี่ยมที่ z ฉันควรเลือกให้เท่าเทียมกัน nฉัน/ (นะ- ฮิสโตแกรมดังกล่าวสามารถตีความได้ว่าเป็นการแสดงกราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ n(x) ในนั้นพื้นที่รวมของสี่เหลี่ยมทั้งหมดจะเป็นหนึ่งเดียว ฮิสโตแกรมช่วยในการเลือกประเภทของฟังก์ชันการแจกแจงทางทฤษฎีสำหรับการประมาณค่า ED

รูปหลายเหลี่ยมเรียกว่าเส้นขาด ซึ่งเป็นส่วนที่เชื่อมต่อจุดกับพิกัดตามแกนแอบซิสซาเท่ากับจุดกึ่งกลางของช่วง และตามแกนกำหนดเท่ากับความถี่ที่สอดคล้องกัน ฟังก์ชันการแจกแจงเชิงประจักษ์จะแสดงเป็นเส้นขาดแบบขั้น: ส่วนของเส้นแนวนอนจะถูกลากไปในแต่ละช่วงเวลาที่ความสูงเป็นสัดส่วนกับความถี่สะสมในช่วงเวลาปัจจุบัน ความถี่สะสมจะเท่ากับผลรวมของความถี่ทั้งหมด โดยเริ่มจากความถี่แรกและจนถึงช่วงนี้ด้วย

ตัวอย่างที่ 2.2- มีผลลัพธ์ของค่าการลดทอนสัญญาณการบันทึก xฉัน ที่ความถี่ 1,000 Hz ของช่องสวิตช์ของเครือข่ายโทรศัพท์ ค่าเหล่านี้ซึ่งวัดเป็น dB จะแสดงในรูปแบบของชุดรูปแบบต่างๆ ในตาราง 2.3. มีความจำเป็นต้องสร้างชุดข้อมูลทางสถิติ

ตารางที่ 2.3

ฉัน
xฉัน 25,79 25,98 25,98 26,12 26,13 26,49 26,52 26,60 26,66 26,69 26,74
ฉัน
xฉัน 26,85 26,90 26,91 26,96 27,02 27,11 27,19 27,21 27,28 27,30 27,38
ฉัน
xฉัน 27,40 27,49 27,64 27,66 27,71 27,78 27,89 27,89 28,01 28,10 28,11
ฉัน
xฉัน 28,37 28,38 28,50 28,63 28,67 28,90 28,99 28,99 29,03 29,12 29,28

สารละลาย- ควรเลือกจำนวนหลักของชุดข้อมูลทางสถิติให้น้อยที่สุดเท่าที่จะทำได้เพื่อให้แน่ใจว่ามีจำนวนการเข้าชมเพียงพอในแต่ละชุด ลองใช้ y = 6 มากำหนดขนาดของตัวเลขกัน

ชั่วโมง =(xสูงสุด – xนาที)/y =(29.28 – 25.79)/6 = 0.58

มาจัดกลุ่มการสังเกตตามหมวดหมู่ ตาราง 2.4.

ตารางที่ 2.4

ฉัน
xฉัน 25,79 26,37 26,95 27,5 3 28,12 28,70
nฉัน
n ฉัน=nฉัน/n 0,114 0,205 0,227 0,205 0,11 4 0,136
z ฉัน =NIH 0,196 0,353 0,392 0,353 0,196 0,235

จากอนุกรมทางสถิติ เราจะสร้างฮิสโตแกรม รูปที่ 1 2.2 และกราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ รูปที่. 2.3.

กราฟของฟังก์ชันการแจกแจงเชิงประจักษ์ รูปที่ 1 2.3 แตกต่างจากกราฟที่แสดงในรูปที่ 2.1 ความเท่าเทียมกันของขั้นตอนการเปลี่ยนแปลงของตัวเลือกและขนาดของขั้นตอนการเพิ่มของฟังก์ชัน (เมื่อสร้างโดยใช้ชุดรูปแบบต่างๆ ขั้นตอนการเพิ่มขึ้นจะเป็นจำนวนทวีคูณ

1/ nและตามชุดทางสถิติ - ขึ้นอยู่กับความถี่ในหมวดหมู่เฉพาะ)

การแสดง ED ที่ได้รับการพิจารณานั้นเป็นการแสดงเริ่มต้นสำหรับการประมวลผลและการคำนวณพารามิเตอร์ต่างๆ ในภายหลัง

ค่าเฉลี่ยตัวอย่าง

ให้แยกตัวอย่างขนาด n เพื่อศึกษาประชากรทั่วไปเกี่ยวกับคุณลักษณะเชิงปริมาณ X

ค่าเฉลี่ยตัวอย่างคือค่าเฉลี่ยเลขคณิตของคุณลักษณะในประชากรตัวอย่าง

ความแปรปรวนตัวอย่าง

เพื่อสังเกตการกระจายตัวของลักษณะเชิงปริมาณของค่าตัวอย่างรอบค่าเฉลี่ย จะมีการแนะนำคุณลักษณะสรุป - ความแปรปรวนของตัวอย่าง

ความแปรปรวนตัวอย่างคือค่าเฉลี่ยเลขคณิตของกำลังสองของการเบี่ยงเบนของค่าที่สังเกตได้ของคุณลักษณะจากค่าเฉลี่ย

หากค่าทั้งหมดของคุณลักษณะตัวอย่างแตกต่างกันแล้ว

แก้ไขความแปรปรวนแล้ว

ความแปรปรวนตัวอย่างเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเอนเอียง กล่าวคือ ความคาดหวังทางคณิตศาสตร์ของความแปรปรวนตัวอย่างไม่เท่ากับค่าความแปรปรวนทั่วไปโดยประมาณ แต่จะเท่ากับ

หากต้องการแก้ไขความแปรปรวนตัวอย่าง ให้คูณด้วยเศษส่วน

ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างพบได้จากสูตร

โดยที่ ตัวอย่างค่าเบี่ยงเบนมาตรฐานของค่า และ .

ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างแสดงความใกล้ชิดของความสัมพันธ์เชิงเส้นระหว่าง และ : ยิ่งใกล้กับเอกภาพมากเท่าใด ความสัมพันธ์เชิงเส้นระหว่าง และ ก็จะยิ่งแข็งแกร่งมากขึ้นเท่านั้น

23. รูปหลายเหลี่ยมความถี่คือเส้นขาดที่แต่ละส่วนเชื่อมต่อกัน ในการสร้างรูปหลายเหลี่ยมความถี่ รูปแบบต่างๆ จะถูกพล็อตบนแกน Abscissa และความถี่ที่สอดคล้องกันจะถูกพล็อตบนแกนพิกัด และจุดต่างๆ จะเชื่อมต่อกันด้วยส่วนของเส้นตรง

รูปหลายเหลี่ยมความถี่สัมพัทธ์ถูกสร้างขึ้นในลักษณะเดียวกัน ยกเว้นว่าความถี่สัมพัทธ์จะถูกพล็อตบนแกนพิกัด

ฮิสโตแกรมความถี่คือรูปขั้นบันไดที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงความยาว h บางส่วน และความสูงเท่ากับอัตราส่วน ในการสร้างฮิสโตแกรมความถี่ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa ที่ระยะห่าง (ความสูง) จะถูกวาดไว้เหนือพวกมัน พื้นที่ของสี่เหลี่ยม i-th เท่ากับผลรวมของความถี่ของช่วงเวลา i-o ดังนั้นพื้นที่ของฮิสโตแกรมความถี่จึงเท่ากับผลรวมของความถี่ทั้งหมดนั่นคือ ขนาดตัวอย่าง.

ฟังก์ชันการกระจายเชิงประจักษ์

ที่ไหน ไม่มี- จำนวนค่าตัวอย่างน้อยกว่า x; n- ขนาดตัวอย่าง.

22ให้เรานิยามแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์กัน

.แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ ประชากรและกลุ่มตัวอย่าง อนุกรมความแปรผัน อนุกรมทางสถิติ ตัวอย่างที่จัดกลุ่ม ชุดสถิติที่จัดกลุ่ม รูปหลายเหลี่ยมความถี่ ฟังก์ชันการกระจายตัวอย่างและฮิสโตแกรม

ประชากร– ชุดวัตถุที่มีอยู่ทั้งหมด

ตัวอย่าง– ชุดวัตถุที่สุ่มเลือกจากประชากรทั่วไป

เรียกว่าลำดับของตัวเลือกที่เขียนตามลำดับจากน้อยไปหามาก แปรผันบริเวณใกล้เคียง และรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ - ชุดสถิติ: สุ่มเลือกจากประชากรทั่วไป

รูปหลายเหลี่ยมความถี่เรียกว่าเส้นขาดซึ่งเป็นส่วนที่เชื่อมต่อจุดต่างๆ

ฮิสโตแกรมความถี่เป็นรูปขั้นบันไดที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงย่อยของความยาว h และความสูงเท่ากับอัตราส่วน

ฟังก์ชันการกระจายตัวอย่าง (เชิงประจักษ์)เรียกใช้ฟังก์ชัน ฉ*(x) ซึ่งกำหนดสำหรับแต่ละค่า เอ็กซ์ความถี่สัมพัทธ์ของเหตุการณ์ เอ็กซ์< x.

หากมีการศึกษาคุณลักษณะต่อเนื่องบางอย่าง อนุกรมรูปแบบต่างๆ อาจประกอบด้วยตัวเลขจำนวนมาก ในกรณีนี้จะสะดวกกว่าในการใช้งาน ตัวอย่างที่จัดกลุ่ม- เพื่อให้ได้มาซึ่งช่วงเวลาที่มีค่าที่สังเกตได้ทั้งหมดของคุณลักษณะจะถูกแบ่งออกเป็นช่วงความยาวบางส่วนที่เท่ากันหลายช่วง ชม.แล้วค้นหาช่วงเวลาย่อยแต่ละช่วง ฉัน– ผลรวมของความถี่ของตัวแปรที่รวมอยู่ใน ฉันช่วงเวลาที่.

20. ไม่ควรเข้าใจกฎแห่งจำนวนมากเช่นเดียวกับกฎทั่วไปข้อใดข้อหนึ่งที่เกี่ยวข้องกับจำนวนมาก กฎของจำนวนมากเป็นชื่อทั่วไปสำหรับทฤษฎีบทหลาย ๆ ข้อ ซึ่งตามมาด้วยจำนวนการทดลองที่เพิ่มขึ้นอย่างไม่จำกัด ค่าเฉลี่ยมีแนวโน้มที่จะมีค่าคงที่ที่แน่นอน

ซึ่งรวมถึงทฤษฎีบทของ Chebyshev และ Bernoulli ทฤษฎีบทของเชบีเชฟเป็นกฎทั่วไปที่สุดของจำนวนจำนวนมาก

การพิสูจน์ทฤษฎีบทซึ่งรวมกันเป็นคำว่า "กฎของจำนวนมาก" นั้นขึ้นอยู่กับความไม่เท่าเทียมกันของ Chebyshev ซึ่งสร้างความน่าจะเป็นที่จะเบี่ยงเบนไปจากความคาดหวังทางคณิตศาสตร์:

19การแจกแจงแบบเพียร์สัน (ไค - สแควร์) - การแจกแจงของตัวแปรสุ่ม

ตัวแปรสุ่มอยู่ที่ไหน X 1, X 2,…, Xnเป็นอิสระและมีการกระจายตัวเหมือนกัน เอ็น(0,1) ในกรณีนี้จำนวนเทอมคือ nเรียกว่า “จำนวนองศาอิสระ” ของการแจกแจงแบบไคสแควร์

การแจกแจงแบบไคสแควร์ใช้ในการประมาณค่าความแปรปรวน (โดยใช้ช่วงความเชื่อมั่น) เมื่อทดสอบสมมติฐานของข้อตกลง ความสม่ำเสมอ ความเป็นอิสระ

การกระจาย ที t ของนักเรียนคือการแจกแจงของตัวแปรสุ่ม

ตัวแปรสุ่มอยู่ที่ไหน ยูและ เอ็กซ์เป็นอิสระ, ยูมีการแจกแจงแบบปกติมาตรฐาน เอ็น(0.1) และ เอ็กซ์– การกระจายไค – กำลังสอง c nระดับความอิสระ. โดยที่ nเรียกว่า “จำนวนองศาอิสระ” ของการแจกแจงนักศึกษา

ใช้ในการประมาณค่าความคาดหวังทางคณิตศาสตร์ ค่าพยากรณ์ และคุณลักษณะอื่น ๆ โดยใช้ช่วงความเชื่อมั่น การทดสอบสมมติฐานเกี่ยวกับค่าความคาดหวังทางคณิตศาสตร์ ค่าสัมประสิทธิ์การถดถอย

การแจกแจงแบบฟิชเชอร์คือการแจกแจงของตัวแปรสุ่ม

การแจกแจงแบบฟิชเชอร์จะใช้เมื่อทดสอบสมมติฐานเกี่ยวกับความเพียงพอของแบบจำลองในการวิเคราะห์การถดถอย ความเท่าเทียมกันของความแปรปรวน และในปัญหาอื่นๆ ของสถิติประยุกต์

18การถดถอยเชิงเส้นเป็นเครื่องมือทางสถิติที่ใช้ในการทำนายราคาในอนาคตโดยอาศัยข้อมูลในอดีต และมักจะใช้เพื่อพิจารณาว่าเมื่อใดที่ราคามีความร้อนสูงเกินไป วิธีกำลังสองน้อยที่สุดใช้เพื่อสร้างเส้นตรงที่ "เหมาะสมที่สุด" ผ่านชุดจุดมูลค่าราคา จุดราคาที่ใช้เป็นอินพุตสามารถเป็นอย่างใดอย่างหนึ่งต่อไปนี้: เปิด, ปิด, สูง, ต่ำ,

17. ตัวแปรสุ่มสองมิติคือชุดลำดับของตัวแปรสุ่มสองตัวหรือ

ตัวอย่าง: มีการโยนลูกเต๋าสองลูก – จำนวนแต้มที่ทอยบนลูกเต๋าลูกที่หนึ่งและลูกที่สองตามลำดับ

วิธีสากลในการระบุกฎการแจกแจงของตัวแปรสุ่มแบบสองมิติคือฟังก์ชันการแจกแจง

15.m.o ตัวแปรสุ่มแบบไม่ต่อเนื่อง

คุณสมบัติ:

1) () = , - คงที่;

2) (CX) = ซี.เอ็ม.(เอ็กซ์);

3) (เอ็กซ์ 1 + เอ็กซ์ 2) = (เอ็กซ์ 1) + (เอ็กซ์ 2), ที่ไหน เอ็กซ์ 1, เอ็กซ์ 2- ตัวแปรสุ่มอิสระ

4) (เอ็กซ์ 1 เอ็กซ์ 2) = (เอ็กซ์ 1)(เอ็กซ์ 2).

ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์ของพวกเขา กล่าวคือ

ความคาดหวังทางคณิตศาสตร์ของความแตกต่างระหว่างตัวแปรสุ่มจะเท่ากับความแตกต่างของความคาดหวังทางคณิตศาสตร์ของพวกเขา กล่าวคือ

ความคาดหวังทางคณิตศาสตร์ของผลิตภัณฑ์ของตัวแปรสุ่มจะเท่ากับผลคูณของความคาดหวังทางคณิตศาสตร์ของพวกเขา กล่าวคือ

หากค่าทั้งหมดของตัวแปรสุ่มเพิ่มขึ้น (ลดลง) ด้วยตัวเลข C เท่ากัน ความคาดหวังทางคณิตศาสตร์ของมันจะเพิ่มขึ้น (ลดลง) ด้วยจำนวนเดียวกัน

14. เอ็กซ์โปเนนเชียล(เอ็กซ์โปเนนเชียล)กฎหมายการกระจาย เอ็กซ์มีกฎการแจกแจงแบบเอกซ์โปเนนเชียลพร้อมพารามิเตอร์ γ >0 หากความหนาแน่นของความน่าจะเป็นมีรูปแบบ:

มูลค่าที่คาดหวัง: .

การกระจายตัว: .

กฎการกระจายแบบเอ็กซ์โปเนนเชียลมีบทบาทสำคัญในทฤษฎีการเข้าคิวและทฤษฎีความน่าเชื่อถือ

13. กฎการแจกแจงแบบปกติมีลักษณะเป็นความถี่ความล้มเหลว a (t) หรือความหนาแน่นของความน่าจะเป็นของความล้มเหลว f (t) ของรูปแบบ:

, (5.36)

โดยที่ σ คือค่าเบี่ยงเบนมาตรฐานของ SV x;

x– ความคาดหวังทางคณิตศาสตร์ของ SV x- พารามิเตอร์นี้มักเรียกว่าจุดศูนย์กลางการกระจายตัวหรือค่า SV ที่เป็นไปได้มากที่สุด เอ็กซ์.

x– ตัวแปรสุ่มซึ่งสามารถพิจารณาเป็นเวลา ค่ากระแส ค่าแรงดันไฟฟ้า และอาร์กิวเมนต์อื่นๆ

กฎปกติคือกฎสองพารามิเตอร์ ในการเขียนซึ่งคุณต้องรู้ m xและ σ

การแจกแจงแบบปกติ (การแจกแจงแบบเกาส์เซียน) ใช้เพื่อประเมินความน่าเชื่อถือของผลิตภัณฑ์ที่ได้รับผลกระทบจากปัจจัยสุ่มจำนวนหนึ่ง ซึ่งแต่ละปัจจัยจะมีผลกระทบต่อผลลัพธ์เล็กน้อย

12. กฎหมายการกระจายเครื่องแบบ- ตัวแปรสุ่มต่อเนื่อง เอ็กซ์มีกฎหมายการกระจายแบบสม่ำเสมอในส่วน [ , ] หากความหนาแน่นของความน่าจะเป็นคงที่ในส่วนนี้และเท่ากับศูนย์ด้านนอกนั่นคือ

การกำหนด: .

มูลค่าที่คาดหวัง: .

การกระจายตัว: .

ค่าสุ่ม เอ็กซ์กระจายตามกฎหมายเดียวกันในส่วนที่เรียกว่า หมายเลขสุ่มจาก 0 ถึง 1 ทำหน้าที่เป็นวัสดุเริ่มต้นในการรับตัวแปรสุ่มตามกฎการแจกแจงใดๆ กฎการกระจายแบบสม่ำเสมอใช้ในการวิเคราะห์ข้อผิดพลาดในการปัดเศษเมื่อทำการคำนวณเชิงตัวเลข ในชุดปัญหาการเข้าคิว ในการสร้างแบบจำลองทางสถิติของการสังเกตภายใต้การแจกแจงที่กำหนด

11. คำนิยาม.ความหนาแน่นของการกระจายความน่าจะเป็นของตัวแปรสุ่มต่อเนื่อง X เรียกว่าฟังก์ชัน ฉ(x)– อนุพันธ์อันดับหนึ่งของฟังก์ชันการแจกแจง F(x)

ความหนาแน่นของการกระจายเรียกอีกอย่างว่า ฟังก์ชันดิฟเฟอเรนเชียล- ในการอธิบายตัวแปรสุ่มแบบไม่ต่อเนื่อง ความหนาแน่นของการแจกแจงเป็นสิ่งที่ยอมรับไม่ได้

ความหมายของความหนาแน่นของการแจกแจงคือ แสดงว่าตัวแปรสุ่ม X ปรากฏขึ้นในย่านใกล้เคียงจุดใดจุดหนึ่งบ่อยเพียงใด เอ็กซ์เมื่อทำการทดลองซ้ำ

หลังจากแนะนำฟังก์ชันการแจกแจงและความหนาแน่นของการแจกแจงแล้ว จะสามารถให้คำจำกัดความต่อไปนี้ของตัวแปรสุ่มต่อเนื่องได้

10. ความหนาแน่นของความน่าจะเป็น ความหนาแน่นของการแจกแจงความน่าจะเป็นของตัวแปรสุ่ม x คือฟังก์ชัน p(x) โดยที่

และสำหรับก< b вероятность события a < x < b равна
.

ถ้า p(x) ต่อเนื่องกัน แล้วสำหรับค่า ∆x ที่น้อยเพียงพอ ความน่าจะเป็นของอสมการ x< X < x+∆x приближенно равна p(x) ∆x (с точностью до малых более высокого порядка). Функция распределения F(x) случайной величины x, связана с плотностью распределения соотношениями

และถ้า F(x) สามารถหาอนุพันธ์ได้

การหาฟังก์ชันการกระจายเชิงประจักษ์

ให้ $X$ เป็นตัวแปรสุ่ม $F(x)$ คือฟังก์ชันการแจกแจงของตัวแปรสุ่มที่กำหนด เราจะทำการทดลอง $n$ กับตัวแปรสุ่มที่กำหนดภายใต้เงื่อนไขเดียวกัน โดยเป็นอิสระจากกัน ในกรณีนี้เราได้รับลำดับของค่า $x_1,\ x_2\ $, ... ,$\ x_n$ ซึ่งเรียกว่าตัวอย่าง

คำจำกัดความ 1

แต่ละค่า $x_i$ ($i=1,2\ $, ... ,$ \ n$) เรียกว่าตัวแปร

ค่าประมาณหนึ่งของฟังก์ชันการแจกแจงทางทฤษฎีคือฟังก์ชันการแจกแจงเชิงประจักษ์

คำจำกัดความ 3

ฟังก์ชันการแจกแจงเชิงประจักษ์ $F_n(x)$ เป็นฟังก์ชันที่กำหนดสำหรับแต่ละค่า $x$ ความถี่สัมพัทธ์ของเหตุการณ์ $X \

โดยที่ $n_x$ คือจำนวนตัวเลือกที่น้อยกว่า $x$, $n$ คือขนาดตัวอย่าง

ความแตกต่างระหว่างฟังก์ชันเชิงประจักษ์และฟังก์ชันทางทฤษฎีก็คือ ฟังก์ชันทางทฤษฎีจะกำหนดความน่าจะเป็นของเหตุการณ์ $X

คุณสมบัติของฟังก์ชันการกระจายเชิงประจักษ์

ให้เราพิจารณาคุณสมบัติพื้นฐานหลายประการของฟังก์ชันการแจกแจง

    ช่วงของฟังก์ชัน $F_n\left(x\right)$ คือส่วน $$

    $F_n\left(x\right)$ เป็นฟังก์ชันที่ไม่ลดลง

    $F_n\left(x\right)$ เป็นฟังก์ชันต่อเนื่องทางซ้าย

    $F_n\left(x\right)$ เป็นฟังก์ชันคงที่ทีละชิ้นและเพิ่มเฉพาะจุดของค่าของตัวแปรสุ่ม $X$

    ให้ $X_1$ เป็นตัวเลือกที่เล็กที่สุดและ $X_n$ เป็นตัวเลือกที่ใหญ่ที่สุด จากนั้น $F_n\left(x\right)=0$ สำหรับ $(x\le X)_1$ และ $F_n\left(x\right)=1$ สำหรับ $x\ge X_n$

ให้เราแนะนำทฤษฎีบทที่เชื่อมโยงฟังก์ชันทางทฤษฎีและเชิงประจักษ์

ทฤษฎีบท 1

ให้ $F_n\left(x\right)$ เป็นฟังก์ชันการแจกแจงเชิงประจักษ์ และ $F\left(x\right)$ เป็นฟังก์ชันการแจกแจงทางทฤษฎีของกลุ่มตัวอย่างทั่วไป จากนั้นความเท่าเทียมกันจะคงอยู่:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

ตัวอย่างปัญหาการหาฟังก์ชันการแจกแจงเชิงประจักษ์

ตัวอย่างที่ 1

ให้การกระจายตัวอย่างมีข้อมูลต่อไปนี้บันทึกโดยใช้ตาราง:

ภาพที่ 1.

ค้นหาขนาดตัวอย่าง สร้างฟังก์ชันการแจกแจงเชิงประจักษ์ แล้วลงจุด

ขนาดตัวอย่าง: $n=5+10+15+20=50$

ตามคุณสมบัติ 5 เราได้สิ่งนั้นสำหรับ $x\le 1$ $F_n\left(x\right)=0$ และสำหรับ $x>4$ $F_n\left(x\right)=1$

มูลค่า $x

มูลค่า $x

มูลค่า $x

ดังนั้นเราจึงได้:

รูปที่ 2.

รูปที่ 3.

ตัวอย่างที่ 2

สุ่มเลือก 20 เมืองจากเมืองทางตอนกลางของรัสเซียซึ่งได้รับข้อมูลค่าโดยสารระบบขนส่งสาธารณะดังต่อไปนี้: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

สร้างฟังก์ชันการแจกแจงเชิงประจักษ์สำหรับตัวอย่างนี้แล้วลงจุด

มาเขียนค่าตัวอย่างตามลำดับจากน้อยไปมากแล้วคำนวณความถี่ของแต่ละค่า เราได้รับตารางต่อไปนี้:

รูปที่ 4.

ขนาดตัวอย่าง: $n=20$.

ตามคุณสมบัติ 5 เราได้สิ่งนั้นสำหรับ $x\le 12$ $F_n\left(x\right)=0$ และสำหรับ $x>15$ $F_n\left(x\right)=1$

มูลค่า $x

มูลค่า $x

มูลค่า $x

ดังนั้นเราจึงได้:

รูปที่ 5.

ลองพล็อตการกระจายเชิงประจักษ์:

รูปที่ 6.

ความคิดริเริ่ม: $92.12\%$.

ซีรี่ส์รูปแบบต่างๆ รูปหลายเหลี่ยมและฮิสโตแกรม

ช่วงการจัดจำหน่าย- แสดงถึงการกระจายอย่างเป็นระเบียบของหน่วยประชากรที่กำลังศึกษาออกเป็นกลุ่มตามลักษณะเฉพาะที่แตกต่างกัน

ขึ้นอยู่กับลักษณะเฉพาะที่เป็นรากฐานของการก่อตัวของซีรีย์การจัดจำหน่าย ที่มาและการเปลี่ยนแปลงแถวการแจกจ่าย:

§ เรียกว่าชุดการแจกแจงที่สร้างขึ้นโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปน้อยของค่าลักษณะเชิงปริมาณ แปรผัน.

ชุดรูปแบบการแจกแจงประกอบด้วยสองคอลัมน์:

คอลัมน์แรกระบุค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันซึ่งเรียกว่า ตัวเลือกและถูกกำหนดไว้ ตัวเลือกแบบไม่ต่อเนื่อง - แสดงเป็นจำนวนเต็ม ตัวเลือกช่วงเวลามีตั้งแต่และถึง คุณสามารถสร้างชุดความแปรผันแบบแยกหรือแบบช่วงเวลาได้ ขึ้นอยู่กับประเภทของตัวเลือก
คอลัมน์ที่สองประกอบด้วย จำนวนตัวเลือกเฉพาะแสดงในรูปของความถี่หรือความถี่:

ความถี่- เหล่านี้เป็นตัวเลขสัมบูรณ์ซึ่งแสดงจำนวนครั้งโดยรวมของมูลค่าที่กำหนดของคุณลักษณะที่เกิดขึ้นซึ่งแสดงถึง ผลรวมของความถี่ทั้งหมดจะต้องเท่ากับจำนวนหน่วยในประชากรทั้งหมด

ความถี่() คือความถี่ที่แสดงเป็นเปอร์เซ็นต์ของทั้งหมด ผลรวมของความถี่ทั้งหมดที่แสดงเป็นเปอร์เซ็นต์จะต้องเท่ากับ 100% ในเศษส่วนของหนึ่ง

การแสดงกราฟิกของซีรีย์การจัดจำหน่าย

ชุดการจัดจำหน่ายจะถูกนำเสนอด้วยภาพโดยใช้ภาพกราฟิก

ชุดการจัดจำหน่ายมีดังต่อไปนี้:

§ รูปหลายเหลี่ยม

§ ฮิสโตแกรม

§ สะสม

รูปหลายเหลี่ยม

เมื่อสร้างรูปหลายเหลี่ยม ค่าของคุณลักษณะที่แตกต่างกันจะถูกพล็อตบนแกนนอน (แกน x) และความถี่หรือความถี่จะถูกพล็อตบนแกนตั้ง (แกน y)

1. รูปหลายเหลี่ยมในรูป 6.1 อิงตามข้อมูลจากการสำรวจสำมะโนประชากรขนาดเล็กของรัสเซียในปี 1994


แผนภูมิแท่ง



ในการสร้างฮิสโตแกรมค่าของขอบเขตของช่วงเวลาจะถูกระบุตามแกน abscissa และสร้างสี่เหลี่ยมขึ้นอยู่กับความสูงซึ่งเป็นสัดส่วนกับความถี่ (หรือความถี่)

ในรูป 6.2. แสดงฮิสโตแกรมการกระจายตัวของประชากรรัสเซียในปี 1997 ตามกลุ่มอายุ

รูปที่ 1. การกระจายตัวของประชากรรัสเซียตามกลุ่มอายุ

ฟังก์ชันการกระจายเชิงประจักษ์ สมบัติ

ให้ทราบการกระจายความถี่ทางสถิติของคุณลักษณะเชิงปริมาณ X ให้เราแสดงด้วยจำนวนการสังเกตโดยสังเกตค่าของคุณลักษณะนั้นน้อยกว่า x และด้วยจำนวนการสังเกตทั้งหมด แน่นอนว่าความถี่สัมพัทธ์ของเหตุการณ์ X

ฟังก์ชันการกระจายเชิงประจักษ์ (ฟังก์ชันการกระจายตัวอย่าง) คือฟังก์ชันที่กำหนดสำหรับแต่ละค่า x ความถี่สัมพัทธ์ของเหตุการณ์ X

ตรงกันข้ามกับฟังก์ชันการแจกแจงเชิงประจักษ์ของกลุ่มตัวอย่าง ฟังก์ชันการแจกแจงประชากรเรียกว่าฟังก์ชันการแจกแจงทางทฤษฎี ความแตกต่างระหว่างฟังก์ชันเหล่านี้ก็คือ ฟังก์ชันทางทฤษฎีจะกำหนดความน่าจะเป็นของเหตุการณ์ X

เมื่อ n เพิ่มขึ้น ความถี่สัมพัทธ์ของเหตุการณ์ X

คุณสมบัติพื้นฐาน

ปล่อยให้ผลลัพธ์เบื้องต้นได้รับการแก้ไข จากนั้นคือฟังก์ชันการกระจายของการแจกแจงแบบไม่ต่อเนื่องที่กำหนดโดยฟังก์ชันความน่าจะเป็นต่อไปนี้:

ที่ไหน และ - จำนวนองค์ประกอบตัวอย่างเท่ากับ . โดยเฉพาะถ้าองค์ประกอบทั้งหมดของกลุ่มตัวอย่างแตกต่างกันแล้ว .

ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้คือ:

.

ดังนั้นค่าเฉลี่ยตัวอย่างจึงเป็นค่าเฉลี่ยทางทฤษฎีของการกระจายตัวอย่าง

ในทำนองเดียวกัน ความแปรปรวนตัวอย่างคือความแปรปรวนทางทฤษฎีของการกระจายตัวอย่าง

ตัวแปรสุ่มมีการแจกแจงแบบทวินาม:

ฟังก์ชันการกระจายตัวอย่างเป็นการประมาณค่าฟังก์ชันการกระจายอย่างเป็นกลาง:

.

ความแปรปรวนของฟังก์ชันการแจกแจงตัวอย่างมีรูปแบบดังนี้

.

ตามกฎที่เข้มงวดของจำนวนจำนวนมาก ฟังก์ชันการกระจายตัวอย่างมาบรรจบกันกับฟังก์ชันการกระจายเชิงทฤษฎีเกือบจะแน่นอน:

เกือบจะแน่นอนที่

ฟังก์ชันการกระจายตัวอย่างเป็นการประมาณค่าปกติแบบไม่แสดงกำกับของฟังก์ชันการกระจายตามทฤษฎี ถ้าอย่างนั้น

ตามการจำหน่ายที่.

บทความสุ่ม