आँकड़ों का संगठन इस अध्याय को पढ़ने के बाद आप इस योग्य होंगे किः ऽ आगे के सांख्ियकीय विश्लेषण के लिए आँकड़ों का वगीर्करण कर सवेंफऋ ऽ मात्रात्मक एवं गुणात्मक वगीर्करण के बीच अंतर कर सवेंफऋ ऽ बारंबारता वितरण सारणी तैयार कर सवेंफऋ ऽ वगार्ें के निमार्ण की तकनीक जान सवेंफऋ ऽ मिलान - चिÉ की विध्ि से परिचित हो सवेंफऋ ऽ एकचर तथा द्विचर बारंबारता वितरण के बीच अंतर कर सवेंफ। 1. प्रस्तावना पिछले अध्याय में आपने पढ़ा कि आँकड़ों का संग्रहण वैफसे करते हैं। साथ ही, आप जनगणना एवं प्रतिचयन के बीच अंतर को भी जान चुके हैं। इस अध्याय में आप यह सीखेंगे कि जो आँकड़ें आपने संगृहीत किए अध्याय थे, उन्हें वैफसे वगीर्कृत करते हैं। अपरिष्कृत आँकड़ों कोवगीर्कृत करने का उद्देश्य उन्हें व्यवस्िथत करना है, ताकि उन्हें आसानी से आगे के सांख्ियकीय विशलेषण के योग्य बनाया जा सके। क्या आपने कभी स्थानीय कबाड़ी वाले या रद्दी सामान खरीदने वाले को देखा है, जिसे आप अपना पुराना अखबार, टूटे - पफूटे घरेलू सामान, खाली - काँच की बोतलें, प्लास्िटक आदि बेचते हैं। वह आपसे इन चीजों को खरीदता है और उन लोगों को बेच देता है जो इनका पुनः चक्रण करते हैं। लेकिन अपनी दुकान में अध्िक कबाड़ के इकट्ठे होने से उसे अपना व्यापार चलाने में मुश्िकल हो सकती है, अगर वह इन्हें उचित ढंग से व्यवस्िथत न करे। वह इस स्िथति को सरल बनाने के लिए विभ्िान्न कबाड़ों को उपयुक्त समूह में रखता है, अथार्त् उन्हें वगीर्कृत करता है। वह पुराने अखबारों को एक साथ रस्सी से बाँध् कर रखता है। इसके बाद सभी खाली काँच की बोतलों को एक बोरे में रखता है। वह धतु के सामानों का एक ढेर अपनी दुकान के एक कोने में लगाता है और पिफर उनको ‘लोहा’, ‘पीतल’, ‘ताँबा’, ‘एल्यूमिनियम’ आदि वगार्ें में छाँट कर रखता है। इस प्रकार से वह अपने कबाड़ को भ्िान्न वगार्ें - ‘अखबार’, ‘प्लास्िटक’, ‘काँच’, ‘धतु’ आदि में विभाजित कर उन्हें व्यवस्िथत करता है। जबएक बार उसका सारा कबाड़ व्यवस्िथत एवं वगीर्कृत हो जाता है, तब खरीददार की माँग पर, उसे सामग्री विशेष को खोजकर देने में आसानी हो जाती है। ठीक इसी प्रकार से, जब आप अपने विद्यालय की पुस्तकों को एक विशेष क्रम में रखते हैं, तो उनको संभालना आसान हो जाता है। आप उन्हें विषयों केअनुसार वगीर्कृत कर सकते हैं, जहाँ प्रत्येक विषय एक समूह या वगर् बन जाता है। उदाहरणाथर्, जब आपको इतिहास की कोइर् विशेष पुस्तक की आवश्यकता पड़ती है तो आप को केवल यह करना है कि ‘इतिहास’ समूह में उस पुस्तक को खोजें। अन्यथा आप को अपनी यह विशेष पुस्तक सारी पुस्तकों के ढेर में खोजनी पड़ेगी। यद्यपि पदाथार्ें अथवा वस्तुओं का वगीर्करण बहुमूल्य श्रम और समय को बचाता है, इसे मनमाने तरीके से नहीं किया जाता है। कबाड़ी वाले ने अपने कबाड़ को इस तरह से समूहों में रखा कि प्रत्येक समूह में एक ही प्रकार की चीजें हों। उदाहरण के लिए उसने ‘काँच’ के समूह में खाली काँच की बोतलें, टूटे ख्िाड़की के काँच तथा टूटे दपर्ण आदि रखे। ठीक इसी तरह से जब आपने अपनी इतिहास की पुस्तक को ‘इतिहास’ समूहमें वगीर्कृत किया, तो आप उसमें अन्य विषयों की पुस्तवेंफ नहीं रखेंगे। अन्यथा समूह - गठन का पूरा उद्देश्य ही निरथर्क हो जाएगा। इसलिए, वगीर्करण का तात्पयर् एक समान वस्तुओं को समूह या वगार्ें में व्यवस्िथत करने से है। 2.अपरिष्कृत आँकड़े कबाड़ीवाले के कबाड़ की भाँति, अवगीर्कृत आँकड़े अथवा अपरिष्कृत आँकड़े भी अत्यध्िक अव्यवस्िथत होते हैं। ये प्रायः अति विशाल होते हैं, जिन्हें संभालना कठिन होता है। इनसे साथर्क निष्कषर् निकालना श्रमसाध्य कायर् है, क्योंकि सांख्ियकीय विध्ियों का इन पर सरलता से प्रयोग नहीं किया जा सकता। इसलिए इस प्रकार के आँकड़ों का उचित संगठन तथा प्रस्तुतीकरण आवश्यक होता है, ताकि व्यवस्िथत रूप से साँख्ियकीय विश्लेषण किया जा सके। अतः आँकड़ों के संग्रह केपश्चात् अगला चरण उन्हें संगठित कर वगीर्कृत रूप में प्रस्तुत करना है। मान लीजिए कि आप गण्िात में छात्रों की प्रगति जानना चाहते हैं और आपने अपने स्वूफल के 100 छात्रों के गण्िात के अंकों के आँकड़े एकत्रिात कर लिये हैं। अगर आप इन्हें एक सारणी में प्रस्तुत करते हैं तो वे संभवतः सारणी 3.1 जैसे प्रतीत हो सकते हैं। सारणी 3.1 के स्थान पर 1000 छात्रों के अंक संभालने हों तो यहकिसी परीक्षा में 100 छात्रों द्वारा गण्िात में प्राप्त अंक और भी अध्िक थकानेवाला होगा।474510 6051566610049 40 60 59 56 55 62 48 59 55 51 41 सारणी 3.2 426964 66505957656250 खाद्य पर 50 परिवारों के मासिक पारिवारिक व्यय 643037 75175620145590 ;रु मेंद्ध 625155 14253490495654 1904 1559 3473 1735 2760 7047 49 82408260856566 2041 1612 1753 1855 4439 4944 64 69704812285565 5090 1085 1823 2346 1523 4940 25 4171800 561422 1211 1360 1110 2152 1183 6653 46 70436159123035 1218 1315 1105 2628 2712 4544 57 76823932149025 4248 1812 1264 1183 1171 1180 1137या पिफर आप अपने पड़ोस के 50 परिवारों से, 1007 1953 2048 2025 1583 1324 2621 3676भोजन पर उनके मासिक व्यय के आँकड़ों का संग्रह 1397 1832 1962 2177 2575 यह जानने के लिए करते हैं कि भोजन पर उनका 1293 1365 1146 3222 1396 औसत व्यय कितना है। इस मामले में संगृहीत आँकड़ों ठीक इसी प्रकार से, सारणी 3.2 में आपके लिएको जब आप सारणी में प्रस्तुत करते हैं, तो वे सारणी कापफी मुश्िकल होगा कि 50 परिवारों के खाने पर3.2 की तरह दिख सकते हैं। सारणी 3.1 तथा सारणीमासिक व्यय के औसत को पता कर सवेंफ। यही3.2, दोनों ही आँकड़े अपरिष्कृत अथवा अवगीर्कृत हैं। कठिनाइर् तब कइर् गुना बढ़ जाएगी यदि यह संख्यादोनों ही सारण्िायों में संख्याओं को किसी भी क्रम में बहुत बड़ी हो, जैसे 5000 परिवार। ठीक कबाड़ीवालेव्यवस्िथत नहीं किया गया है। अब अगर आपसे यह की भाँति ही ;जब कबाड़ का ढेर बहुत बड़ा और अव्यवस्िथत हो तो उसे एक विशेष वस्तु को ढँूढ़ने में बहुत कठिनाइर् होती हैद्ध आपकी भी स्िथति होगी, यदिअपरिष्कृत आँकड़ों का भंडार बहुत बड़ा हो और आप उससे कोइर् सूचना प्राप्त करना चाहें। इसलिए, संक्षेप मेंअवगीर्कृत विशाल आँकड़ों से कोइर् सूचना प्राप्त करनाएक बेहद थका देने वाला एवं उबाऊ काम है।वगीर्करण के द्वारा अपरिष्कृत आँकड़ों को संक्ष्िाप्त एवं बोध्गम्य बनाया जाता है। जब एक प्रकार की विशेषताओं वाले तथ्यों को एक ही वगर् में रखा जाता है तो वे बिना किसी कठिनाइर् के ढूँढ़ने, तुलना करने तथा निष्कषर् निकालने योग्य हो जाते हैं। आपने अध्याय 2 में पढ़ा है कि प्रति दस साल बाद भारत सरकारजनसंख्या की गणना कराती है। जनगणना के अपरिष्कृत आँकड़े बहुत विशाल एवं विखंडित होते हैं। उन से कोइर् भी अथर्पूणर् निष्कषर् निकालना असंभव कायर् लगता है। लेकिन जनगणना के यही आँकड़े जब लिंग,श्िाक्षा, वैवाहिक स्िथति, पेशे आदि के अनुसार वगीर्कृतकिये जाते हैं तब भारत की जनसंख्या की प्रकृति एवं संरचना आसानी से समझ में आ जाती है।अपरिष्कृत आँकड़ें चरों के प्रेक्षणों से बने होते हैं।अपरिष्कृत आँकड़ों की प्रत्येक इकाइर् एक प्रेक्षण होती है। सारणी 3.1 में प्रेक्षण चर का एक विशेष मान‘गण्िात में छात्रा के अंक’ को दशार्ता है। अपरिष्कृत आँकड़ों में छात्रों के अंक के 100 प्रेक्षण निहित हैं, चूँकि छात्रों की संख्या 100 है। सारणी 3.2 में, ‘भोजन पर एक परिवार के मासिक व्यय’ चर के मानों को प्रदश्िार्त किया गया है। इसमें भोजन पर एक परिवार केमासिक व्यय के 50 अपरिष्कृत आँकड़े निहित हैं, क्योंकि यहाँ 50 परिवार हैं। 3.आँकड़ों का वगीर्करण किसी वगीर्करण के वगर् या समूह कइर् तरीकों से बनाए जा सकते हैं। आप अपनी पुस्तकों को विषयों - ‘इतिहास’,‘भूगोल’, ‘गण्िात’, ‘विज्ञान’ आदि में वगीर्कृत करने के स्थान पर इन्हें वणर्माला के क्रम में लेखकों के आधारपर वगीर्कृत कर सकते हैं। अथवा, आप इन्हें प्रकाशन - वषर् के आधर पर भी वगीर्कृत कर सकते हैं। आपउन्हें किस प्रकार से वगीर्कृत करना चाहते हैं, यह आपकी आवश्यकता पर निभर्र करेगा।ठीक इसी प्रकार से, अपरिष्कृत आँकड़ों को भीविभ्िान्न तरीकों से वगीर्कृत किया जा सकता है जो आपके अध्ययन के उद्देश्य पर निभर्र करता है। उन्हें समय के अनुसार समूहित किया जा सकता है। इस प्रकार के वगीर्करण को कालानुक्रमिक वगीर्करण कहते हैं। इस प्रकार के वगीर्करण में, आँकड़ों को समय के संदभर् - जैसे वषर्, तिमाही, मासिक या साप्ताहिकआदि के रूप में, आरोही या अवरोही क्रम में वगीर्कृत किया जा सकता है। निम्नलिख्िात उदाहरण वषो± के आधर पर भारत की जनसंख्या के वगीर्करण को दिखाता है। चर ‘जनसंख्या’ एक काल - श्रेणी है, क्योंकि इसमें विभ्िान्न वषार्ें के मानों की एक श्रेणी चित्रिात की गइर् है। उदाहरण 1 भारत की जनसंख्या ;करोड़ मेंद्ध वषर् जनसंख्या ;करोड़ मेंद्ध 1951 35.7 1961 43.8 1971 54.6 1981 68.4 1991 81.8 2001 102.7 स्थानिक वगीर्करण के अंतगर्त आँकड़ों का वगीर्करण भौगोलिक स्िथतियों जैसे कि देश, राज्य, शहर, जिला, कस्बा आदि के संदभार्नुसार होता है। उदाहरण 2 में विभ्िान्न देशों में गेहूँ की उपज दिखाइर् गइर् है। उदाहरण 2 विभ्िान्न देशों में गेहूँ की उपज देश गेहूँ की उपज ;किग्रा/एकड़द्ध अमेरिका ब्राजीलचीन डेनमाकर् 1925 127 893 225 Úांस 439 भारत 862 कइर् बार आपका सामना ऐसी विशेषताओं से होता है, जिन्हें मात्रात्मक रूप में व्यक्त नहीं किया जा सकता है। इस प्रकार की विशेषताओं को ‘गुण’ कहते हैं। उदाहरण के लिए - राष्ट्रीयता, साक्षरता, ध्मर्, लिंग, वैवाहिक स्िथति आदि। इन्हें मापा नहीं जा सकता है। इन गुणों को गुणात्मक विशेषता की उपस्िथति या अनुपस्िथति के आधर पर वगीर्कृत कर सकते हैं। विशेषताओं पर आधरित आँकड़ों के ऐसे वगीर्करण को गुणात्मक वगीर्करण कहा जाता है। निम्नलिख्िात उदाहरण में हम किसी देश की जनसंख्या को गुणात्मक चर ‘लिंग’ के आधर पर समूहित किया हुआ पाते हैं। इसमें प्रेक्षण स्त्राी या पुरुष हो सकता है। इन दो विशेषताओं को आगे वैवाहिक स्िथति ;गुणात्मक चरद्धके आधर पर वगीर्कृत किया जा सकता है, जैसा कि नीचे दिया गया है अथर्शास्त्रा में सांख्ियकी उदाहरण 3 प्रथम चरण में यह वगीर्करण पहले विशेषता की उपस्िथति या अनुपस्िथति पर आधरित है जैसे कि ‘पुरुष’ या ‘पुरुष नहीं’ ;स्त्राीद्ध है। दूसरे चरण में, प्रत्येक वगर् ‘स्त्राी’ या ‘पुरुष’ आगे दूसरी विशेषता की उपस्िथति या अनुपस्िथति के आधर पर विभाजित है,जैसे विवाहित या अविवाहित। दूसरी ओर ऊँचाइर्, भार, आयु, आय, छात्रों के अंक आदि विशेषताओं कीप्रकृति मात्रात्मक है। जब ऐसी विश्िाष्टताओं के संगृहीत आँकड़ों को वगार्ें में समूहित किया जाता है तो यह वगीर्करण मात्रात्मक वगीर्करण कहलाता है। उदाहरण 4 100 छात्रों के गण्िात के प्राप्तांकों का बारंबारता वितरण अंक बारंबारता 0μ10 1 10μ20 8 20μ30 6 30μ40 7 40μ50 21 50μ60 23 60μ70 19 70μ80 6 80μ90 5 90μ100 4 योग 100 उदाहरण 4 में 100 छात्रों के गण्िात के प्राप्तांकों का मात्रात्मक वगीर्करण दिखाया गया है, जिन्हें सारणी 3.1 में बारंबारता वितरण के रूप में दिया गया है। 4.चर: संतत और विविक्त चर की सरल परिभाषा, जिसका आपने पिछले अध्याय में अध्ययन किया था, यह नहीं बतलाती कि यह वैफसे परिवतिर्त होता है। भ्िान्न चर अलग - अलग प्रकार से परिवतिर्त होते हैं और परिवतर्न के आधर पर उन्हेंसामान्यतः दो वगार्ें में वगीर्कृत किया जाता हैः ;कद्ध संतत तथा ;खद्ध विविक्त संतत चर का कोइर् भी संख्यात्मक मान हो सकता है। यह पूणांर्क मान ;1, 2, 3, 4 ...द्ध, भ्िान्नात्मक मान ;1/2, 2/3, 3/4द्ध, तथा वे मान जो यथातथ भ्िान्न नहीं हैं ; 2 = 1.414, 3 = 1.732, ..., 7= 2.645द्ध हो सकते हैं। उदाहरण के लिए, मान लिजिए कि एक छात्रा का कद 90μ150 सेमी तक बढ़ता है, तो उसके कद के मान इसके बीच आने वाले सभी मान हो सकते हैं। यह संपूणर् संख्या वाले मान को भी प्रकट कर सकता है, जैसे कि 90 सेमी, 100 सेमी, 108 सेमी, 150 सेमी। इसके साथ ही यह भ्िान्नात्मक मान जैसे 90.85 सेमी, 102.34 सेमी, 149.99 सेमी आदि भी हो सकते हैं, जो पूणा±क नहीं हैं। इस प्रकार ‘ऊँचाइर्’ चर किसी भी कल्िपत मान को अभ्िाव्यक्त करने में सक्षम है और इसके मानों को अनन्त श्रेण्िायों में बाँटा जा सकता है। संतत चर के अन्य उदाहरण भार, समय तथा दूरी आदि हैं। संतत चर के विपरीत विविक्त चर केवल निश्िचत मान हो सकते हैं। इसके मान केवल परिमित ‘उछाल’ से बदलते हैं। यह उछाल एक मान से दूसरे मान के बीच होते हंै, परंतु इसके बीच में कोइर् मान नहीं आता है। उदाहरण के लिए, कोइर् चर जैसे ‘किसी कक्षा में छात्रों की संख्या’, भ्िान्न वगार्ें के लिए उन मानों की कल्पना करता है, जिसमें केवल पूणर् संख्याएँ हों। यह कोइर् भी भ्िान्नात्मक मान जैसे 0.5 नहीं हो सकता, क्योंकि ‘एक छात्रा का आध’ निरथर्क है। इस प्रकार से इसमें 25 एवं 26 के बीच का मान 25.5 नहीं हो सकता है। इसकी अपेक्षा इसका मान या तो 25 होगा या पिफर 26। हम देखते हैं कि जब इसका मान 25 से 26 में बदलता है, तो इन दोनों के बीच के भ्िान्नों को इसमें नहीं लिया जाता है। लेकिन ऐसा मत सोचिए कि किसी विविक्त चर का मान भ्िान्न में नहीं हो सकता। मान लीजिए कि ग एक चर है जिसमें 1/8, 1/16, 1/32, 1/64 ..., जैसे मान हंै तो क्या यह एक विविक्त चर है? हाँ, क्योंकि यद्यपि ग के मान भ्िान्नों में हो सकते हैं, तथापि ये दो सन्िनकट भ्िान्नों के बीच नहीं हो सकते। यह 1/8 से 1/16 में और पिफर 1/16 से 1/32 में ‘बदलता’ है, परंतु 1/8 से 1/16 के बीच या 1/16 से 1/32 के बीच के मान नहीं ले सकता। हमने पहले यह बताया है कि उदाहरण 4 में 100 छात्रों के गण्िात में प्राप्तांक का बारंबारता वितरण दिया गया है, जैसा कि सारणी 3.1 में दिखाया गया है। यह दिखाता है कि 100 छात्रों के अंकों को वगार्ें में वैफसे समूहित किया गया है। आपको आश्चयर् होगाकि हमने सारणी 3.1 के अपरिष्कृत आँकड़ों से इसे वैफसे प्राप्त किया। लेकिन इस प्रश्न का समाधन प्रस्तुत करने से पहले आपका यह जानना आवश्यक है कि बारंबारता वितरण क्या होता है। 5.बारंबारता वितरण क्या है? बारंबारता वितरण अपरिष्कृत आँकड़ों को एक मात्रात्मकचर में वगीर्कृत करने का एक सामान्य तरीका है। यह दिखाता है कि किसी चर के भ्िान्न मान ;यहाँ छात्रा द्वारा गण्िात में प्राप्तांकद्ध विभ्िान्न वगार्ें में, अपने अनुरूप वगार्ें की बारंबारताओं के साथ वैफसे वितरित किए जाते हैं। इस उदाहरण में हमारे पास प्राप्तांकों के 10 वगर् हैं। 0μ10, 10μ20, ...... 90μ100। वगर् - बारंबारता पद का अथर् है एक विशेष वगर् में मानों की संख्या। उदाहरण के लिए वगर् 30μ40 में सारणी 3.1 में प्राप्तांकों के 7 मान हैं। ये 30, 37, 34, 30, 35, 39, 32 हैं। इस प्रकार से वगर् 30μ40 की बारंबारता 7 हुइर्। पर शायद आपको आश्यचर् हो कि 40 का अंक जोअपरिष्कृत आँकड़ों में दो बार आया है, उसे 30μ40 वगर् में शामिल क्यों नहीं किया गया? अगर इसे 30μ40 वगर् की बारंबारता में शामिल किया जाता, तो ये 7 की अपेक्षा 9 होते। यह पहेली तब स्पष्ट हो जाएगी, जब आप इस अध्याय को पयार्प्त ध्ैयर् के साथ सावधनी पूवर्क पढ़ेंगे। इसलिए पढ़ना जारी रखें। आपकोस्वयं ही इसका उत्तर प्राप्त हो जाएगा। बारंबारता वितरण सारणी में प्रत्येक वगर्, वगर् सीमाओं द्वारा घ्िारा होता है। वगर् में ये सीमाएँ दो छोरों अथर्शास्त्रा में सांख्ियकी पर होती हैं। इसमें न्यूनतम मान को निम्नवगर् सीमा तथा उच्चतम मान को उच्च वगर् सीमा कहते हैं। उदाहरण के लिए वगर् 60μ70 में वगर् सीमाएँ 60 एवं 70 हैं। इसकी निम्न वगर् सीमा 60 और उच्च वगर् सीमा 70 है। वगर् मध्यांतर या अंतराल या वगर् विस्तार उच्च वगर् सीमा तथा निम्न वगर् सीमा के बीच का अंतर है। वगर् 60μ70 के लिए वगर् अंतराल 10 है, ;उच्च वगर् सीमा में से निम्न वगर् सीमा को घटाकरद्ध। वगर् मध्यबिन्दु अथवा वगर् चिÉ किसी वगर् का मध्य - मान है। यह वगर् की निम्न वगर् सीमा तथा उच्च वगर् सीमा के बीच होता है। इसे निम्नलिख्िात तरीके से पता किया जा सकता हैः वगर् मध्य बिन्दु या वगर् चिÉ = ;उच्च वगर् सीमा $ निम्न वगर् सीमाद्ध/2 ... ... ... ... ... ... ... ... ... ;1द्धप्रत्येक वगर् का वगर् चिÉ या वगर् मध्य - बिन्दु एक वगर् के प्रतिनिध्ित्व के लिए प्रयुक्त किया जाता है।एक बार जब अपरिष्कृत आँकड़ों को वगो± में समूहित कर दिया जाता है, तब आगे की गणनाओं में व्यष्िट प्रेक्षणों का प्रयोग नहीं किए जाता है बल्िक इसकीजगह वगर् चिÉ प्रयुक्त किया जाता है। सारणी 3.3निम्न वगर् सीमा, उच्च वगर् सीमा तथा वगर् चिÉ वगर् बारंबारता निम्नवगर् उच्चवगर् वगर् सीमा सीमा चिÉ 0μ10 1 0 10 5 10μ20 8 10 20 15 20μ30 6 20 30 25 30μ40 7 30 40 35 40μ50 21 40 50 45 50μ60 23 50 60 55 60μ70 19 60 70 65 70μ80 6 70 80 75 80μ90 5 80 90 85 90μ100 4 90 100 95 बारंबारता वक्र किसी बारंबारता वितरण का आलेखीय प्रस्तुतीकरण है। चित्रा 3.1 के अंतगर्त उपरोक्त उदाहरण में दिए गए आँकड़ों का आरेखी प्रस्तुतीकरण दिया गयाहै। बारंबारता वक्र प्राप्त करने के लिए, हम वगर् चिÉ को एक्स ;गद्ध अक्ष पर तथा बारंबारता को वाइर् ;लद्ध अक्ष पर आलेख्िात करते हैं। चित्रा 3.1 आँकड़ों के बारंबारता वितरण का आरेखी प्रस्तुतीकरण। बारंबारता वितरण वैफसे तैयार करें? सारणी 3.1 के अपरिष्कृत आँकड़ों से बारंबारता वितरण तैयार करते समय हमें निम्न प्रश्नों की व्याख्या पर ध्यान देने की आवश्यकता हैः 1.हमें कितने वगर् रखने चाहिए? 2.प्रत्येक वगर् का आकार क्या हो? 3.वगर् सीमाओं का निधर्रण वैफसे किया जाय? 4.प्रत्येक वगर् के लिए बारंबारता वैफसे प्राप्त की जाय? हमें कितने वगर् रखने चाहिए? हमें वगार्ें की संख्या निधर्रित करने से पहले यह पता करना चाहिए कि दिए गए चर के मान में कितना परिवतर्न होता है। चरों के मान में इस प्रकार के परिवतर्नों को इनके परास द्वारा दिखाया जाता है। परास चरों के उच्चतम एवं न्यूनतम मानों के बीच का अंतर है। विस्तृत परास यह संकेत देता है कि चरों के मान में व्यापक प्रसार है। दूसरी तरपफ, लघु परास यह संकेत देता है कि चरों के मान में कम प्रसार है। हमारे उदाहरण में, चर ‘एक छात्रा के प्राप्तांक’ में परास 100 है, क्योंकि यहाँ पर न्यूनतम प्राप्तांक 0 तथा अध्िकतम प्राप्तांक 100 हैं। यह संकेत देेता है कि चर में विस्तृत प्रसरण है। परास के मान को ज्ञात करने के पश्चात् यदि एक बार हम वगर् अंतराल को तय कर लेते हैं, तो वगार्ें की संख्या निधर्रित करना आसान हो जाता है। ध्यान दें कि सभी वगर् अंतरालों का योगपफल ही परास है। यदि वगर् अंतराल बराबर होते हैं, तब वगार्ें की संख्याओं और किसी एक वगर् के अंतराल का गुणनपफल परास है। परास = वगार्ें की संख्या × वगर् अंतराल .................................................................................................;2द्ध यदि, हम लघु वगर् अंतराल का चयन करते हैं तो, दिए गए परास के लिए, वगार्ें की संख्या अध्िक होगी। अध्िसंख्य वगार्ें वाला बारंबारता वितरण बहुत बड़ा दिखेगा। इस प्रकार के वितरण को संभालना आसान नहीं होता है। इसलिए हम उचित संहत आँकड़ों का समुच्चय रखना चाहते हैं। दूसरी ओर, दिए गए परास के लिए, यदि वगर् अंतराल को बहुत बड़ा रखते हैं तो वगार्ें की संख्या बहुत कम हो जाती है। आँकड़ों का समुच्चय तब संभवतः बहुत अध्िक संहत हो जाता है तथा इसकी विविध्ता के बारे में सूचनाओं की हानि को भी हम शायद न पसंद करें। उदाहरण के लिए, मान लें, कि परास 100 है और वगर् अंतराल 50 हंै, तब वगार्ें की संख्या केवल 2 होगी ;अथार्त 100/50=2द्ध। यद्यपि वगार्ें की संख्या के निधर्रण के लिए कोइर् पक्का नियम नहीं है, पिफर भी एक व्यावहारिक नियम है कि वगार्ें की संख्या 5 से 15 के बीच होनी चाहिए। हमने अपने उदाहरण में वगार्ें की संख्या 10 चुनी है। चूँकि परास 100 है और वगर् अंतराल 10 है, अतः वगार्ें की संख्या 100/10=10 है। प्रत्येक वगर् का आकार क्या होना चाहिए इस प्रश्न का उत्तर पहले के प्रश्न के उत्तर पर निभर्र करता है। समानता ;2द्ध प्रकट करती है कि एक बार वगर् अंतराल को तय करने पर चर के दिए गए परास से हम वगार्ें की संख्या निधर्रित कर सकते हैं। ठीक इसी प्रकार से हम वगर् अंतराल निधर्रित कर सकते हैं, जब एक बार हम वगार्ें की संख्या तय कर लेते हैं। इस तरह हम पाते हैं कि ये दोनों निणर्य एक दूसरे से जुड़े हुए हैं। पहले का निणर्य लिए बिना हम दूसरे पर निणर्य नहीं ले सकते। उदाहरण 4 में, हमारे पास वगार्ें की संख्या 10 है तथा परास का दिया गया मान 100 है, तब वगर् - अंतराल स्वतः ही ;समानता 2 के द्वाराद्ध 10 है। ध्यान दें कि वतर्मान संदभर् में हमने वह वगर् अंतराल चुना है, जिनका परिमाण समान है। तथापि हम ऐसा वगर् अंतराल चुन सकते हैं जिसका परिमाण समान न हो, तब ऐसे मामले में वगार्ें की चैड़ाइर् असमान होगी। हमें वगर् सीमाएँ वैफसे निधर्रित करनी चाहिए? जब हम संतत चर के अपरिष्कृत आँकड़ों को किसीबारंबारता वितरण में वगीर्कृत करते हैं, तब हम वास्तव में व्यष्िट प्रेक्षणों को वगार्ें में समूहित करते हैं। किसी वगर् की उच्च वगर् सीमा का मान तब प्राप्त होता है, जब उस वगर् की निम्न वगर् सीमा के मान के साथ वगर् अंतराल को जोड़ा जाता है। उदाहरण के लिए, वगर् 20μ30 की उच्च वगर् सीमा 20 $ 10 = 30 है, जहाँ 20 निम्न वगर् सीमा है और 10 वगर् अंतराल है। यही विध्ि अन्य वगार्ें के लिए भी दोहराइर् जाती है। अथर्शास्त्रा में सांख्ियकी लेकिन पहले वगर् की निम्न वगर् सीमा को हम वैफसे तय करते हंै? इसे इस तरह कह सकते हैं कि पहले वगर् 0μ10 की निम्न वगर् सीमा ;0द्ध शून्य क्यों होती है? ऐसा इसलिए होता है क्योंकि हम चर के न्यूनतम मूल्य को पहले वगर् की न्यूनतम सीमा चुनते हैं। वास्तव में, हम प्रथम वगर् की निम्न वगर् सीमा के चर का मान न्यूनतम मान से भी कम चुन सकते थे। ठीक इसी प्रकार से अंतिम वगर् की उच्च सीमा का मान चर के अध्िकतम मान से भी अध्िक चुना जा सकता है। यह महत्वपूणर् है कि जब एक बारंबारता वितरण की रचना की जाती है, तब वगर् सीमाओं का चुनाव इस प्रकार किया जाना चाहिए, कि जहाँ तक संभव हो प्रत्येक वगर् का मध्य बिंदु या वगर् चिÉ उस मान का संपाती हो, जिसके आस - पास आँकड़े संवेंफदि्रत हों। हमारे उदाहरण में, 100 छात्रों के प्राप्तांकों में, हमने पहले 0μ10 वगर् में निम्न वगर् सीमा को 0 ;शून्यद्ध चुना, क्योंकि न्यूनतम अंक 0 है इसीलिए हमने उस वगर् की निम्न वगर् सीमा को 1 नहीं चुना। यदि हमने ऐसा किया होता तो, हमने प्रेक्षण 0 कोबहिष्कृत कर दिया होता। पहले वगर् 0μ10 की उच्च वगर् सीमा को निम्नवगर् सीमा में वगर् अंतराल को जोड़ कर प्राप्त किया गया है। इस प्रकार से पहले वगर् की उच्च वगर् सीमा 0 $ 10 = 10 प्राप्त हुइर्। यही प्रिया अन्य वगार्ें के साथ अपनाइर् जाती है। क्या आपने ध्यान दिया है कि पहले वगर् की उच्च वगर् सीमा दूसरे वगर् की निम्न वगर् सीमा के बराबर है, और दोनों ही 10 के बराबर हैं। यही बात अन्य वगार्ें में भी दिखती है, क्यों? इसका कारण यह है कि हमनेअपरिष्कृत आँकड़ों के वगीर्करण के लिए अपवजीर् विध्ि को चुना है। इस विध्ि के अंतगर्त, हमने वगार्ें को इस प्रकार से गठित किया है कि एक वगर् की निम्न वगर् सीमा, उससे पहले के वगर् की उच्च वगर् सीमा से संपाती ;मिलतीद्ध है। हम आगे जिस समस्या का सामना करेंगे, वह यहहै कि हम एक प्रेक्षण को वैफसे वगीर्कृत करें, जो न केवल किसी विशेष वगर्, उच्च वगर् सीमा के बराबर हो, बल्िक अगले वगर् की निम्न वगर् सीमा के भी बराबर हो। उदाहरणाथर् प्रेक्षण 30 वगर् 20μ30 की उच्च वगर् सीमा के बराबर है और वगर् 30μ40 की निम्न वगर् सीमा के भी बराबर है। तब इन दोनों वगार्ें 20μ30 अथवा 30μ40 में हमें प्रेक्षण 30 को किस वगर् में रखना चाहिए? हम इसे या तो वगर् 20μ30 में रख सकते हैं या वगर् 30μ40 में। यह एक दुविध है जो आम तौर पर तब झेलनी पड़ती है, जब हम आँकड़ों का वगीर्करण अतिव्यापी वगार्ें में करते हैं। इस समस्या का समाधन अपवजीर् विध्ि में वगीर्करण के नियम द्वारा किया जाता है। अपवजीर् विध्ि इस विध्ि के द्वारा, वगार्ें का गठन इस प्रकार से किया जाता है कि एक वगर् की उच्च वगर् सीमा, अगले वगर् की निम्न वगर् सीमा के बराबर होती है। इस विध्ि से आँकड़ों की संततता बनी रहती है। यही कारण है कि वगीर्करण की यह विध्ि संतत चर के आँकड़ों के लिए अत्यध्िक उपयुक्त होती है। इस विध्ि के अंतगर्त, उच्चवगर् सीमा को छोड़ देते हैं, परंतु एक वगर् की निम्न वगर् सीमा को अंतराल में शामिल कर लिया जाता है। इसी प्रकार इस विध्ि के अनुसार कोइर् प्रेक्षण जो उच्च वगर् सीमा के बराबर है उसे उस वगर् में शामिल न कर अगले वगर् में शामिल किया जाता है। दूसरी ओर, यदि यह निम्न वगर् सीमा के बराबर होती तब इसे उस वगर् में शामिल कर लिया जाता। छात्रों के प्राप्तांकों के हमारे उदाहरण में प्रेक्षण 40 अपरिष्कृत आँकड़ों की सारणी 3.1 में दो बार प्रकट होता है, इसे वगर् 30μ40 में शामिल नहीं किया गया, पर उसे अगले वगर् 40μ50 में शामिल किया गया है। इसलिए वगर् 30μ40 में बारंबारता 9 की अपेक्षा 7 है। वगर् गठन के लिए अन्य विध्ि भी है, जिसे हम वगीर्करण की समावेशी विध्ि कहते हैं। समावेशी विध्ि अपवजीर् विध्ि की तुलना में समावेशी विध्ि किसी वगर् अंतराल में उच्च वगर् सीमा को नहीं छोड़ती। इस विध्ि में किसी वगर् में उच्च वगर् सीमा को सम्िमलित किया जाता है। अतः दोनों वगर् सीमाएँ वगर् अंतराल का हिस्सा होती हैं। सारणी 3.4 एक कंपनी के 550 कमर्चारियों की आय का बारंबारता वितरण आय ;रु मेंद्ध कमर्चारियों की संख्या 800μ899 50 900μ999 100 1000μ1099 200 1100μ1199 150 1200μ1299 40 1300μ1399 10 योग 550 उदाहरण के लिए सारणी 3.4 में बारंबारता वितरण में हमने वगर् 800μ899 में उन कमर्चारियों को शामिल किया है, जिनकी आय या 800 रु है या पिफर 800 रु से 899 रु के बीच या पिफर 899 रु है। यदि किसी कमर्चारी की आय ठीक 900 रु है तो हम उसे अगले वगर् 900μ999 में रखेंगे। वगर् अंतराल में समायोजन सारणी 3.4 में समावेशी विध्ि के सूक्ष्म अध्ययन से पता चलता है कि यद्यपि चर ‘आय’ एक संतत चर है, तथापि जब वगार्ें को बनाया जाता है तो संततता नहीं रहती। हम एक वगर् की उच्च सीमा तथा अगले वगर् की निम्न सीमा में ‘अंतर’ या असंततता पाते हैं। उदाहरण के लिए, पहले वगर् की उच्च सीमा 899 और दूसरे वगर् की निम्न सीमा 900 के बीच हम 1 ;एकद्ध का ‘अंतर’ पाते हैं। तब हम आँकड़ों के वगीर्करण में चर की संततता को वैफसे सुनिश्िचत करते हैं। इसे वगर् अंतराल के बीच समायोजन करके किया जाता है। समायोजन निम्नलिख्िात तरीके से किया गया है। 1.द्वितीय वगर् की निम्न सीमा और प्रथम वगर् की उच्च सीमा के बीच अंतर पता करें। उदाहरण के लिए, सारणी 3.4 में द्वितीय वगर् की निम्न सीमा 900 और प्रथम वगर् की उच्च सीमा 899 के बीच अंतर 1 है ;अथार्त 900 - 899 = 1द्ध। 2.प्राप्त किए गए अंतर ;1द्ध को 2 से विभाजित करें ;अथार्त 1/2 = 0.5द्ध। 3.सभी वगा±े की निम्न सीमाओं से ;2द्ध में प्राप्त किए गए मान को घटाइए ;निम्न वगर् सीमा μ 0.5द्ध। 4.सभी वगार्ें की उच्च सीमा में ;2द्ध में प्राप्त किए गए मान को जोडि़ए ;उच्च वगर् सीमा $ 0.5द्ध। समायोजन के पश्चात्, जिससे बारंबारता वितरण में आँकड़ों की संततता की पुनः प्राप्ित होती है, सारणी 3.4 संशोध्ित होकर सारणी 3.5 बन जाती है। वगर् सीमाओं में समायोजन के पश्चात्, समानता;1द्ध जोकि वगर् चिÉ का मान निधर्रित करती है, निम्नलिख्िात प्रकार से संशोध्ित हो जायगीः समायोजित वगर् चिÉ = ;समायोजित उच्च वगर् सीमा $ समायोजित निम्न वगर् सीमाद्ध/2 सारिणी 3.5 एक कंपनी के 550 कमर्चारियों की आय का बारंबारता वितरण आय ;रु मेंद्ध कमर्चारियों की संख्या 799.5μ899.5 50 899.5μ999.5 100 999.5μ1099.5 200 1099.5μ1199.5 150 1199.5μ1299.5 40 1299.5μ1399.5 10 योग 550 अथर्शास्त्रा में सांख्ियकी हमें प्रत्येक वगर् की बारंबारता वैफसे प्राप्त करनी चाहिए साधरण शब्दों में, एक प्रेक्षण की बारंबारता का अथर् हैकि अपरिष्कृत आँकड़ों में कितनी बार वह प्रेक्षण प्रकट होता है। सारणी 3.1 में, हमने देखा कि 40 का मान तीन बार आया है, जबकि 0 और 10 का मान एक बार, 49 का मान 5 बार और ऐसे ही अन्य मान आये हैं। इस प्रकार से 40 की बारंबारता 3, 0 की 1, 10 की 1, 49 की 5 तथा ऐसे ही। लेकिन जब आँकड़े वगार्ें में समूहित कर दिए जाते हैं, जैसा कि उदाहरण 3 में किया गया है, तो किसी वगर् की बारंबारता से तात्पयर् उस वगर् के मानों की संख्याओं सेे है। वगर् - बारंबारताओंकी गिनती विशेष वगर् के सामने मिलान चिÉों को लगाकर की जाती है। मिलान चिÉ अंकन द्वारा वगर् बारंबारता को ज्ञात करना मिलान चिÉ ;/द्ध किसी वगर् के प्रत्येक छात्रा के सामने लगाया जाता है, जिसके प्राप्तांक उस वगर् में शामिल हैं। उदाहरण के लिए, यदि किसी छात्रा का प्राप्तांक 57 है तो उस छात्रा के लिए वगर् 50μ60 मेंएक मिलान चिÉ ;/द्ध लगाया जाता है। यदि प्राप्तांक71 हैं तो मिलान चिÉ ;/द्ध को वगर् 70μ80 में लगाया जाता है। यदि कोइर् 40 अंक प्राप्त करता है तो उसकेलिए मिलान चिÉ वगर् 40μ50 में लगाया जाता है। सारणी 3.1 के 100 छात्रों के गण्िात में प्राप्तांकों केमिलान चिÉों को सारणी 3.6 में दिखाया गया है।मिलान चिÉों का परिकलन तब आसान हो जाताहै जब 4 चिÉ खड़े ;////द्ध लगाए जाते हैं और पाँचवँाचिÉ सबको काटता हुआ तिरछा लगाया जाता है, जैसे ; द्ध। मिलान चिÉों की गणना पाँच के समूह में कीजाती है, इसलिए यदि किसी वगर् में 16 मिलान चिÉ हैं तो उन्हें इस प्रकार से / लिखते हैं, ताकि परिकलन में सुविध रहे। इसलिए एक वगर् की बारंबारता उतनी ही होगी, जितनी उस वगर् में मिलानचिÉों की संख्या। सूचना की हानि ;स्वेे व िप्दवितउंजपवदद्ध बारंबारता वितरण के रूप में आँकड़़ों के वगीर्करण मेंएक अंतनिर्हित दोष पाया जाता है। यह अपरिष्कृत आँकड़ों का सारंाश प्रस्तुत कर उन्हें संक्ष्िाप्त एवं बोध् गम्य तो बनाता है, परंतु इसमें वे विस्तृत विवरण नहींप्रकट हो पाते जो अपरिष्कृत आँकड़ों में पाए जाते हैं।यद्यपि अपरिष्कृत आँकड़ों को वगीर्कृत करने में सूचना की क्षति होती है, तथापि आँकड़ों को वगीर्करण द्वारा संक्ष्िाप्त करने पर पयार्प्त जानकारी मिल जाती है। एक बार जब आँकड़ों को वगार्ें में समूहित कर दिया जाता है तब व्यष्िट प्रेक्षणों का आगे सांख्यकीय परिकलनों में कोइर् महत्व नहीं होता। उदाहरण 4 में, वगर् 20μ30 के अंतगर्त 6 प्रेक्षण 25, 25, 20, 22, 25 एवं 28 हैं। इसलिए जब इन आँकड़ों को बारंबारता वितरण में वगर् 20μ30 में समूहित कर दिया जाता है, तब यह बारंबारता वितरण उस वगर् की बारंबारता ;जैसे 6द्ध को दिखाता है, न कि उनके वास्तविक मानों को। इस वगर् के सभी मानों को उस वगर् के वगर् - अंतराल के मध्यमान या वगर् चिÉ के बराबर माना जाता है ;अथार्त् 25द्ध। आगे की सांख्ियकीय परिकलनों के लिए वगर्चिÉ के मान को आधर बनाया जाता है, न कि उस वगर् के प्रेक्षणों के मान को। यही बात सभी वगार्ें के लिए सत्य है। इस प्रकार प्रेक्षणों के वास्तविक मान केस्थान पर वगर् चिÉों के प्रयोग को सांख्ियकीय विध्ियों में शामिल करने पर पयार्प्त मात्रा में सूचनाओं की क्षति होती है। असमान वगार्ें में बारंबारता वितरण अब तक आप समान वगर् अंतराल के बारंबारता वितरण से परिचित हो चुके हैं। आप जान गए हैं कि इन्हेंअपरिष्कृत आँकड़ों से वैफसे गठित किया जाता है। लेकिन वुफछ मामलों में असमान वगर् अंतराल के साथ बारंबारता वितरण अध्िक उपयुक्त होता है। यदि आप उदाहरण 4 के बारंबारता वितरण की सारणी 3.6 को देखें तो आप पायेंगे कि अध्िकांश प्रेक्षण वगर् 40μ50, 50μ60 तथा 60μ70 में संवेंफदि्रत हैं। उनकी बारंबारताएँ क्रमशः 21, 23 एवं 19 हैं। इसका अथर् है कि 100 प्रेक्षणों में से 63 ;21 $ 23 $ 19द्ध प्रेक्षण इन वगार्ें में सवेंफदि्रत हैं। यह वगर् प्रेक्षणों से सघन रूप से भरा हुआ है। इस प्रकार 63 प्रतिशत आँकड़े 40 और 70 के बीच समाहित है और आँकड़ों का शेष 37 प्रतिशत 0μ10, 10μ20, 20μ30, 30μ40 तथा 70μ80, 80μ90 एवं 90μ100 वगार्ें में हैं। इन वगार्ें में प्रेक्षणों का विरल घनत्व है। आप यह भी देखेंगे कि इन वगार्ें के प्रेक्षणों में अन्य वगार्ें की अपेक्षा उनके अपने वगार्ेंके वगर् - चिÉों से अध्िक विचलन है। लेकिन यदि वगार्ेका गठन इस प्रकार से करना हो कि वगर् चिÉ, जहाँ तक संभव है, उस मान के बराबर हो जाए, जिसकेआस - पास उस वगर् के प्रेक्षणों के संवंेफद्रण की प्रवृिा सारणी 3.6गण्िात में 100 छात्रों के प्राप्तांको के मिलान चिÉ वगर् प्रेक्षण मिलान चिÉ बारंबारता वगर् चिÉ 0μ10 10μ20 20μ30 30μ40 40μ50 0 10, 14, 17, 12, 14, 12, 14, 14 25, 25, 20, 22, 25, 28 30, 37, 34, 39, 32, 30, 35, 47, 42, 49, 49, 45, 45, 47, 44, 40, 44, 49, 46, 41, 40, 43, 48, 48, 49, 49, 40, ///// /// //// / //// // //// //// //// //// / 1 8 6 7 5 15 25 35 41 21 45 50μ60 59, 51, 53, 56, 55, 57, 55, 51, 50, 56, 59, 56, 59, 57, 59, 55, 56, 51, 55, 56, //// //// //// //// /// 60μ70 70μ80 80μ90 90μ100 55, 50, 54 60, 64, 62, 66, 69, 64, 64, 60, 66, 69, 62, 61, 66, 60, 65, 62, 65, 66, 65 70, 75, 70, 76, 70, 71 82, 82, 82, 80, 85 90, 100, 90, 90 //// //// //// //////// / //// 23 19 6 5 4 55 65 75 85 95 योग 100 अथर्शास्त्रा में सांख्ियकी होती है, उस स्िथति में असमान वगर् अंतराल अध्िक उपयुक्त होता है। असमान वगार्ें के रूप में, सारणी 3.7 में सारणी 3.6 के उसी बारंबारता वितरण को दिखाया गया है। 40μ50, 50μ60 तथा 60μ70 के प्रत्येक वगर् को दो भागों में विभाजित किया गया है। वगर् 40μ50 को अब 40μ45 तथा 45μ50 में बाँटा गया है। वगर् 50μ60 को 50μ55 और 55μ60 में बाँटा गया है तथा वगर् 60μ70 को 60μ65 तथा 65μ70 में बाँटा गया है। अब नए वगर् 40μ45, 45μ50, 50μ55, 55μ60, 60μ65 तथा 65μ70 हैं जिनमें वगर् अंतराल 5 है। बाकी अन्य वगार्ें 0μ10, 10μ20, 20μ30, 30μ40, तथा 70μ80, 80μ90, 90μ100 में ठीक वही पूवर्वत वगर् अंतराल 10 है। इस सारणी का अंतिम स्तंभ इनवगार्ें के नये वगर् चिÉों को प्रदश्िार्त कर रहा है। सारणी3.6 के पुराने वगर् चिÉों से उनकी तुलना करें। ध्यान देंकि इन वगार्ें के प्रेक्षणों में नये वगर् चिÉ मानों कीअपेक्षा पुराने वगर् चिÉ मानों से विचलन अध्िक है। इस सारणी 3.7 असमान वगार्ें में बारंबारता वितरण वगर् प्रेक्षण बारंबारता वगर् चिÉ 0μ10 0 1 5 10μ20 10, 14, 17, 12, 14, 12, 14, 14 8 15 20μ30 25, 25, 20, 22, 25, 28 6 25 30μ40 30, 37, 34, 39, 32, 30, 35 7 35 40μ45 42, 44, 40, 44, 41, 40, 43, 40, 41 9 42.5 45μ50 47, 49, 49, 45, 45, 47, 49, 46, 48, 48, 49, 49 12 47.5 50μ55 51, 53, 51, 50, 51, 50, 54 7 52.5 55μ60 59, 56, 55, 57, 55, 56, 59, 56, 59, 57, 59, 55, 56, 55, 56, 55 16 57.5 60μ65 60, 64, 62, 64, 64, 60, 62, 61, 60, 62 10 62.5 65μ70 66, 69, 66, 69, 66, 65, 65, 66, 65 9 67.5 70μ80 70, 75, 70, 76, 70, 71 6 75 80μ90 82, 82, 82, 80, 85 5 85 90μ100 90, 100, 90, 90 4 95 योग 100 प्रकार से नये वगर् चिÉ मान, इन वगार्ें के आँकड़ों का पुराने मान की अपेक्षा बेहतर प्रतिनिध्ित्व करते हैं। चित्रा 3.2 में, सारणी 3.7 के बारंबारता वितरण के बारंबारता वक्र को दिखाया गया है। इसमें सारणी केवगर् चिÉों को ग - अक्ष पर तथा बारंबारताओं को ल - अक्ष पर आलेख्िात किया गया है। बारंबारता सरणी के नाम से जाना जाता है। चूँकि एक विविक्त चर मानों को धरण करता है न कि दो पूणार्कों के बीच माध्यमिक भ्िान्नीय मानों को, अतः हम ऐसी बारंबारता रखते हैं जोकि अपने पूणा±क मानों से संगत हों। सारणी 3.8 में दिया गया उदाहरण बारंबारता सरणी को प्रदश्िार्त करता है। सारणी 3.8 परिवारों के आकार की बारंबारता सरणी परिवार का आकार परिवारों की संख्या 15 2 15 3 25 4 35 5 10 65 73 82 योग 100 चर ‘परिवार का आकार’ एक विविक्त चर है जो सारणी में दिखाए गए पूणार्कों को ही धरण करता है। चूँकि यह दो सन्िनकट पूणार्कों के बीच भ्िान्नीय मान को नहीं लेता है, अतः इस बारंबारता सरणी में वगर् नहीं होते। चूँकि विविक्त बारंबारता वितरण में वगर् नहीं हैं अतः यहाँ पर कोइर् वगर् अंतराल भी नहीं हैं। जैसे कि विविक्त बारंबारता वितरण में वगर् अनुपस्िथत हैं, अतः इनमें वगर् चिन्ह भी नहीं होते। सारणी 3.9 20 कंपनियों की बिक्री ;लाख रु मेंद्ध एवं विज्ञापन व्यय ;हजार रु मेंद्ध का द्विचर बारंबारता वितरण 115μ125 125μ135 135μ145 145μ155 155μ165 165μ175 योग 62μ64 64μ66 66μ68 68μ70 70μ72 2 1 1 1 1 2 1 3 2 1 1 2 1 1 3 4 5 4 4 योग 4 5 6 3 1 1 20 6.द्विचर बारंबारता वितरण एकल चर के बारंबारता वितरण को एक - विचर वितरण कहा जाता है। उदाहरण 3.3 ‘किसी छात्रा के प्राप्तांक’ एकल चर के एक - विचर वितरण को प्रदश्िार्त करता है। जबकि एक द्विचर बारंबारता वितरण दो चरों का बारंबारता वितरण है। सारणी 3.9, 20 कंपनियों के दो चर - बिक्री एवं विज्ञापन व्यय ;लाख रु मेंद्ध के बारंबारता वितरण को प्रदश्िार्त कर रही है। यहाँ पर बिक्री मानों को भ्िान्न स्तंभों में तथा विज्ञापन व्यय के मानों को भ्िान्न पंक्ितयों में वण्िार्त किया गया है। प्रत्येक प्रकोष्ठ संतत पंक्ित एवं स्तंभ के मान की बारंबारता दिखाता है। उदाहरण के लिए यहाँ पर तीन पफमर् ऐसी हैं, जिनकी बिक्री रु 135μ145 लाख रु के बीच है और उनका विज्ञापन व्यय 64μ66 हजार रु के बीच है। अथर्शास्त्रा में सांख्ियकी द्विचर वितरण के बारे में अध्याय 8 ‘सहसंबंध्’ में अध्ययन किया जायगा। 7.सारांश प्राथमिक या द्वितीयक स्रोतों से संगृहीत किए गएआँकड़े अपरिष्कृत या अवगीर्कृत होते हैं। जब एक बार आँकड़े संगृहित हो जाएँ तो अगला चरण आगे के सांख्ियकीय विश्लेषण के लिए आँकड़ों का वगीर्करण करना है। वगीर्करण से आँकड़ों में क्रमब(ता आ जाती है। यह अध्याय आप को यह जानने के योग्य बनाता है कि आँकड़ों को बारंबारता वितरण के माध्यम से बोध्गम्य तरीके से किस प्रकार वगीर्कृत किया जाता है। एक बार जब आप वगीर्करण की तकनीकों को जान जाते हैं तो आपके लिए यह आसान होगा कि आप संतत तथा विविक्त दोनों चरों के लिए ही बारंबारता वितरण की रचना कर सवेंफ। पुनरावतर्न ऽ वगीर्करण अपरिष्कृत आँकड़ों को क्रमब(ता प्रदान करता है। ऽ बारंबारता वितरण यह प्रदश्िार्त करता है कि किसी चर के विभ्िान्न मान, संगत वगर् - बारंबारताओं सहित, किस प्रकार विभ्िान्न वगार्ें में वितरित किए जाते हैं। ऽ अपवजीर् विध्ि के अंतगर्त उच्च वगर् सीमा को छोड़ा तथा निम्नवगर् सीमा को शामिल किया जाता है। ऽ समावेशी विध्ि में निम्नवगर् सीमा तथा उच्च वगर् सीमा, दोनों को ही शामिल किया जाता है। ऽ बारंबारता वितरण में, आगे के सांख्ियकीय परिकलन केवल वगर् चिÉ मान पर आधरित होते हैं, न कि प्रेक्षणों के मान पर। ऽ वगार्ें को इस प्रकार से बनाया जाना चाहिए कि, जहाँ तक संभव हो सके, प्रत्येक वगर् कावगर् चिÉ उस मान के अध्िक से अध्िक निकटतम हो, जिस मान के आस - पास, किसी वगर्के प्रेक्षणों की संकेन्द्रण की प्रवृिा हो। अभ्यास 1.निम्नलिख्िात में से कौन सा विकल्प सही है? ऽ एक वगर् मध्यबिन्दु बराबर हैः ;कद्ध उच्च वगर् सीमा तथा निम्न वगर् सीमा के औसत के। ;खद्ध उच्च वगर् सीमा तथा निम्न वगर् सीमा के गुणनपफल के। ;गद्ध उच्च वगर् सीमा तथा निम्न वगर् सीमा के अनुपात के। ;घद्ध उपरोक्त में से कोइर् नहीं। ऽ दो चरों के बारंबारता वितरण को इस नाम से जानते हैंः ;कद्ध एक विचर वितरण ;खद्ध द्विचर वितरण ;गद्ध बहुचर वितरण ;घद्ध उपरोक्त मेें से कोइर् नहीं ऽ वगीर्कृत आँकड़ों में साँख्ियकीय परिकलन आधरित होता हैः ;कद्ध प्रेक्षणों के वास्तविक मानों पर ;खद्ध उच्च वगर् सीमाओं पर ;गद्ध निम्न वगर् सीमाओं पर ;घद्ध वगर् के मध्यबिन्दुओं पर ऽ अपवजीर् विध्ि के अंतगर्त ;कद्ध किसी वगर् की उच्च वगर् सीमा को वगर् अंतराल में समावेश्िात नहीं करते। ;खद्ध किसी वगर् की उच्च वगर् सीमा को वगर् अंतराल में समावेश्िात करते हैं। ;गद्ध किसी वगर् की निम्न वगर् सीमा को वगर् अंतराल में समावेश्िात नहीं करते। ;घद्ध किसी वगर् की निम्न वगर् सीमा को वगर् अंतराल में समावेश्िात करते हैं। ऽ परास का अथर् है ;कद्ध अध्िकतम एवं न्यूनतम प्रेक्षणों के बीच अंतर ;खद्ध न्यूनतम एवं अध्िकतम प्रेक्षणों के बीच अंतर ;गद्ध अध्िकतम एवं न्यूनतम प्रेक्षणों का औसत ;घद्ध अध्िकतम एवं न्यूनतम प्रेक्षणों का अनुपात 2.वस्तुओं को वगीर्कृत करने में क्या कोइर् लाभ हो सकता है? अपने दैनिक जीवन से एक उदाहरण देकर व्याख्या कीजिए। 3.चर क्या है? एक संतत तथा विविक्त चर के बीच भेद कीजिए। 4.आँकड़ों के वगीर्करण में प्रयुक्त अपवजीर् तथा समावेशी विध्ियों की व्याख्या कीजिए। 5.सारणी 3.2 के आँकड़ों का प्रयोग करें, जो 50 परिवारों के भोजन पर मासिक व्यय ;रु मेंद्ध को दिखलाती हैै, और ;कद्ध भोजन पर मासिक परिवारिक व्यय का प्रसार ज्ञात कीजिए। ;खद्ध परास को वगर् अंतराल की उचित संख्याओं में विभाजित करें तथा व्यय का बारंबारता वितरण प्राप्त करें। ऽ उन परिवारों की संख्या पता कीजिए जिनका भोजन पर मासिक व्यय ;कद्ध 2000/ - रु से कम है ;खद्ध 3000/ - रु से अध्िक है ;गद्ध 1500/ - रु और 2500/ - रु के बीच है 6.एक शहर में, यह जानने हेतु 45 परिवारों का सवर्ेक्षण किया गया कि वे अपने घरों में कितनी संख्या मेंघरेलू उपकरणों का इस्तेमाल करते हैं। नीचे दिए गए उनके उत्तरों के आधर पर एक बारंबारता सरणी तैयार कीजिए। 132222121223333 332322616215153 242742434203143 7.वगीर्कृत आँकड़ों में ‘सूचना की क्षति’ का क्या अथर् है? 8.क्या आप इस बात से सहमत है कि अपरिष्कृत आँकड़ों की अपेक्षा वगीर्कृत आँकड़े बेहतर होते हैं? 9.एक - विचर एवं द्विचर बारंबारता वितरण के बीच अंतर बताइए? 10.निम्नलिख्िात आँकडों के आधर पर 7 का वगर् अंतराल लेकर समावेशी विध्ि द्वारा एक बारंबारता वितरण तैयार कीजिए। 28 17 15 22 29 21 23 27 18 12 7 2 9 4 6 1 8 3 10 5 20 16 12 8 4 33 27 21 15 9 3 36 27 18 9 2 4 6 32 31 29 18 14 13 15 11 9 7 1 5 37 32 28 26 24 20 19 25 19 20

>Organisation_of_Data_Ch.-3_(Ver-2)>

अध्याय - 3


आँकड़ों का संगठन



इस अध्याय को पढ़ने के बाद आप इस योग्य होंगे किः

आगे के सांख्यिकीय विश्लेषण के लिए आँकड़ों का वर्गीकरण कर सकें;

मात्रात्मक एवं गुणात्मक वर्गीकरण के बीच अंतर कर सकें;

बारंबारता वितरण सारणी तैयार कर सकें;

वर्गाें के निर्माण की तकनीक जान सकें;

मिलान-चिह्न की विधि से परिचित हो सकें;

एकचर तथा द्विचर बारंबारता वितरण के बीच अंतर कर सकें।


1. प्रस्तावना

पिछले अध्याय में आपने पढ़ा कि आँकड़ों का संग्रहण कैसे करते हैं। साथ ही, आप जनगणना एवं प्रतिचयन के बीच अंतर को भी जान चुके हैं। इस अध्याय में आप यह सीखेंगे कि जो आँकड़ें आपने संगृहीत किए थे, उन्हें कैसे वर्गीकृत करते हैं। अपरिष्कृत आँकड़ों को वर्गीकृत करने का उद्देश्य उन्हें व्यवस्थित करना है, ताकि उन्हें आसानी से आगे के सांख्यिकीय विशलेषण के योग्य बनाया जा सके।

क्या आपने कभी स्थानीय कबाड़ी वाले या रद्दी सामान खरीदने वाले को देखा है, जिसे आप अपना पुराना अखबार, टूटे-फूटे घरेलू सामान, खाली-काँच की बोतलें, प्लास्टिक आदि बेचते हैं। वह आपसे इन चीजों को खरीदता है और उन लोगों को बेच देता है जो इनका पुनः चक्रण करते हैं। लेकिन अपनी दुकान में अधिक कबाड़ के इकट्ठे होने से उसे अपना व्यापार चलाने में मुश्किल हो सकती है, अगर वह इन्हें उचित ढंग से व्यवस्थित न करे। वह इस स्थिति को सरल बनाने के लिए विभिन्न कबाड़ों को उपयुक्त समूह में रखता है, अर्थात् उन्हें वर्गीकृत करता है। वह पुराने अखबारों को एक साथ रस्सी से बाँध कर रखता है। इसके बाद सभी खाली काँच की बोतलों को एक बोरे में रखता है। वह धातु के सामानों का एक ढेर अपनी दुकान के एक कोने में लगाता है और फिर उनको ‘लोहा’, ‘पीतल’, ‘ताँबा’, ‘एल्यूमिनियम’ आदि वर्गाें में छाँट कर रखता है। इस प्रकार से वह अपने कबाड़ को भिन्न वर्गाें - ‘अखबार’, ‘प्लास्टिक’, ‘काँच’, ‘धातु’ आदि में विभाजित कर उन्हें व्यवस्थित करता है। जब एक बार उसका सारा कबाड़ व्यवस्थित एवं वर्गीकृत हो जाता है, तब खरीददार की माँग पर, उसे सामग्री विशेष को खोजकर देने में आसानी हो जाती है।

ठीक इसी प्रकार से, जब आप अपने विद्यालय की पुस्तकों को एक विशेष क्रम में रखते हैं, तो उनको संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं, जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। उदाहरणार्थ, जब आपको इतिहास की कोई विशेष पुस्तक की आवश्यकता पड़ती है तो आप को केवल यह करना है कि ‘इतिहास’ समूह में उस पुस्तक को खोजें। अन्यथा आप को अपनी यह विशेष पुस्तक सारी पुस्तकों के ढेर में खोजनी पड़ेगी।

यद्यपि पदार्थाें अथवा वस्तुओं का वर्गीकरण बहुमूल्य श्रम और समय को बचाता है, इसे मनमाने तरीके से नहीं किया जाता है। कबाड़ी वाले ने अपने कबाड़ को इस तरह से समूहों में रखा कि प्रत्येक समूह में एक ही प्रकार की चीजें हों। उदाहरण के लिए, उसने ‘काँच’ के समूह में खाली काँच की बोतलें, टूटे खिड़की के काँच तथा टूटे दर्पण आदि रखे। ठीक इसी तरह से जब आपने अपनी इतिहास की पुस्तक को ‘इतिहास’ समूह में वर्गीकृत किया, तो आप उसमें अन्य विषयों की पुस्तकें नहीं रखेंगे। अन्यथा समूह-गठन का पूरा उद्देश्य ही निरर्थक हो जाएगा। इसलिए, वर्गीकरण का तात्पर्य एक वस्तुओं को समूह या वर्गाें में किसी खास आधार पर वर्गीकृत या व्यवस्थित करने से है।


क्रियात्मक गतिविधि

  •  अपने स्थानीय डाकघर जायें और देखें कि पत्रों कि छँटाई कैसे की जाती है। क्या आप जानते हैं कि पत्र में पिन कोड का क्या अर्थ है। अपने डाकिए से पूछें।  


2. अपरिष्कृत आँकड़े

कबाड़ीवाले के कबाड़ की भाँति, अवर्गीकृत आँकड़े अथवा अपरिष्कृत आँकड़े भी अत्यधिक अव्यवस्थित होते हैं। ये प्रायः अति विशाल होते हैं, जिन्हें संभालना कठिन होता है। इनसे सार्थक निष्कर्ष निकालना श्रमसाध्य कार्य है, क्योंकि सांख्यिकीय विधियों का इन पर सरलता से प्रयोग नहीं किया जा सकता। इसलिए इस प्रकार के आँकड़ों का उचित संगठन तथा प्रस्तुतीकरण आवश्यक होता है, ताकि व्यवस्थित रूप से साँख्यिकीय विश्लेषण किया जा सके। अतः आँकड़ों के संग्रह के पश्चात् अगला चरण उन्हें संगठित कर वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए, कि आप गणित में छात्रों की प्रगति जानना चाहते हैं और आपने अपने स्कूल के 100 छात्रों के गणित के अंकों के आँकड़े एकत्रित कर लिये हैं। अगर आप इन्हें एक सारणी में प्रस्तुत करते हैं तो वे संभवतः सारणी 3.1 जैसे प्रतीत हो सकते हैं।

सारणी 3.1

किसी परीक्षा में 100 छात्रोंद्वारा गणित में प्राप्त अंक

47

45

10

60

51

56

66

100

49

40

60

59

56

55

62

48

59

55

51

41

42

69

64

66

50

59

57

65

62

50

64

30

37

75

17

56

20

14

55

90

62

51

55

14

25

34

90

49

56

54

70

47

49

82

40

82

60

85

65

66

49

44

64

69

70

48

12

28

55

65

49

40

25

41

71

80

0

56

14

22

66

53

46

70

43

61

59

12

30

35

45

44

57

76

82

39

32

14

90

25

या फिर आप अपने पड़ोस के 50 परिवारों से, भोजन पर उनके मासिक व्यय के आँकड़ों का संग्रह यह जानने के लिए करते हैं कि भोजन पर उनका औसत व्यय कितना है। इस मामले में संगृहीत आँकड़ों को जब आप सारणी में प्रस्तुत करते हैं, तो वे सारणी 3.2 की तरह दिख सकते हैं। सारणी 3.1 तथा सारणी 3.2, दोनों ही आँकड़े अपरिष्कृत अथवा अवर्गीकृत हैं। दोनों ही सारणियों में संख्याओं को किसी भी क्रम में व्यवस्थित नहीं किया गया है। अब अगर आपसे यह पूछा जाए कि सारणी 3.1 में गणित में सर्वाेच्च अंक कितने हैं, तब आपको 100 छात्रों के अंकों को आरोही या अवरोही क्रम में व्यवस्थित करना होगा। यह एक बेहद थका देने वाला काम है। यदि आपको 100 छात्रों के स्थान पर 1000 छात्रों के अंक संभालने हों तो यह और भी अधिक थकानेवाला होगा।


सारणी 3.2

खाद्य पर 50 परिवारों के मासिकपारिवारिक व्यय (रु में)

1904

1559

3473

1735

2760

2041

1612

1753

1855

4439

5090

1085

1823

2346

1523

1211

1360

1110

3153

1183

1218

1315

1105

2628

2712

4248

1812

1264

1183

1171

1007

1180

1953

1137

2048

2025

1583

1324

2621

3676

1397

1832

1962

2177

2575

1293

1365

1146

3222

1396

ठीक इसी प्रकार से, सारणी 3.2 में आपके लिए काफी मुश्किल होगा कि 50 परिवारों के खाने पर मासिक व्यय के औसत को पता कर सकें। यही कठिनाई तब कई गुना बढ़ जाएगी यदि यह संख्या बहुत बड़ी हो, जैसे 5000 परिवार। ठीक कबाड़ीवाले की भाँति ही (जब कबाड़ का ढेर बहुत बड़ा और अव्यवस्थित हो तो उसे एक विशेष वस्तु को ढूँढ़ने में बहुत कठिनाई होती है) आपकी भी स्थिति होगी, यदि अपरिष्कृत आँकड़ों का भंडार बहुत बड़ा हो और आप उससे कोई सूचना प्राप्त करना चाहें। इसलिए, संक्षेप में अवर्गीकृत विशाल आँकड़ों से कोई सूचना प्राप्त करना एक बेहद थका देने वाला एवं उबाऊ काम है।

वर्गीकरण के द्वारा अपरिष्कृत आँकड़ों को संक्षिप्त एवं बोधगम्य बनाया जाता है। जब एक प्रकार की विशेषताओं वाले तथ्यों को एक ही वर्ग में रखा जाता है तो वे बिना किसी कठिनाई के ढूँढ़ने, तुलना करने तथा निष्कर्ष निकालने योग्य हो जाते हैं। आपने अध्याय 2 में पढ़ा है कि प्रति दस साल बाद भारत सरकार जनसंख्या की गणना कराती है। सन् 2001 की जनगणना में लगभग 20 करोड़ लोगों से संपर्क किया गया। जनगणना के अपरिष्कृत आँकड़े बहुत विशाल एवं विखंडित होते हैं। उन से कोई भी अर्थपूर्ण निष्कर्ष निकालना असंभव कार्य लगता है। लेकिन जनगणना के यही आँकड़े जब लिंग, शिक्षा, वैवाहिक स्थिति, पेशे आदि के अनुसार वर्गीकृत किये जाते हैं तब भारत की जनसंख्या की प्रकृति एवं संरचना आसानी से समझ में आ जाती है।

अपरिष्कृत आँकड़े चरों के प्रेक्षणों से बने होते हैं। सारणी 3.1 तथा 3.2 में दिए गए अपरिष्कृत आँकड़े विशेष या चर समूह पर किए गए प्रेक्षणों को प्रदर्शित करते हैं। उदाहरण के लिए सारणी 3.1 को देखें जिसमें 100 छात्रों द्वारा गणित में प्राप्त किए गए अंकों को दर्शाया गया है। इन अंकों से हम कैसे अर्थ निकाल सकते हैं? गणित के शिक्षक इन अंकों को देखकर सोच रहे होंगे - मेरे छात्रों ने कैसा किया? कितने असफल रहे? आँकड़ों का वर्गीकरण हमारे उद्देश्यों पर निर्भर करता है इस स्थिति में, शिक्षक गहनतापूर्वक समझने की कोशिश करेंगे - छात्रों ने कैसा किया? संभवतया वह बारंबारता वितरण बनाने का चयन करे। इस पर अगले भाग में विवेचना की जायेगी।


क्रियात्मक गतिविधि

आप अपने परिवार के एक वर्ष के साप्ताहिक व्यय के आँकड़े संगृहीत कीजिए और उसे एक सारणी में व्यवस्थित कीजिए। देखिए कि उसमें कितने प्रेक्षण हैं। आँकड़ों को मासिक आधार पर व्यवस्थित कीजिए और देखिए कि अब कितने प्रेक्षण हैं।


3.आँकड़ों का वर्गीकरण

किसी वर्गीकरण के वर्ग या समूह कई तरीकों से बनाए जा सकते हैं। आप अपनी पुस्तकों को विषयों-‘इतिहास’, ‘भूगोल’, ‘गणित’, ‘विज्ञान’ आदि में वर्गीकृत करने के स्थान पर इन्हें वर्णमाला के क्रम में लेखकों के आधार पर वर्गीकृत कर सकते हैं। अथवा, आप इन्हें प्रकाशन- वर्ष के आधार पर भी वर्गीकृत कर सकते हैं। आप उन्हें किस प्रकार से वर्गीकृत करना चाहते हैं, यह आपकी आवश्यकता पर निर्भर करेगा।

ठीक इसी प्रकार से, अपरिष्कृत आँकड़ों को भी विभिन्न तरीकों से वर्गीकृत किया जा सकता है जो आपके अध्ययन के उद्देश्य पर निर्भर करता है। उन्हें समय के अनुसार समूहित किया जा सकता है। इस प्रकार के वर्गीकरण कोकालानुक्रमिक वर्गीकरण कहते हैं। इस प्रकार के वर्गीकरण में, आँकड़ों को समय के संदर्भ-जैसे वर्ष, तिमाही, मासिक या साप्ताहिक आदि के रूप में, आरोही या अवरोही क्रम में वर्गीकृत किया जा सकता है। निम्नलिखित उदाहरण वर्षों के आधार पर भारत की जनसंख्या के वर्गीकरण को दिखाता है। चर ‘जनसंख्या’ एककाल-श्रेणी है, क्योंकि इसमें विभिन्न वर्षाें के मानों की एक श्रेणी चित्रित की गई है।


उदाहरण 1

भारत की जनसंख्या (करोड़ में)

वर्ष

जनसंख्या (करोड़ में)

1951

35.7

1961

43.8

1971

54.6

1981

68.4

1991

81.8

2001

102.7

2011

121.0


स्थानिक वर्गीकरण के अंतर्गत आँकड़ों का वर्गीकरण भौगोलिक स्थितियों जैसे कि देश, राज्य, शहर, जिला, कस्बा आदि के संदर्भानुसार होता है। उदाहरण 2 में विभिन्न देशों में गेहूँ की उपज दिखाई गई है।

उदाहरण 2

विभिन्न देशों मेंगेहूँ की उपज (2013)

देश

गेहूँ की उपज (किग्रा/एकड़)

कनाडा

3594

चीन

5055

फ्रांस

7254

जर्मनी

7998

भारत

3154

पाकिस्तान

2787

स्रोतः कृषि आँकड़े, भारत सरकार, 2015



क्रियात्मक गतिविधियाँ

उदाहरण 1 में, उस वर्ष को बताएँ जिसमें भारत की जनसंख्या न्यूनतम और अधिकतम है।

उदाहरण 2 में, उस देश का पता लगाइये, जिसकी गेहूँ की उपज भारत से थोड़ी अधिक है। यह प्रतिशत में कितनी होगी?

उदाहरण दो में दिए गए देशों को गेहूँ की उपज के आरोही क्रम में रखिये। ठीक यही अभ्यास उपज को अवरोही क्रम में रखते हुए कीजिए।


कई बार आपका सामना एेसी विशेषताओं से होता है, जिन्हें मात्रात्मक रूप में व्यक्त नहीं किया जा सकता है। इस प्रकार की विशेषताओं को ‘गुण’ कहते हैं। उदाहरण के लिए-राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता है। इन गुणों को गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत कर सकते हैं। विशेषताओं पर आधारित आँकड़ों के एेसे वर्गीकरण को गुणात्मक वर्गीकरण कहा जाता है। निम्नलिखित उदाहरण में हम किसी देश की जनसंख्या को गुणात्मक चर ‘लिंग’ के आधार पर समूहित किया हुआ पाते हैं। इसमें प्रेक्षण स्त्री या पुरुष हो सकता है। इन दो विशेषताओं को आगे वैवाहिक स्थिति के आधार पर वर्गीकृत किया जा सकता है, जैसा कि नीचे दिया गया है

उदाहरण 3

जनसंख्या ⇒

पुरुष → विवाहित  , अविवाहित 

स्त्री → विवाहित  , , अविवाहित


प्रथम चरण में यह वर्गीकरण पहले विशेषता की उपस्थिति या अनुपस्थिति पर आधारित है जैसे कि ‘पुरुष’ या ‘पुरुष नहीं’ (स्त्री) है। दूसरे चरण में, प्रत्येक वर्ग ‘स्त्री’ या ‘पुरुष’ आगे दूसरी विशेषता की उपस्थिति या अनुपस्थिति के आधार पर विभाजित है, जैसे विवाहित या अविवाहित। ऊँचाई, भार, आयु, आय, छात्रों के अंक आदि विशेषताओं की प्रकृति मात्रात्मक है। जब एेसी विशिष्टताओं के संगृहीत आँकड़ों को वर्गाे में समूहित किया जाता है तो यह वर्गीकरण मात्रात्मक वर्गीकरण कहलाता है।


क्रियात्मक गतिविधियाँ 

• आस-पास की वस्तुओं को सजीव या निर्जीव के रूप में समूहित किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?


उदाहरण 4

100 छात्रों के गणित केप्राप्तांकों का बारंबारता वितरण

अंक

बारंबारता

0-10

1

10-20

8

20-30

6

30-40

7

40-50

21

50-60

23

60-70

19

70-80

6

80-90

5

90-100

4

योग

100

उदाहरण 4 में 100 छात्रों के गणित के प्राप्तांकों का मात्रात्मक वर्गीकरण दिखाया गया है, जिन्हें सारणी 3.1 में बारंबारता वितरण के रूप में दिया गया है।


क्रियात्मक गतिविधियाँ

उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात में या प्रतिशत में प्रकट कीजिए। ध्यान रहे कि इस प्रकार से प्रकट की गई बारंबारता को सापेक्षिक बारंबारता के रूप में जाना जाता है।

उदाहरण 4 में किस वर्ग के अंतर्गत आँकड़ों का अधिकतम संकेंद्रण है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में प्रकट कीजिए। किस वर्ग में आँकड़ों का न्यूनतम संकेंद्रण है?


4.चरः संतत और विविक्त

चर की सरल परिभाषा, जिसका आपने पिछले अध्याय में अध्ययन किया था, यह नहीं बतलाती कि यह कैसे परिवर्तित होता है। चरों में अंतर विशेष वर्गीकरण के आधार पर होता है इन्हें सामान्यतः दो वर्गाें में वर्गीकृत किया जाता हैः

(क) संतत तथा

(ख) विविक्त

संतत चर का कोई भी संख्यात्मक मान हो सकता है। यह पूर्णांक मान (1, 2, 3, 4 ...), भिन्नात्मक मान (1/2, 2/3, 3/4), तथा वे मान जो यथातथ भिन्न नहीं हैं ( = 1.414, = 1.732, ..., = 2.645) हो सकते हैं। उदाहरण के लिए, मान लिजिए कि एक छात्र का कद 90–150 सेमी तक बढ़ता है, तो उसके कद के मान इसके बीच आने वाले सभी मान हो सकते हैं। यह संपूर्ण संख्या वाले मान को भी प्रकट कर सकता है, जैसे कि 90 सेमी, 100 सेमी, 108 सेमी, 150 सेमी। इसके साथ ही यह भिन्नात्मक मान जैसे 90.85 सेमी, 102.34 सेमी, 149.99 सेमी आदि भी हो सकते हैं, जो पूर्णांक नहीं हैं। इस प्रकार ‘ऊँचाई’ चर किसी भी कल्पित मान को अभिव्यक्त करने में सक्षम है और इसके मानों को अनन्त श्रेणियों में बाँटा जा सकता है। संतत चर के अन्य उदाहरण भार, समय तथा दूरी आदि हैं।

संतत चर के विपरीत विविक्त चर केवल निश्चित मान हो सकते हैं। इसके मान केवल परिमित ‘उछाल’ से बदलते हैं। यह उछाल एक मान से दूसरे मान के बीच होते हैं, परंतु इसके बीच में कोई मान नहीं आता है। उदाहरण के लिए, कोई चर जैसे ‘किसी कक्षा में छात्रों की संख्या’, भिन्न वर्गाें के लिए उन मानों की कल्पना करता है, जिसमें केवल पूर्ण संख्याएँ हों। यह कोई भी भिन्नात्मक मान जैसे 0.5 नहीं हो सकता, क्योंकि ‘एक छात्र का आधा’ निरर्थक है। इस प्रकार से इसमें 25 एवं 26 के बीच का मान 25.5 नहीं हो सकता है। इसकी अपेक्षा इसका मान या तो 25 होगा या फिर 26। हम देखते हैं कि जब इसका मान 25 से 26 में बदलता है, तो इन दोनों के बीच के भिन्नों को इसमें नहीं लिया जाता है। लेकिन एेसा नहीं सोचना चाहिए कि किसी विविक्त चर का मान भिन्न में नहीं हो सकता। मान लीजिए कि x एक चर है जिसमें 1/8, 1/16, 1/32, 1/64 ..., जैसे मान हैं तो क्या यह एक विविक्त चर है? हाँ, क्योंकि यद्यपि x के मान भिन्नों में हो सकते हैं, तथापि ये दो सन्निकट भिन्नों के बीच नहीं हो सकते। यह 1/8 से 1/16 में और फिर 1/16 से 1/32 में ‘बदलता’ है, परंतु 1/8 से 1/16 के बीच या 1/16 से 1/32 के बीच के मान नहीं ले सकता।


क्रियात्मक गतिविधि

निम्नलिखित चरों का संतत तथा विविक्त में वर्गीकरण करेंः

क्षेत्रफल, आयतन, ताप, पाँसे पर आने वाली संख्या, फसल-उपज, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।


हमने पहले यह बताया है कि उदाहरण 4 में 100 छात्रों के गणित में प्राप्तांक का बारंबारता वितरण दिया गया है, जैसा कि सारणी 3.1 में दिखाया गया है। यह दिखाता है कि 100 छात्रों के अंकों को वर्गाें में कैसे समूहित किया गया है। आपको आश्चर्य होगा कि हमने सारणी 3.1 के अपरिष्कृत आँकड़ों से इसे कैसे प्राप्त किया। लेकिन इस प्रश्न का समाधान प्रस्तुत करने से पहले आपका यह जानना आवश्यक है कि बारंबारता वितरण क्या होता है।


5.बारंबारता वितरण क्या है?

बारंबारता वितरण अपरिष्कृत आँकड़ों को एक मात्रात्मक चर में वर्गीकृत करने का एक सामान्य तरीका है। यह दिखाता है कि किसी चर के भिन्न मान (यहाँ छात्र द्वारा गणित में प्राप्तांक) विभिन्न वर्गाें में, अपने अनुरूप वर्गाें की बारंबारताओं के साथ कैसे वितरित किए जाते हैं। इस उदाहरण में हमारे पास प्राप्तांकों के 10 वर्ग हैं। 0–10, 10–20, ...... 90–100। वर्ग-बारंबारता पद का अर्थ है एक विशेष वर्ग में मानों की संख्या। उदाहरण के लिए वर्ग 30–40 में सारणी 3.1 में प्राप्तांकों के 7 मान हैं। ये 30, 37, 34, 30, 35, 39, 32 हैं। इस प्रकार से वर्ग 30–40 की बारंबारता 7 हुई। पर शायद आपको आश्यर्च हो कि 40 का अंक जो अपरिष्कृत आँकड़ों में दो बार आया है, उसे 30–40 वर्ग में शामिल क्यों नहीं किया गया? अगर इसे 30–40 वर्ग की बारंबारता में शामिल किया जाता, तो ये 7 की अपेक्षा 9 होते। यह पहेली तब स्पष्ट हो जाएगी, जब आप इस अध्याय को पर्याप्त धैर्य के साथ सावधानी पूर्वक पढ़ेंगे। इसलिए पढ़ना जारी रखें। आपको स्वयं ही इसका उत्तर प्राप्त हो जाएगा।

बारंबारता वितरण सारणी में प्रत्येक वर्ग, वर्ग सीमाओं द्वारा घिरा होता है। वर्ग में ये सीमाएँ दो छोरों पर होती हैं। इसमें न्यूनतम मान को निम्नवर्ग सीमा तथा उच्चतम मान को उच्च वर्ग सीमा कहते हैं। उदाहरण के लिए वर्ग 60–70 में वर्ग सीमाएँ 60 एवं 70 हैं। इसकी निम्न वर्ग सीमा 60 और उच्च वर्ग सीमा 70 है। वर्ग मध्यांतर या अंतराल या वर्ग विस्तार उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के बीच का अंतर है। वर्ग 60–70 के लिए वर्ग अंतराल 10 है, (उच्च वर्ग सीमा में से निम्न वर्ग सीमा को घटाकर)।

वर्ग मध्यबिन्दु अथवा वर्ग चिह्न किसी वर्ग का मध्य-मान है। यह वर्ग की निम्न वर्ग सीमा तथा उच्च वर्ग सीमा के बीच होता है। इसे निम्नलिखित तरीके से पता किया जा सकता हैः

वर्ग मध्य बिन्दु या वर्ग चिह्न = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 ... ... ... ... ... ... ... ... ... (1)

प्रत्येक वर्ग का वर्ग चिह्न या वर्ग मध्य-बिन्दु एक वर्ग के प्रतिनिधित्व के लिए प्रयुक्त किया जाता है। एक बार जब अपरिष्कृत आँकड़ों को वर्गों में समूहित कर दिया जाता है, तब आगे की गणनाओं में व्यष्टि प्रेक्षणों का प्रयोग नहीं किए जाता है बल्कि इसकी जगह वर्ग चिह्न प्रयुक्त किया जाता है।

सारणी 3.3

निम्न वर्ग सीमा, उच्च वर्ग सीमा तथा वर्ग चिह्न

वर्ग

बारंबारता

निम्नवर्ग सीमा

उच्चवर्ग सीमा

वर्ग चिह्न

0-10

1

0

10

5

10-20

8

10

20

15

20-30

6

20

30

25

30-40

7

30

40

35

40-50

21

40

50

45

50-60

23

50

60

55

60-70

19

60

70

65

70-80

6

70

80

75

80-90

5

80

90

85

90-100

4

90

100

95


बारंबारता वक्र किसी बारंबारता वितरण का आलेखीय प्रस्तुतीकरण है। चित्र 3.1 के अंतर्गत उपरोक्त उदाहरण में दिए गए आँकड़ों का आरेखी प्रस्तुतीकरण दिया गया है। बारंबारता वक्र प्राप्त करने के लिए, हम वर्ग चिह्न को एक्स (x) अक्ष पर तथा बारंबारता को वाई (y) अक्ष पर आलेखित करते हैं।

चित्र 3.1 आँकड़ों के बारंबारता वितरण का आरेखी प्रस्तुतीकरण।


बारंबारता वितरण कैसे तैयार करें?

बारंबारता वितरण तैयार करते समय हमें निम्न पाँच प्रश्नों की व्याख्या पर ध्यान देने की आवश्यकता हैः

1. वर्ग अंतराल समान आकार के हों या असमान आकार के?

2. हमें कितने वर्ग रखने चाहिए?

3. प्रत्येक वर्ग का आकार क्या हो?

4. वर्ग सीमाओं का निर्धारण कैसे किया जाय?

5. प्रत्येक वर्ग के लिए बारंबारता कैसे प्राप्त की जाय?


वर्ग अंतराल, समान अंतराल केहों या असमान अंतराल के?

दो परिस्थितियों में असमान आकार के वर्ग अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय तथा एेसे ही चरों के आँकड़े हों, जहाँ परास काफी अधिक होता है। उदाहरण के लिए, दैनिक आय लगभग शून्य से लेकर कई सौ करोड़ रुपये तक हो सकती है। एेसी स्थिति में, समान वर्ग अंतराल उपयुक्त नहीं है, क्योंकि (i) यदि वर्ग अंतराल छोटे तथा समान आकार के होंगे, तो वर्गों की संख्या बहुत अधिक हो जाएगी। (ii) यदि वर्ग अंतराल अधिक है, तो आय के बहुत कम या बहुत अधिक स्तरों पर जानकारी छिपी हुई रह जाएगी।

दूसरी, यदि मानों की एक बहुत बड़ी संख्या परास के एक छोटे से भाग में केंद्रित होती है, तो समान वर्ग अंतराल से कई मानों की सूचना प्राप्त नहीं हो पाएगी।

अन्य सभी स्थितियों में, आवृत्ति-वितरण में समान आकार के वर्ग अंतरालों का प्रयोग होता है।

वर्गों की संख्या कितनी होनी चाहिए?

वर्गों की संख्या सामान्यतः 6 तथा 15 के बीच होती है। यदि हमारे वर्ग अंतराल समान आकार के हों, तो वर्गों की संख्या, परास (चर के अधिकतम तथा न्यूनतम मान में अंतर) को वर्ग अंतराल से भाग देने पर प्राप्त की जा सकती है।


क्रियात्मक गतिविधियाँ 

निम्नलिखित का परास ज्ञात करेंः

उदाहरण 1 में भारत की जनसंख्या।

उदाहरण 2 में गेहूँ की उपज।


प्रत्येक वर्ग का आकारक्या होना चाहिए?

इस प्रश्न का उत्तर पहले के प्रश्न के उत्तर पर निर्भर करता है। समीकरण (2) प्रकट करती है कि एक बार वर्ग अंतराल को तय करने पर चर के दिए गए परास से हम वर्गाें की संख्या निर्धारित कर सकते हैं। ठीक इसी प्रकार से हम वर्ग अंतराल निर्धारित कर सकते हैं, जब एक बार हम वर्गाें की संख्या तय कर लेते हैं। इस तरह हम पाते हैं कि ये दोनों निर्णय एक दूसरे से जुड़े हुए हैं। पहले का निर्णय लिए बिना हम दूसरे पर निर्णय नहीं ले सकते।

उदाहरण 4 में, हमारे पास वर्गाें की संख्या 10 है तथा परास का दिया गया मान 100 है, तब वर्ग-अंतराल स्वतः ही (समानता 2 के द्वारा) 10 है। ध्यान दें कि वर्तमान संदर्भ में हमने वह वर्ग अंतराल चुना है, जिनका परिमाण समान है। तथापि हम एेसा वर्ग अंतराल चुन सकते हैं जिसका परिमाण समान न हो, तब एेसे मामले में वर्गाें की चौड़ाई असमान होगी।

हमें वर्ग सीमाएँ कैसेनिर्धारित करनी चाहिए?

वर्ग सीमाएँ निश्चित तथा स्पष्ट रूप से होनी चाहिए। सामान्ययतः मुक्तोत्तर वर्ग, जैसे– ‘70 तथा अधिक’ या ‘10 से कम’ वांछनीय नहीं होते। निम्न तथा उच्च वर्ग सीमाओं का निर्धारण इस प्रकार से किया जाना चाहिए कि प्रत्येक वर्ग की आवृत्तियों की प्रवृत्ति वर्ग अंतराल के मध्य में संकेंद्रण की हो। वर्ग अंतराल दो प्रकार के होते हैं-

1. समावेशी वर्ग अंतरालः इस स्थिति में, वर्ग की निम्न तथा उच्च सीमाओं के मूल्य वाले मानों को उस वर्ग की आवृत्ति में शामिल किया जाता है।

2. अपवर्जी वर्ग अंतरालः इस स्थिति में, वर्ग की निम्न तथा उच्च सीमाओं के मूल्य वाली मदों को उस वर्ग की आवृत्ति में शामिल नहीं किया जाता।

असतत चरों की स्थिति में, अपवर्जी तथा समावेशी, दोनों प्रकार के वर्ग अंतरालों का प्रयोग किया जा सकता है।

सतत चरों की स्थिति मेें, समावेशी वर्ग अंतरालों का प्रयोग बहुधा किया जाता है।

उदाहरण

मान लीजिए, हमारे पास एक परीक्षा में विद्यार्थियों द्वारा प्राप्तांकों के आँकड़े हैं तथा सभी प्राप्तांक पूर्णांक हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए, विद्यार्थियों द्वारा प्राप्तांक 0 से 100 के बीच हैं।

यह असतत चरों की स्थिति है, क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस स्थिति में, यदि हम समान आकार वाले वर्ग अंतरालों का उपयोग करते हैं तथा 10 वर्ग अंतरालों का प्रयोग करते हैं, तो वर्ग अंतरालों के निम्न रूप हो सकते हैं-

वर्ग अंतराल का समावेशी रूप

0-10

11-20

21-30

-

-

91-100

वर्ग अंतराल का अपवर्जी रूप

0-10

10-20

20-30

-

-

90-100

अपवर्जी वर्ग अंतराल की स्थिति में, हमें यह अग्रिम रूप से निर्धारित करना होता है कि वर्ग सीमा के मान के बराबर किसी चर का मान होने पर क्या करना है। उदाहरण के लिए, हम यह निर्णय कर सकते हैं कि 10, 30 आदि मानों को क्रमशः वर्ग अंतराल ‘‘0 से 10’’ तथा ‘‘20 से 30’’ में रखा जाए। इस स्थिति में वर्ग की निचली सीमा को वर्ग अंतराल में शामिल नहीं किया जाता।

या फिर हम 10, 30 आदि मानों को क्रमशः वर्ग अंतराल ‘‘10 से 20’’ तथा ‘‘30 से 40’’ में रख सकते हैं। इस स्थिति में वर्ग की उच्च सीमा को वर्ग अंतराल में शामिल नहीं किया जाता।


सतत चर के उदाहरण

मान लें कि हमारे पास किसी चर के आँकड़े उपलब्ध हों, जैसे कद (से.मी.) या व.जन (कि.ग्रा.)। यह आँकड़ा सतत प्रकार का है। एेसी स्थितियों में वर्ग अंतराल निम्नलिखित प्रकार से दर्शाया जा सकता है-

30 कि.ग्रा.- 39.999...कि.ग्रा.

40 कि.ग्रा.- 49.999...कि.ग्रा.

50 कि.ग्रा.- 59.999...कि.ग्रा. आदि।

इन वर्ग अंतरालों को निम्नलिखित प्रकार से समझा जा सकता है-

30 कि.ग्रा. और अधिक तथा 40 कि.ग्रा. से कम

40 कि.ग्रा. और अधिक तथा 50 कि.ग्रा. से कम

50 कि.ग्रा. और अधिक तथा 60 कि.ग्रा. से कम आदि।


सारणी 3.4

एक कंपनी के 550 कर्मचारियों की आय का बारंबारता वितरण

आय (रु में)

 कर्मचारियों की संख्या

800-900

50

900-999

100

1000-1099

200

1100-1199

150

1200-1399

40

1300-1399

10

योग

550


वर्ग अंतराल में समायोजन

सारणी 3.4 में समावेशी विधि के सूक्ष्म अध्ययन से पता चलता है कि यद्यपि चर ‘आय’ एक संतत चर है, तथापि जब वर्गाें को बनाया जाता है तो संततता नहीं रहती। हम एक वर्ग की उच्च सीमा तथा अगले वर्ग की निम्न सीमा में ‘अंतर’ या असंततता पाते हैं। उदाहरण के लिए, पहले वर्ग की उच्च सीमा 899 और दूसरे वर्ग की निम्न सीमा 900 के बीच हम 1 (एक) का ‘अंतर’ पाते हैं। तब हम आँकड़ों के वर्गीकरण में चर की संततता को कैसे सुनिश्चित करते हैं? इसे वर्ग अंतराल के बीच समायोजन करके किया जाता है। समायोजन निम्नलिखित तरीके से किया गया है।

1. द्वितीय वर्ग की निम्न सीमा और प्रथम वर्ग की उच्च सीमा के बीच अंतर पता करें। उदाहरण के लिए, सारणी 3.4 में द्वितीय वर्ग की निम्न सीमा 900 और प्रथम वर्ग की उच्च सीमा 899 के बीच अंतर 1 है (अर्थात 900 - 899 = 1)।

2. प्राप्त किए गए अंतर (1) को 2 से विभाजित करें (अर्थात 1/2 = 0.5)।

3. सभी वर्गाें की निम्न सीमाओं से (2) में प्राप्त किए गए मान को घटाइए (निम्न वर्ग सीमा – 0.5)।

4. सभी वर्गाें की उच्च सीमा में (2) में प्राप्त किए गए मान को जोड़िए (उच्च वर्ग सीमा + 0.5)।

समायोजन के पश्चात्, जिससे बारंबारता वितरण में आँकड़ों की संततता की पुनः प्राप्ति होती है, सारणी 3.4 संशोधित होकर सारणी 3.5 बन जाती है।

वर्ग सीमाओं में समायोजन के पश्चात्, समानता (1) जोकि वर्ग चिह्न का मान निर्धारित करती है, निम्नलिखित प्रकार से संशोधित हो जाएगीः

समायोजित वर्ग चिह्न = (समायोजित उच्च वर्ग सीमा + समायोजित निम्न वर्ग सीमा)/2


सारिणी 3.5

एक कंपनी के 550 कर्मचारियों की आय का बारंबारता वितरण

आय (रु में)

 कर्मचारियों की संख्या

799.5-899.5

50

899.5-999.5

100

999.5-1099.5

200

1099.5-1199.5

150

1199.5-1299.5

40

1299.5-1399.5

10

योग 

550


हमें प्रत्येक वर्ग की बारंबारताकैसे प्राप्त करनी चाहिए

साधारण शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है कि अपरिष्कृत आँकड़ों में कितनी बार वह प्रेक्षण प्रकट होता है। सारणी 3.1 में, हमने देखा कि 40 का मान तीन बार आया है, जबकि 0 और 10 का मान एक बार, 49 का मान 5 बार और एेसे ही अन्य मान आये हैं। इस प्रकार से 40 की बारंबारता 3, 0 की 1, 10 की 1, 49 की 5 तथा एेसे ही। लेकिन जब आँकड़े वर्गाें में समूहित कर दिए जाते हैं, जैसा कि उदाहरण 3 में किया गया है, तो किसी वर्ग की बारंबारता से तात्पर्य उस वर्ग के मानों की संख्याओं सेे है। वर्ग-बारंबारताओं की गिनती विशेष वर्ग के सामने मिलान चिह्नों को लगाकर की जाती है।


मिलान चिह्न अंकन द्वारा वर्ग बारंबारता को ज्ञात करना

मिलान चिह्न (/) किसी वर्ग के प्रत्येक छात्र के सामने लगाया जाता है, जिसके प्राप्तांक उस वर्ग में शामिल हैं। उदाहरण के लिए, यदि किसी छात्र का प्राप्तांक 57 है तो उस छात्र के लिए वर्ग 50–60 में एक मिलान चिह्न (/) लगाया जाता है। यदि प्राप्तांक 71 हैं तो मिलान चिह्न (/) को वर्ग 70–80 में लगाया जाता है। यदि कोई 40 अंक प्राप्त करता है तो उसके लिए मिलान चिह्न वर्ग 40–50 में लगाया जाता है। सारणी 3.1 के 100 छात्रों के गणित में प्राप्तांकों के मिलान चिह्नों को सारणी 3.6 में दिखाया गया है।

मिलान चिह्नों का परिकलन तब आसान हो जाता है जब 4 चिह्न खड़े (////) लगाए जाते हैं और पाँचवाँ चिह्न सबको काटता हुआ तिरछा लगाया जाता है, जैसे ()। मिलान चिह्नों की गणना पाँच के समूह में की जाती है, इसलिए यदि किसी वर्ग में 16 मिलान चिह्न हैं तो उन्हें इस प्रकार से / लिखते हैं, ताकि परिकलन में सुविधा रहे। इसलिए एक वर्ग की बारंबारता उतनी ही होगी, जितनी उस वर्ग में मिलान चिह्नों की संख्या।


सूचना की हानि (Loss of Information)

बारंबारता वितरण के रूप में आँकड़़ों के वर्गीकरण में एक अंतर्निहित दोष पाया जाता है। यह अपरिष्कृत आँकड़ों का सारांश प्रस्तुत कर उन्हें संक्षिप्त एवं बोधगम्य तो बनाता है, परंतु इसमें वे विस्तृत विवरण नहीं प्रकट हो पाते जो अपरिष्कृत आँकड़ों में पाए जाते हैं। यद्यपि अपरिष्कृत आँकड़ों को वर्गीकृत करने में सूचना की क्षति होती है, तथापि आँकड़ों को वर्गीकरण द्वारा संक्षिप्त करने पर पर्याप्त जानकारी मिल जाती है। एक बार जब आँकड़ों को वर्गाें में समूहित कर दिया जाता है तब व्यष्टि प्रेक्षणों का आगे सांख्यकीय परिकलनों में कोई महत्व नहीं होता। उदाहरण 4 में, वर्ग 20–30 के अंतर्गत 6 प्रेक्षण 25, 25, 20, 22, 25 एवं 28 हैं। इसलिए जब इन आँकड़ों को बारंबारता वितरण में वर्ग 20–30 में समूहित कर दिया जाता है, तब यह बारंबारता वितरण उस वर्ग की बारंबारता (जैसे 6) को दिखाता है, न कि उनके वास्तविक मानों को। इस वर्ग के सभी मानों को उस वर्ग के वर्ग-अंतराल के मध्य मान या वर्ग चिह्न के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय परिकलनों के लिए वर्ग चिह्न के मान को आधार बनाया जाता है, न कि उस वर्ग के प्रेक्षणों के मान को। यही बात सभी वर्गाें के लिए सत्य है। इस प्रकार प्रेक्षणों के वास्तविक मान के स्थान पर वर्ग चिह्नों के प्रयोग को सांख्यिकीय विधियों में शामिल करने पर पर्याप्त मात्रा में सूचनाओं की क्षति होती है। यद्यपि अपरिष्कृत आँकड़ों का जैसा कि नीचे इससे अधिक दिखाया गया है, अधिक अर्थपूर्ण लगता है।


असमान वर्गाें में बारंबारता वितरण

अब तक आप समान वर्ग अंतराल के बारंबारता वितरण से परिचित हो चुके हैं। आप जान गए हैं कि इन्हें अपरिष्कृत आँकड़ों से कैसे गठित किया जाता है। लेकिन कुछ मामलों में असमान वर्ग अंतराल के साथ बारंबारता वितरण अधिक उपयुक्त होता है। यदि आप उदाहरण 4 के बारंबारता वितरण की सारणी 3.6 को देखें, तो आप पायेंगे कि अधिकांश प्रेक्षण वर्ग 40–50, 50–60 तथा 60–70 में संकेंद्रित हैं। उनकी बारंबारताएँ क्रमशः 21, 23 एवं 19 हैं। इसका अर्थ है कि 100 छात्रों में से 63 (21 + 23 + 19) प्रेक्षण इन वर्गाें में सकेंद्रित हैं। इस प्रकार 63 प्रतिशत आँकड़े 40-70 के बीच समाहित है और आँकड़ों का शेष 37 प्रतिशत 0–10, 10–20, 20–30, 30–40 तथा 70–80, 80–90 एवं 90–100 वर्गाें में हैं। इन वर्गाें में प्रेक्षणों का विरल घनत्व है। आप यह भी देखेंगे कि इन वर्गाें के प्रेक्षणों में अन्य वर्गाें की अपेक्षा उनके अपने वर्गाें के वर्ग-चिह्नों से अधिक विचलन है। लेकिन यदि वर्गाे का गठन इस प्रकार से करना हो कि वर्ग चिह्न, जहाँ तक संभव है, उस मान के बराबर हो जाए, जिसके आस-पास उस वर्ग के प्रेक्षणों के संकेंद्रण की प्रवृत्ति होती है, तो असमान वर्ग अंतराल अधिक उपयुक्त होता है।

सारणी 3.6

गणित में 100 छात्रों केप्राप्तांको के मिलान चिह्न

333.1

असमान वर्गाें के रूप में, सारणी 3.7 में सारणी 3.6 के उसी बारंबारता वितरण को दिखाया गया है। 40–50, 50–60 तथा 60–70 के प्रत्येक वर्ग को दो भागों में विभाजित किया गया है। वर्ग 40–50 को अब 40–45 तथा 45–50 में बाँटा गया है। वर्ग 50–60 को 50–55 और 55–60 में बाँटा गया है तथा वर्ग 60–70 को 60–65 तथा 65–70 में बाँटा गया है। अब नए वर्ग 40–45, 45–50, 50–55, 55–60, 60–65 तथा 65–70 हैं जिनमें वर्ग अंतराल 5 है। बाकी अन्य वर्गाें 0–10, 10–20, 20–30, 30–40, तथा 70–80, 80–90, 90–100 में ठीक वही पूर्ववत वर्ग अंतराल 10 है। इस सारणी का अंतिम स्तंभ इन वर्गाें के नये वर्ग चिह्नों को प्रदर्शित कर रहा है। सारणी 3.6 के पुराने वर्ग चिह्नों से उनकी तुलना करें। ध्यान दें कि इन वर्गाें के प्रेक्षणों में नये वर्ग चिह्न मानों की अपेक्षा पुराने वर्ग चिह्न मानों से विचलन अधिक है। इस प्रकार से नये वर्ग चिह्न मान, इन वर्गाें के आँकड़ों का पुराने मान की अपेक्षा बेहतर प्रतिनिधित्व करते हैं।

3.2 बारंबारता वक्र

चित्र 3.2 में, सारणी 3.7 के बारंबारता वितरण के बारंबारता वक्र को दिखाया गया है। इसमें सारणी के वर्ग चिह्नों को x-अक्ष पर तथा बारंबारताओं को y-अक्ष पर आलेखित किया गया है।


क्रियाकलाप

यदि आप चित्र 3.2 के साथ चित्र 3.1 की तुलना करते हैं तो आप क्या देखते हैं? क्या आपने इनके बीच कोई अंतर पाया? क्या आप उस अंतर की व्याख्या कर सकते हैं?


सारणी 3.7 

असमान वर्गाें में बारंबारता वितरण

333.4


बारंबारता सरणी (Frequency Array)

अब तक हमने गणित में 100 छात्रों द्वारा प्राप्त किए गए प्रतिशत अंकों के उदाहरण का प्रयोग करते हुए संतत चर के लिए आँकड़ों के वर्गीकरण पर चर्चा की है। विविक्त चर के लिए, आँकड़ों का वर्गीकरण बारंबारता सरणी के नाम से जाना जाता है। चूँकि एक विविक्त चर मानों को धारण करता है न कि दो पूर्णाकों के बीच माध्यमिक भिन्नीय मानों को, अतः हम एेसी बारंबारता रखते हैं जोकि अपने पूर्णांक मानों से संगत हों।

सारणी 3.8

परिवारों के आकार कीबारंबारता सारणी

 

परिवार का आकार

  परिवारों की संख्या

1

5

2

15

3

25

4

35

5

10

6

5

7

3

8

2

योग

100


सारणी 3.8 में दिया गया उदाहरण बारंबारता सरणी को प्रदर्शित करता है। इस सारणी में चर ‘परिवार का आकार’ एक विविक्त चर है जो सारणी में दिखाए गए पूर्णाकों को ही धारण करता है।

6.द्विचर बारंबारता वितरण

बहुत बार, जब हम किसी जनसंख्या में से एक प्रतिदर्श लेते हैं, तो हम प्रतिदर्श के हर अवयव से एक से अधिक प्रकार की सूचना संगृहीत करते हैं। उदाहरण के लिए, मान लीजिए कि हमने एक शहर की कंपनियों की सूची में से 20 कंपनियों का एक प्रतिदर्श लिया है। मान लीजिए कि हम प्रत्येक कंपनी से P बिक्री तथा विज्ञापनों पर किए गए व्यय की जानकारी संगृहीत करते हैं। इस स्थिति में, हमारे पास प्रतिदर्श के द्विचर आँकड़े हैं। इस तरह के द्विचर आँकड़ों को द्विचर बारंबारता वितरण द्वारा संक्षिप्त रूप में दर्शाया जा सकता है।

एक द्विचर बारंबारता वितरण को दो चरों के बारंबारता वितरण के रूप में परिभाषित किया जा सकता है।

सारणी 3.9, 20 कंपनियों के दो चर-बिक्री एवं विज्ञापन व्यय (लाख रु में) के बारंबारता वितरण को प्रदर्शित कर रही है। यहाँ पर बिक्री मानों को भिन्न स्तंभों में तथा विज्ञापन व्यय के मानों को भिन्न पंक्तियों में वर्णित किया गया है। प्रत्येक प्रकोष्ठ संतत पंक्ति एवं स्तंभ के मान की बारंबारता दिखाता है। उदाहरण के लिए, यहाँ पर तीन फर्म एेसी हैं, जिनकी बिक्री रु 135–145 लाख रु के बीच है और उनका विज्ञापन व्यय 64–66 हजार रु के बीच है। द्विचर वितरण के बारे में अध्याय 8 ‘सहसंबंध’ में अध्ययन किया जाएगा।

सारणी 3.9 

20 कंपनियों की बिक्री(लाख रु में) एवं विज्ञापनव्यय (हजार रु में) काद्विचर बारंबारता वितरण

333.5


7.सारांश

प्राथमिक या द्वितीयक स्रोतों से संगृहीत किए गए आँकड़े अपरिष्कृत या अवर्गीकृत होते हैं। जब एक बार आँकड़े संगृहित हो जाएँ तो अगला चरण आगे के सांख्यिकीय विश्लेषण के लिए आँकड़ों का वर्गीकरण करना है। वर्गीकरण से आँकड़ों में क्रमबद्धता आ जाती है। यह अध्याय आप को यह जानने के योग्य बनाता है कि आँकड़ों को बारंबारता वितरण के माध्यम से बोधगम्य तरीके से किस प्रकार वर्गीकृत किया जाता है। एक बार जब आप वर्गीकरण की तकनीकों को जान जाते हैं तो आपके लिए यह आसान होगा कि आप संतत तथा विविक्त दोनों चरों के लिए ही बारंबारता वितरण की रचना कर सकें।


पुनरावर्तन

वर्गीकरण अपरिष्कृत आँकड़ों को क्रमबद्धता प्रदान करता है।

बारंबारता वितरण यह प्रदर्शित करता है कि किसी चर के विभिन्न मान, संगत वर्ग-बारंबारताओं सहित, किस प्रकार विभिन्न वर्गाें में वितरित किए जाते हैं।

अपवर्जी विधि के अंतर्गत उच्च वर्ग सीमा को छोड़ा तथा निम्नवर्ग सीमा को शामिल किया जाता है।

समावेशी विधि में निम्नवर्ग सीमा तथा उच्च वर्ग सीमा, दोनों को ही शामिल किया जाता है।

बारंबारता वितरण में, आगे के सांख्यिकीय परिकलन केवल वर्ग चिह्न मान पर आधारित होते हैं, न कि प्रेक्षणों के मान पर।

वर्गाें को इस प्रकार से बनाया जाना चाहिए कि, जहाँ तक संभव हो सके, प्रत्येक वर्ग का वर्ग चिह्न उस मान के अधिक से अधिक निकटतम हो, जिस मान के आस-पास, किसी वर्ग के प्रेक्षणों की संकेन्द्रण की प्रवृत्ति हो।



अभ्यास

1. निम्नलिखित में से कौन सा विकल्प सही है?

एक वर्ग मध्यबिन्दु बराबर हैः

(क) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के औसत के।

(ख) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के गुणनफल के।

(ग) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के अनुपात के।

(घ) उपरोक्त में से कोई नहीं।

दो चरों के बारंबारता वितरण को इस नाम से जानते हैंः

(क) एक विचर वितरण

(ख) द्विचर वितरण

(ग) बहुचर वितरण

(घ) उपरोक्त मेें से कोई नहीं

वर्गीकृत आँकड़ों में साँख्यिकीय परिकलन आधारित होता हैः

(क) प्रेक्षणों के वास्तविक मानों पर

(ख) उच्च वर्ग सीमाओं पर

(ग) निम्न वर्ग सीमाओं पर

(घ) वर्ग के मध्यबिन्दुओं पर

अपवर्जी विधि के अंतर्गत

(क) किसी वर्ग की उच्च वर्ग सीमा को वर्ग अंतराल में समावेशित नहीं करते।

(ख) किसी वर्ग की उच्च वर्ग सीमा को वर्ग अंतराल में समावेशित करते हैं।

(ग) किसी वर्ग की निम्न वर्ग सीमा को वर्ग अंतराल में समावेशित नहीं करते।

(घ) किसी वर्ग की निम्न वर्ग सीमा को वर्ग अंतराल में समावेशित करते हैं।

परास का अर्थ है

(क) अधिकतम एवं न्यूनतम प्रेक्षणों के बीच अंतर

(ख) न्यूनतम एवं अधिकतम प्रेक्षणों के बीच अंतर

(ग) अधिकतम एवं न्यूनतम प्रेक्षणों का औसत

(घ) अधिकतम एवं न्यूनतम प्रेक्षणों का अनुपात

2. वस्तुओं को वर्गीकृत करने में क्या कोई लाभ हो सकता है? अपने दैनिक जीवन से एक उदाहरण देकर व्याख्या कीजिए।

3. चर क्या है? एक संतत तथा विविक्त चर के बीच भेद कीजिए।

4. आँकड़ों के वर्गीकरण में प्रयुक्त अपवर्जी तथा समावेशी विधियों की व्याख्या कीजिए।

5. सारणी 3.2 के आँकड़ों का प्रयोग करें, जो 50 परिवारों के भोजन पर मासिक व्यय (रु में) को दिखलाती हैै, और

(क) भोजन पर मासिक परिवारिक व्यय का प्रसार ज्ञात कीजिए।

(ख) परास को वर्ग अंतराल की उचित संख्याओं में विभाजित करें तथा व्यय का बारंबारता वितरण प्राप्त करें।

उन परिवारों की संख्या पता कीजिए जिनका भोजन पर मासिक व्यय

(क) 2000/- रु से कम है

(ख) 3000/- रु से अधिक है

(ग) 1500/- रु और 2500/- रु के बीच है

6. एक शहर में, यह जानने हेतु 45 परिवारों का सर्वेक्षण किया गया कि वे अपने घरों में कितनी संख्या में सेल फोनों का इस्तेमाल करते हैं। नीचे दिए गए उनके उत्तरों के आधार पर एक बारंबारता सरणी तैयार कीजिए।

1  3  2  2  2  2  1  2  1  2  2  3  3  3  3 

3  3  2  3  2  2  6  1  6  2  1  5  1  5  3 

4  2  7  4  2  4  3  4  2  0  3  1  4  3

7. वर्गीकृत आँकड़ों में ‘सूचना की क्षति’ का क्या अर्थ है?

8. क्या आप इस बात से सहमत है कि अपरिष्कृत आँकड़ों की अपेक्षा वर्गीकृत आँकड़े बेहतर होते हैं?

9. एक-विचर एवं द्विचर बारंबारता वितरण के बीच अंतर बताइए?

10. निम्नलिखित आँकडों के आधार पर 7 का वर्ग अंतराल लेकर समावेशी विधि द्वारा एक बारंबारता वितरण तैयार कीजिए।

28  17  15  22  29  21  23  27  18  12  7  2  9  4

1  8  3  10  5  20  16  12  8  4  33  27  21  15

3  36  27  18  9  2  4  6  32  31  29  18  14  13

15  11  9  7  1  5  37  32  28  26  24  20  19  25

19  20  6  9


क्रियात्मक गतिविधि

अपनी पुरानी अंक सारणियों से, अपनी पूर्व कक्षा में अर्द्धवार्षिक तथा वार्षिक परीक्षाओं में प्राप्त गणित के प्राप्तांकों को पता कीजिए। इन्हें वर्ष के क्रम में व्यवस्थित कीजिए। अब यह जाँच कीजिए कि क्या उक्त विषय में आप द्वारा प्राप्त किए अंक चर हैं या नहीं। इसके साथ यह भी देखिए कि क्या बाद के वर्षाें में गणित में आपकी स्थिति में सुधार हुआ है?




RELOAD if chapter isn't visible.