الموجز
التبايُن (Variance) أحد المقاييس الإحصائية التي تُستخدَم لقياس مدى تشتُّت البيانات حول
المتوسط الحسابي، إذ يُعرَف التبايُن بأنه متوسّط مربّعات الفروق بين كلِّ قيمة في مجموعةِ البيانات والمتوسّطِ الحسابي لها، ما يجعله مقياسًا يعكس درجة التباعُد بين القِيَم داخل مجموعة البيانات (سواء كانت عيّنة أو مجتمعًا). وهو مؤشّرٌ يُظهِر إلى أيّ مدًى تختلف القِيَم الفردية لمجموعة من البيانات عن المتوسّط، ما يساعد في فَهْم توزيع البيانات واتّخاذ القرارات المناسبة بناءً على ذلك. تكمُن أهمية التباين في تحليل البيانات المالية، وتقييم المخاطر، وضبط الجوْدة في التصنيع، والتنبؤات الإحصائية، حيث يُستخدَم لفَهْم مدى التشتّت في البيانات، وتحديد مدى الثقة في النتائج المُستخلَصة منها.
التعريف
التباين هو متوسّط مربّعات الفروق بين كل قيمة في مجموعة البيانات والمتوسّط الحسابي لها، إذ يمكن حسابه لمجموعة بيانات مأخوذة من المجتمع بالكامل، فيُعرَف في هذه الحالة بالتبايُن السُّكّاني. كذلك يمكن حسابه لعَيّنة فقط من المجتمع، وعندئذٍ يُسمّى التباين العَيْني. التبايُن السُّكّاني (تباين المجتمع) والتبايُن العَيْنيّ (تباين العَيّنة) هما مفهومان في الإحصاء يصفان مدى تشتُّت القِيَم في مجموعة بيانات، ولكن الفرق بينهما يكمُن في النطاق وطريقة الحساب[1].
يُقاس التبايُن السّكّاني (تبايُن المجتمع) بدراسة جميع بيانات أفراد المجتمع الإحصائي، أي أنه يُعبّر عن التشتُّت الفعلي للقِيَم في المجتمع كاملًا.
إذا كان
\(N\) هو عدد أفراد مجتمع ما، وكان
\(\mu \) هو المتوسّط الحسابي لهذا المجتمع، فإن التبايُن السُّكّاني
\(\sigma^{2}\) يُعطَى بالصيغة[2]:
\[\sigma^{2}=\frac{\sum_{i=1}^{N} \left(x_{i}-\mu \right)^{2}}{N}=\frac{\left(x_{1}-\mu \right)^{2}+\left(x_{2}-\mu \right)^{2}+⋯+\left(x_{N}-\mu \right)^{2}}{N}\]
أما تبايُن العيّنة، فيُحسَب بأخذ عينة من المجتمع وليس المجتمع كاملًا، وهو تقديرٌ لتبايُن المجتمع بناءً على البيانات المُتاحة.
إذا كانت
\(x_{1},x_{2},\ldots ,x_{n}\) مشاهدات العَيّنة لمجتمعٍ ما، وعددُها هو
\(n\)، ومتوسّطها الحسابي هو
\[\hat{x}=\frac{\sum_{i=1}^{n} x_{i}}{n}\]
فإن التبايُن العَيْنيّ يُحسَب بالصيغة[3]:
\[s^{2}=\frac{\sum_{i=1}^{n} \left(x_{i}-\hat{x}\right)^{2}}{n-1}=\frac{\left(x_{1}-\hat{x}\right)^{2}+\left(x_{2}-\hat{x}\right)^{2}+\ldots +\left(x_{n}-\hat{x}\right)^{2}}{n-1}\]
ويُستخدَم المقام
\(n-1\) بدلًا من 𝑛، لأن تقدير المتوسّط من العيّنة نفسها يؤدّي إلى فقدان درجة حرّية واحدة، لذلك يُسمّى
\(n-1\) بعدد درجات الحرية. يُعرَف هذا التعديل باسم تصحيح بيسل (Bessel’s correction)، وهو ما يجعل
\(s^{2}\) مقدّرًا غير متحيّزٍ لتبايُن المجتمع
\(\sigma^{2}\)[4].
يكمُن الفرق الجوهري بين التبايُن السُّكّاني والتبايُن العَيْني في طبيعة البيانات المُستخدَمة في كلٍّ منهما، فالتبايُن السُّكّاني يُحسَب باستخدام جميع بيانات أفراد المجتمع، بينما يُحسَب التبايُن العَيْني اعتمادًا على بيانات عَيّنة مأخوذة من ذلك المجتمع. وعند حساب التبايُن العَيْني، تُطبَّق القسمة على عدد أفراد العيّنة، مطروحًا منه الواحد بدلًا من العدد الكُلّي، كما هي الحال في التباين السُّكّاني، وذلك بهدف تقليل الانحياز الناتج من استخدام العيّنة، لأن العَيّنة قد لا تُمثّل التبايُنَ الفعليَّ للمجتمع بدقّة. يُستخدَم التبايُن العَيْني كبديلٍ تقديريٍّ للتبايُن السُّكّاني في الحالات التي يصعب فيها الحصول على بيانات المجتمع كاملًا. أما في حال توفّر بيانات المجتمع كاملة، فيُفضَّل استخدام التبايُن السُّكّاني، لأنه يُعطي قياسًا دقيقًا لتبايُن المجتمع[5].
العلاقة بين التباين والانحراف المعياري
يُعَدّ
التباين والانحراف المعياري (Standard Deviation) من أهمّ مقاييس التشتُّت في الإحصاء الوصفي والاستدلالي، إذ يُعبّر كلاهما عن مقدار تباعُد القِيَم عن المتوسّط الحسابي. يُعرَف التبايُن بأنه متوسّط مربّعات الانحرافات عن المتوسّط، في حين أن الانحراف المعياري يُعرَف بأنه الجذر التربيعي للتباين. بذلك، فإن الانحراف المعياري يقيس التشتُّت بوحدة قياس البيانات الأصلية نفسها، بينما يُقاس التبايُن بوحدات مربّعة.
العلاقة الرياضية بينهما
يُعرَّف
الانحراف المعياري بأنه
الجذر التربيعي للتبايُن، ما يعني وجود علاقة رياضية تربط بينهما، تُكتَب على الشكل الآتي:
للمجتمع الإحصائي، يُحسَب الانحراف المعياري بأخذ الجذر التربيعي للتبايُن السُّكّاني كما يأتي[6]:
\[\sigma =\sqrt{\sigma^{2}}\]
حيث
\(\sigma^{2}\) التباين السكّاني، وهُنا يُسمّى الانحراف المعياري بالانحراف المعياري السُّكّاني، نسبةً إلى البيانات التي أُخذت من المجتمع في حساب التبايُن.
كذلك للعَيّنة الإحصائية، يُحسَب الانحراف المعياري أيضًا بأخذ الجذر التربيعي للتبايُن العَيْني كما يأتي[7]:
\[s=\sqrt{s^{2}}\]
حيث
\( s^{2}\)التباين العَيْني، ويُسمّى الانحراف المعياري في هذه الحالة بالانحراف المعياري العَيْني، نسبةً إلى البيانات التي أُخذت من عَيّنةٍ من المجتمع في حساب التبايُن.
الفرق بينهما
يُعبِّر كلٌّ من التبايُن والانحراف المعياري عن تشتُّت القِيَم في مجموعة البيانات عن المتوسّط الحسابي، سواء أكانت الحالة المدروسة لمجتمع إحصائي أم عينة إحصائية. وفي ضوء تعريف كلٍّ منهما، توجد بعض الفروق والاختلافات التي تُميّز أحدهما عن الآخر، ومن ثم التعدّد في الاستخدام تبعًا للمُعطيات الموجودة وصولًا إلى الهدف المنشود (الجدول 1)[8].
[الجدول 1] - الفرق بين التبايُن والانحراف المعياري
|
المقياس |
التعريف |
الصيغة |
الوحدات |
|
التباين | مقياس لتشتّت القِيَم حول المتوسّط، محسوبٌ باستخدام مربّع الفرق بين كل قيمة والمتوسّط. |
\[\sigma^{2}=\frac{\sum_{i=1}^{N} \left(x_{i}-\mu \right)^{2}}{N}\] | مربّع وحدة البيانات الأصلية (مثلًا: إذا كانت البيانات بالكيلوغرام، فالتبايُن يكون بالكيلوغرام). |
|
الانحراف المعياري | الجذر التربيعي للتبايُن، ويُعَدّ مقياسًا لتشتُّت القِيَم حول المتوسّط، ولكنه بوحدة البيانات الأصلية نفسها. |
\[\sigma =\sqrt{\sigma^{2}} \] | بوحدة البيانات الأصلية نفسها (مثلًا: إذا كانت البيانات بالكيلوغرام، فالانحراف المعياري يكون بالكيلوغرام). |
حالات استخدام الانحراف المعياري بدلًا من التبايُن
التبايُن والانحراف المعياري هما مقياسان مُهمّان لقياس مدى تشتُّت البيانات حول المتوسّط الحسابي، إذ يُعبّر التبايُن عن مقدار التشتُّت، لكنه يُقاس بوحدات مربّعة لوحدة البيانات الأصلية، ما قد يجعل تفسيره أقلّ وضوحًا؛ أما الانحراف المعياري، فهو الجذر التربيعي للتبايُن، وبالتالي يُعاد التعبير عن التشتّت بوحدة القياس الأصلية نفسها، ما يجعله أكثر وضوحًا وأسهل في الفهم[9].
في التطبيقات العملية مثل الاقتصاد والفيزياء، يُفضَّل استخدام الانحراف المعياري لأنه يُقدِّم مقياسًا مباشرًا وواضحًا لمدى التغيُّر أو الانتشار في البيانات. يُستخدَم التباين غالبًا عند الحاجة إلى إجراء عمليات حسابية إضافية كتحليل التباين {{Analysis of Variance - ANOVA}}، بينما يكون الانحراف المعياري الخيار الأنسب للتفسير السَّهْل والمباشر لدرجة التشتُّت في القِيَم[10].
حساب التباين والانحراف المعياري للبيانات غير المبوّبة
البيانات غير المبوّبة (Ungrouped data) هي بياناتٌ تُعرَض على شكل قِيَم فردية مباشرة من دون تجميعها في فئات أو تمثيلها في جدول تكراري. لإيجاد التبايُن والانحراف المعياري للبيانات غير المبوّبة، تُتَّبع الطريقة نفسها المستخدمة في البيانات العددية العادية، وذلك بحساب المتوسط الحسابي أولًا، ثم يتبعه التبايُن والانحراف المعياري، مع استخدام الصِّيَغ والقوانين التي ذُكرت في إيجاد كلٍّ منهم[11].
مثال: إيجاد الانحراف المعياري للبيانات
\(10,12,14,15,17,18,18,24\)
الحل:
إيجاد الوسط الحسابي أولًا:
\[\bar{x}=16\]
ثم حساب التباين العَيني:
\[s^{2}=\frac{130}{7}\approx 18.571\]
ثم الانحراف المعياري:
\[s=\sqrt{s^{2}}=\sqrt{\frac{130}{7}}\approx 4.309\]
حساب التباين والانحراف المعياري للبيانات المبوّبة بتعداد التكرارات
يُعبِّر التكرار في الإحصاء عن عدد المرّات التي تظهر فيها قيمةٌ مُعيّنةٌ أو فئةٌ مُعيّنةٌ في مجموعة البيانات، وهو يساعد على تنظيم البيانات وتلخيصها بأسلوب بسيط، ما يُسهّل فَهْم توزيع القِيَم والتعرّف إلى الأنماط العامّة في البيانات. في حالة تكرار المشاهدات في البيانات المبوّبة، يجب كخطوة أولى إعادة ترتيب البيانات في جدول يُوضح التكرار
\(f_{k}\)، وعندئذٍ يمكن حساب التباين باستعمال الصيغة[12]:
\[s^{2}=\frac{1}{n-1}\left(\sum_{k}^{} x_{k}^{2}f_{k}-\frac{(\sum_{}^{} x_{k}f_{k})^{2}}{n}\right)\]
والانحراف المعياري:
\[s=\sqrt{s^{2}}=\sqrt{\frac{1}{n-1}\left(\sum_{k}^{} x_{k}^{2}f_{k}-\frac{(\sum_{}^{} x_{k}f_{k})^{2}}{n}\right)}\]
مثال: إيجاد الانحراف المعياري والتباين في الجدول التكراري الآتي:
|
\[f_{k}\] |
\[x_{k}\] |
|
\[5\] |
\[5\] |
|
\[11\] |
\[15\] |
|
\[10\] |
\[25\] |
|
\[9\] |
\[35\] |
|
\[2\] |
\[45\] |
|
\[1\] |
\[55\] |
|
\[2\] |
\[56\] |
الحل: بدء الحساب الآتي:
\[\sum_{k=1}^{7} f_{k}x_{k}^{2}=5\times 5^{2}+11\times 15^{2}+10\times 25^{2}+\ldots +2\times 65^{2}=35400\]\[\sum_{k=1}^{7} f_{k}x_{k}=5\times 5+11\times 15+10\times 25+...+2\times 65=1030\]
من ثم يكون التباين باستعمال الصيغة:
\[s^{2}=\frac{1}{n-1}\left(\sum_{k}^{} x_{k}^{2}f_{k}-\frac{(\sum_{}^{} x_{k}f_{k})^{2}}{n}\right)=\frac{1}{39}\left(35400-\frac{(1030)^{2}}{40}\right)=227.63\]
والانحراف المعياري هو:
\[s\approx 15.08\]
خصائص التباين والانحراف المعياري
في عالَم الإحصاء وتحليل البيانات، لا تقتصر أهمية الدراسات الإحصائية على معرفة أنواع البيانات أو تصنيفها، أو حتى المتوسّطات والقِيَم المركزية لها، بل يمتدّ التحليل ليشمل أفكارًا أكثر عمقًا، تهدف إلى وصف تشتُّت البيانات وطريقة توزيعها. هنا، تظهر أدوات إحصائية جوهرية، مثل التباين والانحراف المعياري اللّذَيْن يُعَدّان مِن أهمّ المقاييس التي تساعد على وصف مدى تشتُّت البيانات. لكلٍّ من هذَيْن المفهومَيْن خصائصه التي تُميّزه عن غيره من المقاييس، ومنها[13]:
- التباين والانحراف المعياري غير سالبَيْن (Non-negative):
\[s^{2}\geq 0 , s\geq 0\]
- يكون التباين مُساويًا للصفر إذا وفقط إذا كان الانحراف المعياري مُساويًا للصفر، وذلك إذا وفقط إذا كانت جميع قيم العَيّنة متساوية:
\[s^{2}=0⟺s=0⟺x_{1}=x_{2}=\ldots =x_{n}\]
- وحدة التباين
\(s^{2}\) هي مربّع وحدة البيانات الأصلية.
- وحدة الانحراف المعياري
\(s\) هي وحدة البيانات الأصلية نفسها.
يختلف التباين السُّكّاني عن تبايُن العَيّنة في الصيغة الحسابية لكلٍّ منهما؛ ففي التبايُن السُّكّاني يُقسَم مجموع الفروق بين البيانات والمتوسّط الحسابي على العدد الكُلّي للمجتمع؛ بينما في تبايُن العَيّنة تتمّ القسمة على العدد الكُلّي للعَيّنة المأخوذة، مطروحًا منه الواحد، وهذا أساسًا تعريفُ التبايُن للمجتمع الإحصائي والعينة الإحصائية، إلا أنه ليس الصيغة الوحيدة، إذ توجد صِيغٌ أخرى مشتقّة من التعريف الأوّلي تُسهّل عملية حساب التبايُن داخل ظروف مُعيَّنة، منها ما يأتي[14]:
صيغة التعريف الأساسي للتباين:
\[\sigma^{2}=\frac{\sum_{i=1}^{N} \left(x_{i}-\mu \right)^{2}}{N} , s^{2}=\frac{\sum_{i=1}^{n} \left(x_{i}-\hat{x}\right)^{2}}{n-1}\]
صيغة أخرى لحساب التباين (السكاني أو العينة):
\[\sigma^{2}=\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{N} x_{i}\right)^{2}}{N}\right\} , s^{2}=\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n}\right\}\]
كذلك الصيغة الآتية (تباين سُكّاني أو عَيْني):
\[\sigma^{2}=\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-N\left( \mu \right)^{2}\right\} , s^{2}=\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-n\left( \bar{x}\right)^{2}\right\}\]
يمكن برهان هذه الصيغ كما يأتي[15]:
-
برهان الصيغة:
\[\sigma^{2}=\frac{1}{N}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{N}\right\}\]
يمكن البدء بالطرف الأيسر باستخدام التعريف الأوّلي للتبايُن السُّكّاني وصولًا إلى الطرف الأيمن على النحو الآتي:
\[\sigma^{2}=\frac{\sum_{i=1}^{N} \left(x_{i}-\mu \right)^{2}}{N}\]
باستخدام صيغة مفكوك القوس التربيعي، تكون النتيجة:
\[\sigma^{2}=\frac{1}{N}\sum_{i=1}^{N} \left(x_{i}^{2}-2x_{i}\mu +\mu^{2}\right)=\frac{1}{N}\sum_{i=1}^{N} x_{i}^{2}-\frac{2\mu}{N}\sum_{i=1}^{N} x_{i}+\frac{\mu^{2}}{N}\sum_{i=1}^{N} 1\]
باستخدام الصيغة:
\[\sum_{i=1}^{k} 1=k\]
تكون النتيجة:
\[\frac{1}{N}\sum_{i=1}^{N} x_{i}^{2}-\frac{2\mu}{N}\sum_{i=1}^{N} x_{i}^{2}+\frac{\mu^{2}}{N}N=\frac{1}{N}\sum_{i=1}^{N} x_{i}-\frac{2\mu}{N}\sum_{i=1}^{N} x_{i}^{2}+\mu^{2}\]
باستخدام الصيغة المخصّصة في حساب المتوسّط الحسابي:
\[\mu =\frac{1}{N}\sum_{i=1}^{N} x_{i}\]
تكون النتيجة:
\[\frac{1}{N}\sum_{i=1}^{N} x_{i}^{2}-\frac{2}{N}\left(\frac{1}{N}\sum_{i=1}^{N} x_{i}\right)\left(\sum_{i=1}^{N} x_{i}\right)+\left(\frac{1}{N}\sum_{i=1}^{N} x_{i}\right)^{2}\]
بالتبسيط:
\[\frac{1}{N}\sum_{i=1}^{N} x_{i}^{2}-\frac{2}{N^{2}}\left(\sum_{i=1}^{N} x_{i}\right)^{2}+\frac{1}{N^{2}}\left(\sum_{i=1}^{N} x_{i}\right)^{2}=\frac{1}{N}\sum_{i=1}^{N} x_{i}^{2}-\frac{1}{N^{2}}\left(\sum_{i=1}^{N} x_{i}\right)^{2}\]
بكتابة المقدار على الشكل:
\[\frac{1}{N}\sum_{i=1}^{N} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{N} x_{i}\right)^{2}}{N^{2}}\]
بسحب العامل المشترك
\(\frac{1}{N}\)، تكون النتيجة:
\[\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{N} x_{i}\right)^{2}}{N}\right\}\]
وهو المطلوب.
-
برهان الصيغة:
\[s^{2}=\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n}\right\}\]
يمكن البدء بالطرف الأيسر باستخدام التعريف الأوّلي للتباين العَيْني وصولًا إلى الطرف الأيمن، على النحو الآتي:
\[s^{2}=\frac{\sum_{i=1}^{n} \left(x_{i}-\hat{x}\right)^{2}}{n-1}\]
باستخدام صيغة مفكوك القوس التربيعي، تكون النتيجة:
\[s^{2}=\frac{1}{n-1}\sum_{i=1}^{n} \left(x_{i}^{2}-2x_{i}\hat{x}+\hat{x}^{2}\right)=\frac{1}{n-1}\sum_{i=1}^{n} x_{i}^{2}-\frac{2\hat{x}}{n-1}\sum_{i=1}^{n} x_{i}+\frac{\hat{x}^{2}}{n-1}\sum_{i=1}^{n} 1\]
باستخدام الصيغة:
\[\sum_{i=1}^{k} 1=k\]
تكون النتيجة:
\[\frac{1}{n-1}\sum_{i=1}^{n} x_{i}^{2}-\frac{2\hat{x}}{n-1}\sum_{i=1}^{n} x_{i}^{2}+\frac{\hat{x}^{2}}{n-1}n=\frac{1}{n-1}\sum_{i=1}^{n} x_{i}-\frac{2\hat{x}}{n-1}\sum_{i=1}^{n} x_{i}^{2}+\frac{n}{n-1}\hat{x}^{2}\]
باستخدام الصيغة المخصّصة في حساب المتوسط الحسابي:
\[\bar{x}=\frac{1}{n}\sum_{i=1}^{n} x_{i}\]
تكون النتيجة:
\[\frac{1}{n-1}\sum_{i=1}^{n} x_{i}^{2}-\frac{2}{n-1}\left(\frac{1}{n-1}\sum_{i=1}^{n} x_{i}\right)\left(\sum_{i=1}^{n} x_{i}\right)+\frac{n}{n-1}\left(\frac{1}{n}\sum_{i=1}^{n} x_{i}\right)^{2}\]
بالتبسيط:
\[\frac{1}{n-1}\sum_{i=1}^{n} x_{i}^{2}-\frac{2}{(n-1)^{2}}\left(\sum_{i=1}^{n} x_{i}\right)^{2}+\frac{1}{n(n-1)}\left(\sum_{i=1}^{n} x_{i}\right)^{2}=\frac{1}{n-1}\sum_{i=1}^{n} x_{i}^{2}-\frac{1}{n\left(n-1\right)}\left(\sum_{i=1}^{n} x_{i}\right)^{2}\]
الآن، بكتابة المقدار على الشكل:
\[\frac{1}{n-1}\sum_{i=1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n(n-1)}\]
بسحب العامل المشترك
\(\frac{1}{n-1}\)، يكون الحلّ على الصيغة الآتية:
\[\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n}\right\}\]
وهو المطلوب.
-
برهان الصيغة:
\[\sigma^{2}=\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-N\left( \mu \right)^{2}\right\}\]
من البرهان الأول:
\[\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{N} x_{i}\right)^{2}}{N}\right\}\]
بضرب البسط والمقام بـ
\(N\):
\[\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-\frac{N\left(\sum_{i = 1}^{N} x_{i}\right)^{2}}{N^{2}}\right\}\]
باستعمال الخاصية:
\[\left(\frac{a}{b}\right)^{n}=\frac{a^{n}}{b^{n}}\]
تكون النتيجة:
\[\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-N\left(\frac{\sum_{i = 1}^{N} x_{i}}{N}\right)^{2}\right\}\]
ولكن:
\[\mu =\frac{1}{N}\sum_{i=1}^{N} x_{i}\]
ومن ثم:
\[\frac{1}{N}\left\{\sum_{i = 1}^{N} x_{i}^{2}-N\left( \mu \right)^{2}\right\}\]
وهو المطلوب.
-
برهان الصيغة:
\[s^{2}=\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-n\left( \bar{x}\right)^{2}\right\}\]
من البرهان الثاني:
\[\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n}\right\}\]
بضرب البسط والمقام بـ
\(n\):
\[\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{n\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n^{2}}\right\}\]
باستعمال الخاصية:
\[\left(\frac{a}{b}\right)^{n}=\frac{a^{n}}{b^{n}}\]
تكون النتيجة:
\[\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-n\left(\frac{\sum_{i = 1}^{n} x_{i}}{n}\right)^{2}\right\}\]
ولكن:
\[\bar{x}=\frac{1}{n}\sum_{i=1}^{n} x_{i}\]
ومن ثم:
\[\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-n\left( \bar{x}\right)^{2}\right\}\]
وهو المطلوب.
مثال: حساب التباين والانحراف المعياري للعَيّنة الآتية:
\[7.1, 2.5, 2.5, 5.4, 8.3\]
الحلّ:
بدايةً، يجب إيجاد المتوسّط الحسابي للبيانات:
\[\bar{x}= \frac{\sum_{i = 1}^{n} x_{i}}{n}=\frac{25.8}{5}=5.16\]
بتلخيص الحلّ في الجدول الآتي:
|
\[x_{i}\] |
الانحراف \[x_{i}-\bar{x}\] |
مربع الانحراف \[\left(x_{i}-\bar{x}\right)^{2}\] |
\[x^{2}\] |
| 7.1 | 1.94 | 3.76 | 50.41 |
| 2.5 | -2.66 | 7.08 | 6.25 |
| 2.5 | -2.66 | 7.08 | 6.25 |
| 5.4 | 0.24 | 0.06 | 29.16 |
| 8.3 | 3.14 | 9.86 | 68.89 |
|
\[\sum_{i = 1}^{n} x_{i}=25.8\] |
\[\sum_{i = 1}^{n} (x_{i}-\bar{x})\approx 0\] |
\[\sum_{i = 1}^{n} \left(x_{i}-\bar{x}\right)^{2}=27.832\] |
\[\sum_{i = 1}^{n} x_{i}^{2}=160.96\] |
من الجدول السابق، يتم إيجاد الكميات الآتية:
\[n=5 , \sum_{i = 1}^{n} x_{i}=25.8 , \sum_{i = 1}^{n} \left(x_{i}-\bar{x}\right)^{2}=27.84 , \sum_{i = 1}^{n} x_{i}^{2}=160.96\]
حساب تبايُن العيّنة:
-
باستخدام التعريف:
\[s^{2}= \frac{\sum_{i = 1}^{n} \left(x_{i}-\bar{x}\right)^{2}}{n -1}=\frac{27.84}{5-1}\approx 6.96\]
-
باستخدام الصيغة الحسابية الأولى:
\[s^{2}=\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-\frac{\left(\sum_{i = 1}^{n} x_{i}\right)^{2}}{n}\right\}=\frac{1}{5-1}\left\{160.96-\frac{\left(25.8\right)^{2}}{5}\right\} =\frac{160.96-133.12}{4}=\frac{27.84}{4}\approx 6.96\]
-
باستخدام الصيغة الحسابية الثانية:
\[s^{2}=\frac{1}{n-1}\left\{\sum_{i = 1}^{n} x_{i}^{2}-n \left(\bar{x}\right)^{2}\right\}=\frac{1}{5-1}\left\{160.96-\left(5\right)\left(5.16\right)^{2}\right\}\]
\[\] \[ =\frac{160.96-133.12}{4}=\frac{27.832}{4}=6.958\]
والانحراف المعياري هو:
\(s=\sqrt{s^{2} }\)\(= \sqrt{\frac{\sum_{i = 1}^{n} \left(x_{i}-\bar{x}\right)^{2}}{n -1}}=\sqrt{6.96 }\approx 2.6378\)
يخضع التبايُن والانحراف المعياري لبعض العمليات الجبرية، فإذا كان
\(s^{2}\) و
\(s\) على الترتيب هما التباين والانحراف المعياري للبيانات
\(x_{1},x_{2},\ldots ,x_{n}\)، وكان
\(a\) و
\(b\) مقدارَيْن ثابتَيْن، فإن[16]:
- تباين البيانات
\(x_{1}\pm b,x_{2}\pm b,\ldots ,x_{n}\pm b\) هو
\(s^{2}ـ\)، أمّا انحرافها المعياري فهو
\(s \)، لذلك فإن التباين والانحراف المعياري لا يتأثران بإضافة أو طرح مقدار ثابت من جميع المشاهدات.
- تباين البيانات
\(ax_{1},ax_{2},\ldots ,ax_{n}\) هو
\(a^{2}s^{2}\)، أمّا انحرافها المعياري فهو
\(\left|a\right|s\)، حيث
\(\left|a\right|\) هي القيمة المطلقة للقيمة
\(a\).
- تبايُن البيانات
\(ax_{1}\pm b,ax_{2}\pm b,\ldots ,ax_{n}\pm b\) هو
\(a^{2}s^{2}\)، أمّا انحرافها المعياري فهو
\(\left|a\right|s\).
- تباين المقدار الثابت يساوي الصفر.
يمكن تلخيص هذه الخواص في الجدول الآتي:
|
المشاهدات |
التباين |
الانحراف المعياري |
|
\[x_{1},x_{2},\ldots ,x_{n}\] |
\[s^{2}\] |
\[s\] |
|
\[x_{1}\pm b,x_{2}\pm b,\ldots ,x_{n}\pm b\] |
\[s^{2}\] |
\[s\] |
|
\[ax_{1},ax_{2},\ldots ,ax_{n}\] |
\[a^{2}s^{2}\] |
\[\left|a\right|s\] |
|
\[ax_{1}\pm b,ax_{2}\pm b,\ldots ,ax_{n}\pm b\] |
\[a^{2}s^{2}\] |
\[\left|a\right|s\] |
مثال: يوضّح الجدول تطبيقًا على خصائص التباين والانحراف المعياري.
|
المشاهدات |
الانحراف المعياري |
التباين |
|
\[x : 5,3,4,6,2\] |
\[s=1.581\] |
\[s^{2}=2.5\] |
|
\[x+5 : 10,8,9,11,7\] |
\[1.581\] |
\[2.5\] |
|
\[3x : 15,9,12,18,6\] |
\[\left|3\right|\times 1.581=4.743\] |
\[9\times 2.5=22.5\] |
|
\[3x+5 : 20,14,17,23,11\] |
\[\left|3\right|\times 1.581=4.743\] |
\[9\times 2.5=22.5\] |
العلاقة بين التباين ومقاييس النزعة المركزية
يُعَدّ التبايُن ومقاييس النزعة المركزية (Measures of Central Tendency) عنصرَين أساسيَّين في
الإحصاء الوصفي، حيث يعملان معًا على وصف توزيع البيانات بطريقة متكاملة. تُستخدَم مقاييس النزعة المركزية، مثل المتوسط الحسابي، والوسيط، والمنوال، لتحديد القيمة المركزية أو النموذجية لمجموعة من البيانات، بينما يقيس التباين مدى تشتُّت هذه البيانات حول تلك القيمة المركزية[17].
العلاقة بين التباين ومقاييس النزعة المركزية:[18]
-
التباين والمتوسط الحسابي (Mean):
- يعتمد تعريف التباين على المتوسط الحسابي بوصفه نقطة الارتكاز التي تُقاس حولها درجة التشتّت، إذ يُحسَب التباين بأخذ فروق القِيَم عن المتوسّط، ثم تربيعها وأخذ متوسّط مربّعات تلك الفروق.
- ارتفاع التبايُن لا يعني بالضرورة أن المتوسّط غير مُمثّل جيدًا للبيانات، بل يعني أن القِيَم متباعدة عنه بدرجة أكبر. مدى تمثيل المتوسّط لمركز البيانات يعتمد كذلك على شكل التوزيع ودرجة تماثله ووجود القِيَم المتطرفة.
- في التوزيعات المتماثلة، حتى مع ارتفاع التبايُن، قد يظل المتوسّط مُمثِّلًا جيدًا للموقع المركزي، لأن القِيَم تنتشر حوله بصورة متوازنة.
-
التباين والوسيط (Median):
- الوسيط هو القيمة التي تقسم البيانات المُرتَّبة إلى نصفَيْن متساويَيْن، وهو مقياسُ موقعٍ لا يعتمد في تعريفه على المتوسّط الحسابي.
- لا يدخل الوسيط في صيغة حساب التبايُن، لذلك لا توجد علاقة حسابية مباشرة بينهما.
- في التوزيعات المتماثلة، يتقارب الوسيط والمتوسّط، لكن هذا التقارب لا يعني بالضرورة أن التباين منخفض؛ فقد يكون التوزيع متماثِلًا وواسع الانتشار في الوقت نفسه.
- عدم التماثل (الالتواء) لا يعني ارتفاع التبايُن، وانخفاض التبايُن لا يعني تماثُل التوزيع. الالتواء خاصية شكلية تتعلّق بعدم تماثُل التوزيع، بينما التبايُن يقيس مقدار الانتشار فقط، وهما خصيصتان مستقلّتان مفهوميًا ورياضيًا.
-
التباين والمنوال (Mode):
- المنوال هو القيمة الأكثر تكرارًا في مجموعة البيانات، وهو مقياسُ موقعٍ يعتمد على الكثافة أو التكرار لا على المتوسط.
- في التوزيع الطبيعي، تتساوى مقاييس النزعة المركزية الثلاثة (المتوسط والوسيط والمنوال) بغض النظر عن قيمة التبايُن، لأن التبايُن يؤثر في درجة انتشار التوزيع فقط ولا يُغيّر موضع مركزه.
- وجود أكثر من منوال (تعدّد المنوال) لا يستلزم بالضرورة ارتفاع التبايُن، وارتفاع التباين لا يعني وجود أكثر من منوال. تعدّد المنوال خاصية تتعلّق بشكل التوزيع وعدد القمم فيه، بينما التباين يقيس الانتشار حول المتوسّط.
تؤدي العلاقة بين التبايُن ومقاييس النزعة المركزية دَوْرًا مهمًّا في فَهْم خصائص البيانات وتحليلها بدقّة. تُستخدَم مقاييس النزعة المركزية، مثل المتوسّط الحسابي والوسيط والمنوال، لتحديد موقع القِيَم داخل التوزيع، أي لتحديد موضع التمركز. أما التباين، فيقيس درجة انتشار القِيَم حول المتوسّط الحسابي تحديدًا، إذ يُعرَّف بوصفه متوسّط مربّعات انحراف القِيَم عن هذا المتوسط.
عندما يكون التبايُن منخفضًا، تكون القِيَم متقاربة من المتوسّط، ما يدلّ على درجة عالية من التجانس. أما عندما يكون التبايُن مرتفعًا، فإن القِيَم تكون أكثر انتشارًا حول المتوسّط، ما يعكس زيادة في درجة التشتُّت. غير أن ارتفاع التبايُن لا يعني بالضرورة أن المتوسط غير مناسب لتمثيل مركز البيانات؛ إذ يتوقّف ذلك أيضًا على شكل التوزيع ووجود القِيَم المتطرّفة.
في السياق الاحتمالي، يُمثّل المتوسّط القيمة المتوقّعة للمُتغيّر العشوائي، بينما يقيس التبايُن درجة التذبذب أو عدم اليقين بشأن هذه القيمة المُتوقَّعة. لهذا السبب، تُستخدَم هاتان الكميّتان معًا في مجالات متعدّدة، مثل الاقتصاد والهندسة والعلوم الاجتماعية وتحليل المخاطر، حيث يُوفّر المتوسّط تقديرًا للموقع المركزي، ويُقدّم التبايُن مقياسًا لدرجة التقلُّب أو المخاطرة المرتبطة بذلك التقدير[19].
تفسير التباين في البيانات
يُعَدّ تفسير التبايُن في البيانات أمرًا ضروريًا لفَهْم مدى تشتُّت القِيَم ضمن مجموعة مُعيّنة، فعندما يكون التبايُن منخفضًا، فهذا يعني أن القِيَم متقاربةٌ من المتوسّط الحسابي، ما يعكس تجانُسَ البيانات وتقارُبَها. أما إذا كان التبايُن مرتفعًا، فإن القِيَم تكون متباعدةً عن المتوسط، ما يُشير إلى وجود تشتُّتٍ كبيرٍ وتفاوُتٍ واضحٍ في البيانات. وفي حالة التباين الصفري، فإن جميع القِيَم تكون متساويةً تمامًا، ما يدلّ على غياب التشتُّت تمامًا، أي أن البيانات متماثلة ولا يوجد أي اختلاف بينها[20].
المزايا والعيوب
[الشكل 1] - تأثير القيم الشاذة على التبايُن
حذف الصورة؟
سيؤدي هذا إلى نقل الصورة إلى سلة المهملات.
يُعَدّ التبايُن أحد المقاييس الأساسية للتشتُّت في الإحصاء الوصفي والاستدلالي، ويُعرَّف بأنه متوسّط مربّعات الانحرافات عن المتوسط الحسابي، ما يمنحه تعريفًا رياضيًا دقيقًا قائمًا على العزوم المركزية، إذ يُمثِّل العزمَ المركزيَّ من الرُّتبة الثانية في نظرية الاحتمالات. تمنح هذه البنية الرياضية التبايُنَ خصائصَ تحليليةً مهمّةً تجعله مُناسبًا للاستخدام في النماذج الاحتمالية والاستدلالية.
من أبرز مزايا التبايُن أنه يتمتّع بخصائص جبرية واضحة تُسهّل المعالجة الرياضية؛ فإذا كان المُتغيّر العشوائي الجديد ناتجًا من تحويلٍ خطيٍّ لمُتغيّرٍ أصليّ، فإن التبايُن يتغيّر بنسبة مربّع معامل التحويل، ولا يتأثر كذلك بإضافة ثابت إلى جميع القيم. كذلك فإن تبايُن مجموع متغيرَيْن عشوائيَّيْن مُستقلَّيْن يساوي مجموع تبايناتهما، وهي خصيصة أساسية في نظرية الاحتمالات وتطبيقاتها.
يُمثِّل التبايُن الأساس الذي يُشتَقّ منه الانحراف المعياري، ويدخل بصورة جوهرية في كثيرٍ من الأساليب الإحصائية المتقدّمة، مثل تحليل التبايُن الذي يُستخدَم لاختبار الفروق بين متوسّطات مجموعات متعددة، فضلًا عن دَوْره في نماذج الانحدار واختبارات الفرضيات ونظرية التقدير. لذلك، يُعَدّ التبايُن مُكوِّنًا بنيويًا في الإطار النظري للإحصاء الرياضي.
ورغم هذه المزايا، فإن للتبايُن بعض القيود التي ينبغي مراعاتها عند تفسيره عمليًا، فهو يُقاس بوحدات مربّعة لوحدة القياس الأصلية للبيانات، ما قد يجعل تفسيره أقلّ مباشرةً من الانحراف المعياري الذي يُقاس بوحدة البيانات نفسها. كذلك فإن اعتماد التبايُن على تربيع الانحرافات يجعله حسَّاسًا للقِيَم المتطرّفة، إذ تؤثّر القِيَم البعيدة عن المتوسط تأثيرًا كبيرًا في قيمته، وهي خصيصة قد تكون مرغوبة في بعض السياقات التحليلية، لكنها قد تؤدّي إلى تضخيم مقياس التشتُّت في حال وجود قِيَمٍ شاذّة.
وعند مقارنته بمقاييس تشتُّت أخرى، مثل المدى الذي يعتمد فقط على القيمتَيْن الطرفيتَيْن، أو المدى الربيعي الذي يُعَدّ أكثر مقاومةً للقِيَم المتطرّفة، يتّضح أن لكل مقياسٍ مجال استخدامه المناسب تبعًا لطبيعة البيانات والغرض من التحليل. لذلك، يُستخدَم التباين على نطاق واسع في التحليل النظري والاستدلالي، بينما يُفضَّل الانحراف المعياري في العرض التفسيري للبيانات، لسهولة تفسيره، وارتباطه المباشر بوحدة القياس الأصلية[21].
تُوثّر القِيَم الشاذّة في زيادة قيمة التبايُن، إذ إن تربيع الفروق بين القِيَم والمتوسّط الحسابي يؤدّي إلى تضخيم إسهام القِيَم البعيدة عن مركز التوزيع، ومن ثم ارتفاع مقدار التبايُن بشكل واضح (الشكل 1).
التطبيقات
[الشكل 2] - العلاقة بين مقدار التبايُن ودرجة انتشار القِيَم حول المتوسّط في التوزيع الطبيعي
حذف الصورة؟
سيؤدي هذا إلى نقل الصورة إلى سلة المهملات.
يُعَدّ التباين أداةً إحصائية مهمّةً تُستخدَم في مجموعة واسعة من المجالات، لتوفير رؤًى عميقة بشأن طبيعة البيانات وتشتُّتها. ففي الإحصاء الوصفي، يساعد التبايُن على فَهْم كيفية توزيع القِيَم داخل مجموعة مُعيّنة. وفي مجال التحليل المالي، يُستخدَم لتقييم مدى تقلُّب أسعار الأسهم والعوائد على الاستثمارات، ما يُسهم في قياس مستوى المخاطرة. كذلك يؤدي دَوْرًا حيويًا في مجالات الجوْدة والتصنيع، حيث يُستخدَم لمراقبة استقرار خصائص المُنتَجات وضمان اتّساقها. أما في التعلُّم الآليّ، فيُعتمَد عليه لتحليل البيانات الضخمة وفَهْم مدى تشتُّت القِيَم المتنبَّأ بها عن القِيَم الحقيقية. وفي البحوث الطبية، يُستخدَم لدراسة اختلاف استجابات المرضى للعلاجات والأدوية، ما يسهم في تحسين دقّة الدراسات السريرية وفاعلية العلاج[22].
يؤثّر مقدار التباين في درجة انتشار القِيَم حول المتوسّط الحسابي μ في التوزيع الطبيعي (الشكل 2)؛ فزيادة التبايُن تؤدّي إلى اتّساع المنحنى وانتشار القِيَم على نطاق أكبر، بينما يؤدّي الانخفاض إلى تركّز القِيَم بصورة أكبر حول المتوسط، ما يجعل المنحنى أكثر حدّةً وضيقًا.
[1] Neil A. Weiss,
Introductory Statistics, 9th ed. (Harlow: Pearson Education Limited, 2012), pp. 101-115; كامل فليفل وفتحي حمدان،
الإحصاء (عمان: دار المناهج للنشر والتوزيع، 2020)، ص 76-85.
[2] المرجع نفسه.
[3] المرجع نفسه.
[4] المرجع نفسه.
[5] “Variance,”
Encyclopedia Britannica, 13/3/2026, accessed on 5/4/2026, at:
https://acr.ps/hByaQVu
[6] Sheldon M. Ross,
Introductory Statistics, 3rd ed. (Cambridge, MA: Academic Press, 2010), pp. 99-109.
[7] Ibid.
[8] فليفل وحمدان، مرجع سابق.
[9] Weiss,
op. cit.; “Variance,”
The GALE Encyclopedia of Science, 11/5/2018, accessed on 5/4/2026, at:
https://acr.ps/hByaQFR
[10] Ibid.
[11] Ross,
op. cit.
[12] حميد عويد العكلة [وآخرون]، مبادئ في الإحصاء والاحتمالات (الرياض: جامعة الملك سعود، كلية العلوم، [د. ت.])، ص 96-107؛ فليفل وحمدان، مرجع سابق.
[13] المرجع نفسه.
[14] المرجع نفسه؛ “Variances, Statistical Study of,”
International Encyclopedia of the Social Sciences, accessed on 5/4/2026, at:
https://acr.ps/hByaReF
[15] Eric W. Weisstein, “Variance,”
Wolfram MathWorld, accessed on 5/4/2026, at:
https://acr.ps/hByaRb7
[16] Ibid.
[17] Weiss, pp. 90-115.
[18] Ibid; فليفل وحمدان، الوحدة 2، 3.
[19] Ibid.
[20] "Variance,"
Encyclopedia Britannica.
[21] Weiss, chapters 3, 13.
[22] Ross, chapters 3, 8, 10.
المراجع
العربية
العكلة، حميد عويد [وآخرون].
مبادئ في الإحصاء والاحتمالات. الرياض: جامعة الملك سعود، كلية العلوم، [د.ت.].
فليفل، كامل، وفتحي حمدان.
الإحصاء. عمان: دار المناهج للنشر والتوزيع، 2020.
الأجنبية
Ross, Sheldon M.
Introductory Statistics. 3rd ed. Cambridge, MA: Academic Press, 2010.
Weiss, Neil A.
Introductory Statistics. 9th ed. Boston: Pearson, 2012.
“Variance.”
Encyclopædia Britannica. 13/3/2026. at
https://acr.ps/hByaQVu
“Variance.”
The GALE Encyclopedia of Science. 11/5/2018. at:
https://acr.ps/hByaQFR
“Variances, Statistical Study of.”
International Encyclopedia of the Social Sciences. Accessed February 16, 2026.
https://acr.ps/hByaReF
Weisstein, Eric W. “Variance.”
Wolfram MathWorld. at:
https://acr.ps/hByaRb7