هذه صفحة لقطة ثنائية اللغة تم حفظها بواسطة المستخدم في 2025-6-30 17:49 لـ https://app.immersivetranslate.com/pdf-pro/2a3daac9-9ea1-4c56-b853-1e3d2627336c/، مقدمة بدعم ثنائي اللغة من قبل الترجمة الغامرة. تعلم كيفية الحفظ؟

إنشاء قواعد الارتباط لتحليل أداء الطلاب باستخدام خوارزمية Apriori

د. ماجدالين ديلايتا أنجيلين**أستاذ مساعد، قسم علوم الكمبيوتر والهندسة، كلية الدكتور جوبوب للهندسة، ثوثوكودي، تاميل نادو، الهند. البريد الإلكتروني: magdalenedelighta@gmail.com

خلاصة

يمكن تحقيق هدف المؤسسة التعليمية بتحقيق نتائج جيدة في امتحاناتها الأكاديمية باستخدام تقنيات التنقيب في البيانات، والتي تُستخدم للتنبؤ بأداء الطلاب وتعزيز جودة التعليم في المؤسسات التعليمية. يُستخدم التنقيب في البيانات لاستخلاص معلومات مفيدة وبناء علاقات بين المتغيرات المخزنة في مجموعات بيانات ضخمة. في هذه الورقة، نستخدم خوارزمية "أبريوري" التي تستخرج مجموعة القواعد الخاصة بكل صف، وتُحلل البيانات المُعطاة لتصنيف الطلاب بناءً على أدائهم الأكاديمي. يُصنف الطلاب بناءً على مشاركتهم في أداء الواجبات، واختبارات التقييم الداخلي، والحضور، وما إلى ذلك، مما يُساعد على التنبؤ بأداء الطالب بناءً على النمط المُستخرج من قاعدة البيانات التعليمية. يُساعد هذا على تحديد الطلاب المتوسطين والأقل من المتوسط، وتحسين أدائهم لتحقيق نتائج جيدة. يُساعد هذا التحليل أيضًا على مطابقة متطلبات المؤسسة مع ملف تعريف الطلاب لتوفير أماكن لهم. كما يُقاس مدى جاذبية القاعدة باستخدام الرفع بحد ذاته وكجزء من الصيغ. يُستخدم نطاق القيم التي قد يأخذها الرفع لتطبيع الرفع، مما يجعله أكثر فعالية كمقياس للجذب. تم توسيع نطاق هذا التوحيد ليشمل الحد الأدنى من الدعم وحدود الثقة.

الكلمات الرئيسية - أبْريوري، قواعد الارتباط، استخراج البيانات، اكتشاف المعرفة، تصفية القواعد
، الاختصارات - التعلم الحساس للتكلفة (CSL)، ملحقات استخراج البيانات (DMX)، اكتشاف المعرفة في قواعد البيانات (KDD)، الجانب الأيسر (LHS)، الجانب الأيمن (RHS)

أولا: المقدمة

التعليم عنصر أساسي لتنمية أي بلد. إن نقص المعرفة في نظام التعليم العالي يمكن أن يمنع إدارة النظام من تحقيق الجودة في التعليم. يمكن أن تساعد منهجية استخراج البيانات في ربط هذه الفجوات المعرفية في نظام التعليم العالي. يؤدي نموذج الطالب الأفضل إلى تعليم أفضل، مما يؤدي إلى تحسين التعلم. يؤدي تشخيص المهارات الأكثر دقة إلى توقع أفضل لما يعرفه الطالب مما يوفر تقييمًا أفضل. يؤدي التقييم الأفضل إلى تعلم أكثر كفاءة بشكل عام. تميل الأهداف الرئيسية لاستخراج البيانات في الممارسة العملية إلى التنبؤ والوصف [Agrawal et al.، 1994]. يتضمن التنبؤ بالأداء متغيرات مثل الحضور وعلامات IAT ودرجات الواجبات وما إلى ذلك في قاعدة بيانات الطلاب للتنبؤ بالقيم غير المعروفة. يعد استخراج البيانات هو العملية الأساسية لاكتشاف المعرفة في قواعد البيانات. إنها عملية استخراج الأنماط المفيدة من قاعدة البيانات الكبيرة. من أجل تحليل كمية كبيرة من المعلومات، يوفر مجال اكتشاف المعرفة في قواعد البيانات (KDD) تقنيات يتم من خلالها استخراج الأنماط المثيرة للاهتمام. لذلك، يستخدم KDD أساليب عند نقطة التقاطع بين التعلم الآلي والإحصاء
وأنظمة قواعد البيانات. استخراج البيانات هو تطبيق خوارزميات فعالة لاكتشاف الأنماط المرغوبة الموجودة داخل البيانات المقدمة.
يُعدّ استخراج قواعد الارتباط إحدى تقنيات استخراج البيانات التي يُتوقع أن تكون مفيدة للغاية في التطبيقات. وتُعدّ قواعد الارتباط ضرورية لضمان حد أدنى من الدعم والثقة في آنٍ واحد. يتكون إنشاء قواعد الارتباط من خطوتين: أولاً، يُطبّق حد أدنى من الدعم على مجموعة العناصر المُعطاة. ثانياً، باستخدام قواعد الحد الأدنى من الثقة ومجموعات العناصر المتكررة، يتمّ تكوين قواعد الارتباط. تتيح قواعد الارتباط معرفة قواعد من النوع: إذا كان A، فـ B، حيث يُمكن أن تكون A وB عناصر أو قيمًا أو كلمات مُحدّدة، إلخ. تتكون قاعدة الارتباط من مجموعتين من العناصر:
  1. السلف أو الجانب الأيسر (LHS)
  2. الجانب التالي أو الجانب الأيمن (RHS)
يصف العلاقة بين الدعم والثقة والاهتمام. ويشار عادةً إلى الدعم والثقة على أنهما مقياسان للاهتمام لقاعدة الارتباط. إن تعدين قواعد الارتباط هو عملية العثور على جميع قواعد الارتباط بشرط الحد الأدنى من الدعم والحد الأدنى من الثقة. في البداية، يتم حساب قيم الدعم والثقة لجميع القواعد ثم تتم مقارنتها بقيم العتبة للتقليم بقيمة منخفضة من الدعم
أو الثقة. اقترح أغاروال تعدين قواعد الارتباط. وقد تم تقديم العديد من الخوارزميات لتوليد قواعد الارتباط بمرور الوقت. ومن بين الخوارزميات المعروفة الشائعة Apriori و Eclat و FP-Growth التي تستخدم لتعدين مجموعات العناصر المتكررة. يستغل التعدين البيانات غير المتكررة وقيم الدعم الأدنى المرتفعة وقيم الثقة الأدنى المرتفعة. ومع ذلك، فإنه ينتج دائمًا كمية هائلة من القواعد.
تستخدم هذه الورقة قواعد الارتباط لاستخراج نمط أداء الطلاب باستخدام خوارزمية Apriori، مما سيساعد المؤسسة التعليمية على تحليل أداء الطلاب وتحسينه لتوفير فرص توظيف جيدة لهم. تقع على عاتق المؤسسة التعليمية مسؤولية تحقيق نتائج أفضل ووضع الطلاب في سوق العمل لبرنامج التدريب الداخلي. لكنها تواجه صعوبة في تحليل أداء الطلاب في المرحلة الأولية، مما قد يؤدي إلى نتائج ضعيفة في المؤسسة. وبالتالي، سيواجه الموظفون مشاكل في تحسين نتائج الطلاب. من ناحية أخرى، قد يجد بعض الطلاب صعوبة في الأداء الجيد في الامتحان. ونتيجة لذلك، أجريت هذه الدراسة لتحسين نتائج الطلاب من خلال تحليل النمط المستخرج من قواعد الارتباط.
وبالمثل، تدرس هذه الورقة البحثية أيضًا تحليل قواعد الجمعيات لاستخلاص نمط التوظيف الذي سيكون مفيدًا للقطاع في هذا المجال. تواجه المؤسسة التعليمية أيضًا صعوبة في مطابقة متطلبات المؤسسة مع ملف تعريف الطلاب لعدة أسباب. قد يؤدي هذا الوضع إلى عدم توافق بين متطلبات المؤسسة وخلفيات الطلاب، وبالتالي سيواجه الطلاب صعوبات في تقديم خدمة جيدة للشركة. من ناحية أخرى، قد تواجه الشركات أيضًا صعوبات في تدريب الطلاب وتكليفهم بمشروع. يجب أن يستند التوظيف إلى معايير محددة لخدمة المؤسسة والطالب على النحو الأمثل. على سبيل المثال، لا ينبغي إرسال الطالب المقيم في تشيناي إلى مؤسسة تقع في بنغالور، وذلك لتجنب المشاكل المتعلقة بالسكن والتكاليف المالية والاجتماعية. وقد تقرر أن يتوافق طلاب التدريب العملي مع متطلبات المؤسسة. ومع ذلك، نظرًا للعدد الكبير من الطلاب المسجلين في كل فصل دراسي، فإن مطابقة المؤسسة مع الطلاب عملية شاقة للغاية.

II. مراجعة الأدبيات

طُبِّق التنقيب في البيانات في العديد من الأعمال البحثية. ومن التقنيات الشائعة المستخدمة في التنقيب في البيانات في KDD لاكتشاف الأنماط قاعدة الارتباط [هيب وآخرون، 2000]. ووفقًا لأسامة م. فياض وغريغوري بياتيتسكي شابيرو (1996)، فإن قاعدة الارتباط تعني وجود علاقات ارتباط محددة بين مجموعة من العناصر. وقد جذبت هذه القاعدة اهتمامًا كبيرًا في أبحاث التنقيب في البيانات الحالية نظرًا لقدرتها على اكتشاف أنماط مفيدة لدعم القرار، والتسويق الانتقائي، والتنبؤ المالي، والتحليل الطبي، والعديد من التطبيقات الأخرى. تعمل تقنية قواعد الارتباط من خلال إيجاد جميع القواعد في قاعدة البيانات التي تُلبي الحد الأدنى المُحدد من الدعم والحد الأدنى من الثقة [بينغ ليو وآخرون، 1998].
خوارزمية استحثاث قواعد الارتباط هي خوارزمية Apriori التي أثبتت أنها تقنيات استخراج البيانات المقبولة في استخراج قواعد الارتباط [Agrawal et al.، 1994]، ونفذت خوارزمية Apriori لاستخراج قواعد الارتباط المنطقية أحادية البعد من قواعد البيانات المعاملاتية. القواعد التي تولدها خوارزمية Apriori تجعل من السهل على المستخدم فهم النتيجة وتطبيقها بشكل أكبر [Ma et al.، 2000]. استخدمت طريقة قاعدة الارتباط على وجه التحديد خوارزمية Apriori لتحديد العينات الجديدة وغير المتوقعة والمثيرة في مكافحة عدوى المستشفيات. استخدمت دراسة أخرى خوارزمية Apriori لتوليد مجموعات العناصر المتكررة وصممت نموذجًا للتنبؤ الاقتصادي، وعرضت أساليبها في النمذجة واستنتاج نية المستخدم من خلال البيانات. عادةً ما تكون قواعد الارتباط مطلوبة لتلبية الحد الأدنى من الدعم والحد الأدنى من الثقة المحدد من قبل المستخدم في نفس الوقت.
في Kotsiantis et al.، (2004)، تم استخدام خوارزمية بايز الساذجة للتنبؤ بأداء الطلاب ووجد أن الدقة الإجمالية 72.48 % 72.48 % 72.48%72.48 \%. تمت دراسة العلاقة بين نتائج امتحانات القبول الجامعي للطلاب باستخدام تقنية التجميع K-means التي تمت من خلالها دراسة النجاح [Erdogan & Timor، 2005]. يتم التنبؤ بأداء طالب المدرسة الثانوية من خلال تحليل النتيجة باستخدام تقنيات التعدين في البيانات مثل أشجار القرار والغابات العشوائية والشبكات العصبية وآلات المتجهات الداعمة. تكشف النتائج التي تم الحصول عليها أنه من الممكن تحقيق دقة تنبؤية عالية [Cortez & Silva، 2008]. في Alaa el-Hlees (2009)، يتم تطبيق تقنية التعدين في البيانات لاكتشاف قواعد الارتباط ويتم فرز قواعد الارتباط المكتشفة وفقًا لقيمة الرفع. ثم يتم تطبيق تقنية التجميع EM التي يتم من خلالها اكتشاف القيم المتطرفة والتنبؤ بالأداء. يتم استخدام تقنيات نظام التوصية لتعدين البيانات التعليمية للتنبؤ بأداء الطلاب. تركز هذه التقنية بشكل أساسي على التركيز على تقليل الحمل الزائد للمعلومات والعمل كمرشحات للمعلومات [ThaiNghe et al.، 2010]. في دراسة تاي-نغي وآخرون (2011، 2011أ)، استُخدم نظام توصية للتنبؤ بأداء الطالب. وتُستخدم معلومات كل طالب على حدة للتنبؤ بأدائه. ويُعالج اختلال التوازن بين الفئات في البيانات باستخدام إعادة العينة والتعلم الحساس للتكلفة (CSL) باستخدام آلات المتجهات الداعمة، مما يُقلل من سوء التصنيف ويُحسّن دقة التصنيف [جي بي-زادوك وآخرون، 2007؛ تاي-نغي، 2010أ].
تُستخدم تقنية قواعد الارتباط لتعدين البيانات في Magdalene Delighta Angeline & Samuel Peter James (2012)، وتستخرج هذه الورقة معلومات مفيدة من مجموعة كبيرة من البيانات. وبالمثل، تُطبق هذه التقنية على بيانات الطلاب. في Magdalene Delighta Angeline & Samuel Peter James (2012)، تُستخدم التقنيات المذكورة أعلاه لمطابقة المنظمة مع الطلاب. هذه العملية تتطلب الكثير من الجهد وتتضمن عددًا من الخطوات. في Magdalene Delighta Angeline & Samuel Peter James (2012)، توفر تقنية قواعد الارتباط المعلومات المستخرجة. من ناحية أخرى، في هذه الورقة، يؤدي إنشاء استعلامات ملحقات تعدين البيانات (DMX) وتطبيقها على نموذج قواعد الارتباط إلى الحصول على معلومات محددة بناءً على ما يريد المعلم معرفته عن أنماط سلوك الطلاب. هنا، تولد خوارزمية Apriori mend التي تمت مناقشتها قواعد بواسطة
92.86 % 92.86 % 92.86%92.86 \%.
تستخدم هذه الدراسة خوارزمية "أبريوري"، وتُطبّق هذه التقنية على أداء الطلاب أكاديميًا وفي التقييم. تُستخدم هذه التقنية لوضع قواعد ذات... 100 % 100 % 100%100 \%ثقة.

ثالثًا: خوارزمية الاستباق

يوضح الشكل 1 خوارزمية "أبريوري". تعتمد المرحلة الأولى من الخوارزمية على عدّ تكرارات العناصر لتحديد مجموعات العناصر الكبيرة المكونة من عنصر واحد. تتضمن المرحلة المتتالية k مرحلتين: في البداية، يتم تحديد مجموعات العناصر الكبيرة ل ك - 1 ل ك - 1 L_(k-1)\mathrm{L}_{\mathrm{k}-1}وجدت في ( ك - 1 ) ذ ( ك - 1 ) ذ  (k-1)^("th ")(k-1)^{th}يتم استخدام المرور لإنشاء مجموعات العناصر المرشحة ج ك ج ك ج_(ك)\mathrm{C}_{\mathrm{k}}. ثم يتم مسح قاعدة البيانات ودعم المرشحين في ج ك ج ك ج_(ك)\mathrm{C}_{\mathrm{k}}يتم احتسابها. من الضروري تحديد المرشحين في ج ك ج ك ج_(ك)\mathrm{C}_{\mathrm{k}}للعد السريع الموجود في معاملة معينة ت ت تت.
الجدول 1 - خوارزمية أبريوري
\(\mathrm{L}_{1}=\{\) frequent items \(\}\);
for ( \(\mathrm{k}=2 ; \mathrm{L}_{\mathrm{k}-1}!=\varnothing ; \mathrm{k}++\) ) do begin
\(\mathrm{C}_{\mathrm{k}}=\) candidates generated from \(\mathrm{L}_{\mathrm{k}-1}\)
for each transaction \(t\) in database do
    The count that are enclosed in \(t\) of all candidates in
    \(\mathrm{C}_{\mathrm{k}}\) is to be incremented
\(\mathrm{L}_{\mathrm{k}}=\) candidates in \(\mathrm{C}_{\mathrm{k}}\) with min_sup
end
return \(\cup_{\mathrm{k}} \mathrm{L}_{\mathrm{k}}\);

رابعًا. التنفيذ

في المؤسسات التعليمية، يُحدَّد الأداء العام للطالب من خلال التقييم الداخلي والخارجي. يُجرى التقييم الداخلي بناءً على درجات واجبات الطالب، واختباراته الصفية، وأعماله المعملية، وحضوره، ودرجاته في الفصل الدراسي السابق، ومشاركته في الأنشطة اللامنهجية. وفي الوقت نفسه، يُجرى التقييم الخارجي للطالب بناءً على درجاته في الامتحان النهائي. يساعد النموذج المقترح على التنبؤ بأداء الطلاب، سواءً كان ضعيفًا أو متوسطًا أو جيدًا، بناءً على أدائهم الصفي، بالإضافة إلى حضورهم، وذلك من خلال القواعد المُحدَّدة.

4.1. مجموعة البيانات

تم الحصول على مجموعة البيانات المستخدمة في هذه الدراسة من قسم علوم الكمبيوتر، كلية دكتور جوبوب للهندسة في عام 2011-2012.

4.2. عملية استخراج البيانات

خطوات عملية استخراج البيانات هي كما يلي:

4.2.1. اختيار البيانات

تم توليد البيانات من تقارير مختلفة لاختبار التقييم الداخلي (IAT)، والواجبات، والإرشاد الشخصي. تتضمن البيانات الأولية التفاصيل التي جُمعت من ٢١ طالبًا، مع إدراج ١٥ سمة، تشمل رقم التسجيل، والبرنامج، والمدة، والبرنامج.
الرمز، درجة اختبار IAT، الجنس، العنوان، المدينة 1، المدينة 2، النسبة المئوية، علامة الواجب، تسليم الواجب، الإجابة الصحيحة، الثقة بالنفس، مستوى تعليم الوالدين، العجز المالي، الاهتمام، وطموح الحصول على الشهادة. تحتوي البيانات على أنواع مختلفة من القيم، إما نصية أو رقمية. يُمثل الهدف في تقرير تحليلي. صُنف تقرير التحليل وفقًا لثلاث فئات (جيد، متوسط، وضعيف). السمات المحددة هي درجة اختبار IAT، تسليم الواجب، درجة الواجب، الإجابة الصحيحة، الثقة بالنفس، الاهتمام، وطموح الحصول على الشهادة. ثم عُولجت البيانات لإنشاء القواعد.

4.2.2. تحويل البيانات

تم تطبيق التحويل على سمات الإجابة الصحيحة وعلامات التعيين. تُستخدم القواعد التالية لتحويل علامات التعيين إلى بيانات نصية.
  • إذا كانت علامة التعيين = 9 = 9 =9=9حتى الساعة 10 ثم استبدل درجة الواجب بـ A
  • إذا كانت علامة التعيين = 7 = 7 =7=7حتى الساعة 8 ثم استبدل درجة الواجب بـ B
  • إذا كانت علامة التعيين = 5 = 5 =5=5حتى الساعة 6 ثم استبدل درجة الواجب بـ C
  • إذا كانت علامة التعيين = 3 = 3 =3=3حتى الساعة 4 ثم استبدل درجة الواجب بـ D
  • إذا كانت علامة التعيين = 1 = 1 =1=1حتى 2 ثم استبدل درجة الواجب بـ E وبالمثل، يتم استخدام القواعد التالية لتحويل النسبة المئوية إلى بيانات سلسلة
  • إذا كانت النسبة المئوية = 81 = 81 =81=81حتى 90 ثم استبدل النسبة المئوية بـ S
  • إذا كانت النسبة المئوية = 75 = 75 =75=75حتى 80 ثم استبدل النسبة المئوية بـ A
  • إذا كانت النسبة المئوية = 70 = 70 =70=70حتى 74 ثم استبدل النسبة المئوية بـ B
  • إذا كانت النسبة المئوية = 65 = 65 =65=65حتى 69 ثم استبدل النسبة المئوية بـ C وكانت البيانات جاهزة بعد ذلك للتعدين باستخدام قواعد الارتباط.

4.2.3. إنشاء القواعد

تم تطبيق قواعد الارتباط باستخدام خوارزمية Apriori التي تمت مناقشتها في القسم 3 لتوليد القواعد.

خامسًا: مناقشة النتيجة

من نتائج التجربة، وُجد أن خوارزمية أبْريوري تُستخدم للحصول على قواعد دنيا. ومن النمط المُستخرج، وُجد أن خوارزمية أبْريوري فعّالة في التنبؤ بأداء الطالب ضمن ثلاث فئات: جيد، ومتوسط، وضعيف. بلغ عدد المعاملات المُستخدمة في هذه التجربة 21 معاملة. مُعاملات خوارزمية أبْريوري هي: الحد الأدنى للدعم، والحد الأدنى للثقة، والحد الأقصى لطول القاعدة، وترشيح الرفع [توشر وجاهر، 2010]. وتُقاس أهمية القاعدة باستخدام قيمة الرفع.
النص الأصلي
تقييم هذه الترجمة
سيتم استخدام ملاحظاتك وآرائك للمساعدة في تحسين "ترجمة Google".