و عشان نستوعب ايش التحسين الي صار:
بالطريقة العادية مثلا راح يستغرق التدريب كامل دقيقتين لكن راح نحتاج لعدد معين من تكرار التدريب مثال 300 مرة حتى يصل للقيم الصحيحة
ف الوقت الإجمالي = الزمن للتدريب * عدد مرات التدريب.
ايضا بطريقة Mini-batch لأن عندنا اكثر من باتش راح يكون التدريب على مراحل وكل مرحلة تاخذ زمن ف الزمن الإجمالي للتدريب بيكون اكبر لكن الفرق انه يحتاج عدد اقل بكثير من مرات التدريب لأنه بكل مره يستخدم الثيتا ( القيم المحسنة ) السابقة من الباتش السابق.
ف فعليا بكل مره يقترب من القيم الصحيحة بالتالي الوقت الاجمالي بيكون اقل.
بالصورة توضيح :
الطريقة العادية معادلة الخطأ راح تقل بعد نهاية التدريب وسوف تصل للقيم المثالية لكن بعد وقت كبير
اما Mini-batch فنلاحظ تذبذب كثير بمعادلة الخطأ وذلك بسبب ان التدريب يتم على اجزاء ف مع كل جزء تتغير قيمتها تزيد او تقل إلى أن تتحسن.