EGYADMIN commited on
Commit
007ac13
·
verified ·
1 Parent(s): 909f585

Delete models

Browse files
models/README.md DELETED
@@ -1,52 +0,0 @@
1
- # نماذج التعلم الآلي
2
-
3
- يحتوي هذا المجلد على نماذج التعلم الآلي المستخدمة في نظام تسعير المناقصات.
4
-
5
- ## هيكل المجلد
6
-
7
- - `trained/`: يحتوي على النماذج المدربة جاهزة للاستخدام
8
- - `datasets/`: يحتوي على مجموعات البيانات المستخدمة في تدريب النماذج
9
-
10
- ## النماذج المستخدمة
11
-
12
- يستخدم النظام مجموعة من نماذج التعلم الآلي تشمل:
13
-
14
- 1. **نموذج التنبؤ بالتكاليف**: يستخدم لتقدير تكاليف المشاريع بناءً على خصائص المشروع
15
- 2. **نموذج تقييم المخاطر**: يقيم المخاطر المحتملة للمشروع ويقدر تأثيرها
16
- 3. **نموذج التنبؤ بالمحتوى المحلي**: يتنبأ بنسبة المحتوى المحلي المتوقعة للمشروع
17
- 4. **نموذج التصنيف الذكي للمستندات**: يصنف مستندات المناقصة تلقائيًا
18
- 5. **نموذج التعرف على الكيانات**: يستخرج الكيانات المهمة من مستندات المناقصة
19
-
20
- ## كيفية استخدام النماذج
21
-
22
- لاستخدام النماذج في التطبيق:
23
-
24
- ```python
25
- from models.inference import load_cost_prediction_model, predict_cost
26
-
27
- # تحميل النموذج
28
- model = load_cost_prediction_model()
29
-
30
- # التنبؤ
31
- features = {
32
- 'project_type': 'construction',
33
- 'area': 5000,
34
- 'location': 'Riyadh',
35
- 'duration_months': 18
36
- }
37
-
38
- predicted_cost = predict_cost(model, features)
39
- print(f"التكلفة المتوقعة: {predicted_cost} ريال")
40
- ```
41
-
42
- ## تدريب النماذج
43
-
44
- يمكن إعادة تدريب النماذج باستخدام البيانات الجديدة من خلال:
45
-
46
- ```python
47
- from models.training import train_cost_prediction_model
48
-
49
- # تدريب النموذج
50
- train_cost_prediction_model(new_data_path="datasets/new_cost_data.csv",
51
- output_model_path="trained/cost_prediction_v2.pkl")
52
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
models/datasets/README.md DELETED
@@ -1,61 +0,0 @@
1
- # مجموعات البيانات
2
-
3
- يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات.
4
-
5
- ## المجموعات المتوفرة
6
-
7
- - `cost_data.csv`: بيانات تكاليف المشاريع السابقة
8
- - `risk_data.csv`: بيانات المخاطر وتأثيراتها
9
- - `local_content_data.csv`: بيانات المحتوى المحلي
10
- - `documents_data.csv`: بيانات المستندات المصنفة
11
- - `entities_data.csv`: بيانات الكيانات المستخرجة
12
-
13
- ## هيكل مجموعات البيانات
14
-
15
- ### cost_data.csv
16
-
17
- بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع:
18
-
19
- | العمود | الوصف | النوع |
20
- |--------|-------|------|
21
- | project_id | رقم المشروع | نص |
22
- | project_type | نوع المشروع | نص |
23
- | location | الموقع | نص |
24
- | area | المساحة (م²) | رقم |
25
- | floors | عدد الطوابق | رقم |
26
- | duration_months | مدة التنفيذ (شهور) | رقم |
27
- | tender_type | نوع المناقصة | نص |
28
- | client_type | نوع العميل | نص |
29
- | total_cost | إجمالي التكلفة | رقم |
30
- | cost_per_sqm | تكلفة المتر المربع | رقم |
31
- | material_cost | تكلفة المواد | رقم |
32
- | labor_cost | تكلفة العمالة | رقم |
33
- | equipment_cost | تكلفة المعدات | رقم |
34
- | overhead_percentage | نسبة المصاريف العامة | رقم |
35
-
36
- ### risk_data.csv
37
-
38
- بيانات المخاطر وتأثيراتها:
39
-
40
- | العمود | الوصف | النوع |
41
- |--------|-------|------|
42
- | risk_id | رقم المخاطرة | نص |
43
- | project_id | رقم المشروع | نص |
44
- | risk_category | فئة المخاطرة | نص |
45
- | risk_description | وصف المخاطرة | نص |
46
- | impact | التأثير | نص |
47
- | probability | الاحتمالية | نص |
48
- | risk_score | درجة المخاطرة | رقم |
49
- | response_strategy | استراتيجية الاستجابة | نص |
50
- | actual_impact | التأثير الفعلي | نص |
51
- | actual_cost | التكلفة الفعلية | رقم |
52
-
53
- ## الإحصاءات
54
-
55
- - عدد المشاريع: 500+
56
- - الفترة الزمنية: 2018-2024
57
- - التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية
58
-
59
- ## الترخيص والقيود
60
-
61
- هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
models/trained/README.md DELETED
@@ -1,27 +0,0 @@
1
- # النماذج المدربة
2
-
3
- يحتوي هذا المجلد على النماذج المدربة الجاهزة للاستخدام في نظام تسعير المناقصات.
4
-
5
- ## النماذج المتوفرة
6
-
7
- - `cost_prediction.pkl`: نموذج التنبؤ بالتكاليف (Random Forest)
8
- - `risk_assessment.pkl`: نموذج تقييم المخاطر (Gradient Boosting)
9
- - `local_content_prediction.pkl`: نموذج التنبؤ بالمحتوى المحلي (XGBoost)
10
- - `document_classifier.pkl`: نموذج تصنيف المستندات (BERT فائق)
11
- - `entity_recognition.pkl`: نموذج التعرف على الكيانات (BiLSTM-CRF)
12
-
13
- ## إصدارات النماذج
14
-
15
- | النموذج | الإصدار | تاريخ التدريب | المؤشرات الرئيسية | مجموعة التدريب |
16
- |---------|---------|----------------|-------------------|----------------|
17
- | cost_prediction.pkl | v1.2 | 2024-02-15 | MAE: 45,000 ريال | 500 مشروع |
18
- | risk_assessment.pkl | v1.1 | 2024-02-10 | Accuracy: 87% | 350 مشروع |
19
- | local_content_prediction.pkl | v1.0 | 2024-01-25 | RMSE: 3.2% | 280 مشروع |
20
- | document_classifier.pkl | v2.1 | 2024-03-01 | F1: 0.92 | 1200 مستند |
21
- | entity_recognition.pkl | v1.3 | 2024-03-05 | F1: 0.88 | 800 مستند |
22
-
23
- ## ملاحظات الاستخدام
24
-
25
- - تم تدريب النماذج على بيانات مشاريع البناء والإنشاءات في المملكة العربية السعودية
26
- - يتم تحديث النماذج بشكل دوري كل 3 أشهر لضمان دقتها
27
- - للحصول على أفضل النتائج، استخدم البيانات بنفس التنسيق المستخدم في التدريب