Delete models
Browse files- models/README.md +0 -52
- models/datasets/README.md +0 -61
- models/trained/README.md +0 -27
models/README.md
DELETED
@@ -1,52 +0,0 @@
|
|
1 |
-
# نماذج التعلم الآلي
|
2 |
-
|
3 |
-
يحتوي هذا المجلد على نماذج التعلم الآلي المستخدمة في نظام تسعير المناقصات.
|
4 |
-
|
5 |
-
## هيكل المجلد
|
6 |
-
|
7 |
-
- `trained/`: يحتوي على النماذج المدربة جاهزة للاستخدام
|
8 |
-
- `datasets/`: يحتوي على مجموعات البيانات المستخدمة في تدريب النماذج
|
9 |
-
|
10 |
-
## النماذج المستخدمة
|
11 |
-
|
12 |
-
يستخدم النظام مجموعة من نماذج التعلم الآلي تشمل:
|
13 |
-
|
14 |
-
1. **نموذج التنبؤ بالتكاليف**: يستخدم لتقدير تكاليف المشاريع بناءً على خصائص المشروع
|
15 |
-
2. **نموذج تقييم المخاطر**: يقيم المخاطر المحتملة للمشروع ويقدر تأثيرها
|
16 |
-
3. **نموذج التنبؤ بالمحتوى المحلي**: يتنبأ بنسبة المحتوى المحلي المتوقعة للمشروع
|
17 |
-
4. **نموذج التصنيف الذكي للمستندات**: يصنف مستندات المناقصة تلقائيًا
|
18 |
-
5. **نموذج التعرف على الكيانات**: يستخرج الكيانات المهمة من مستندات المناقصة
|
19 |
-
|
20 |
-
## كيفية استخدام النماذج
|
21 |
-
|
22 |
-
لاستخدام النماذج في التطبيق:
|
23 |
-
|
24 |
-
```python
|
25 |
-
from models.inference import load_cost_prediction_model, predict_cost
|
26 |
-
|
27 |
-
# تحميل النموذج
|
28 |
-
model = load_cost_prediction_model()
|
29 |
-
|
30 |
-
# التنبؤ
|
31 |
-
features = {
|
32 |
-
'project_type': 'construction',
|
33 |
-
'area': 5000,
|
34 |
-
'location': 'Riyadh',
|
35 |
-
'duration_months': 18
|
36 |
-
}
|
37 |
-
|
38 |
-
predicted_cost = predict_cost(model, features)
|
39 |
-
print(f"التكلفة المتوقعة: {predicted_cost} ريال")
|
40 |
-
```
|
41 |
-
|
42 |
-
## تدريب النماذج
|
43 |
-
|
44 |
-
يمكن إعادة تدريب النماذج باستخدام البيانات الجديدة من خلال:
|
45 |
-
|
46 |
-
```python
|
47 |
-
from models.training import train_cost_prediction_model
|
48 |
-
|
49 |
-
# تدريب النموذج
|
50 |
-
train_cost_prediction_model(new_data_path="datasets/new_cost_data.csv",
|
51 |
-
output_model_path="trained/cost_prediction_v2.pkl")
|
52 |
-
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
models/datasets/README.md
DELETED
@@ -1,61 +0,0 @@
|
|
1 |
-
# مجموعات البيانات
|
2 |
-
|
3 |
-
يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات.
|
4 |
-
|
5 |
-
## المجموعات المتوفرة
|
6 |
-
|
7 |
-
- `cost_data.csv`: بيانات تكاليف المشاريع السابقة
|
8 |
-
- `risk_data.csv`: بيانات المخاطر وتأثيراتها
|
9 |
-
- `local_content_data.csv`: بيانات المحتوى المحلي
|
10 |
-
- `documents_data.csv`: بيانات المستندات المصنفة
|
11 |
-
- `entities_data.csv`: بيانات الكيانات المستخرجة
|
12 |
-
|
13 |
-
## هيكل مجموعات البيانات
|
14 |
-
|
15 |
-
### cost_data.csv
|
16 |
-
|
17 |
-
بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع:
|
18 |
-
|
19 |
-
| العمود | الوصف | النوع |
|
20 |
-
|--------|-------|------|
|
21 |
-
| project_id | رقم المشروع | نص |
|
22 |
-
| project_type | نوع المشروع | نص |
|
23 |
-
| location | الموقع | نص |
|
24 |
-
| area | المساحة (م²) | رقم |
|
25 |
-
| floors | عدد الطوابق | رقم |
|
26 |
-
| duration_months | مدة التنفيذ (شهور) | رقم |
|
27 |
-
| tender_type | نوع المناقصة | نص |
|
28 |
-
| client_type | نوع العميل | نص |
|
29 |
-
| total_cost | إجمالي التكلفة | رقم |
|
30 |
-
| cost_per_sqm | تكلفة المتر المربع | رقم |
|
31 |
-
| material_cost | تكلفة المواد | رقم |
|
32 |
-
| labor_cost | تكلفة العمالة | رقم |
|
33 |
-
| equipment_cost | تكلفة المعدات | رقم |
|
34 |
-
| overhead_percentage | نسبة المصاريف العامة | رقم |
|
35 |
-
|
36 |
-
### risk_data.csv
|
37 |
-
|
38 |
-
بيانات المخاطر وتأثيراتها:
|
39 |
-
|
40 |
-
| العمود | الوصف | النوع |
|
41 |
-
|--------|-------|------|
|
42 |
-
| risk_id | رقم المخاطرة | نص |
|
43 |
-
| project_id | رقم المشروع | نص |
|
44 |
-
| risk_category | فئة المخاطرة | نص |
|
45 |
-
| risk_description | وصف المخاطرة | نص |
|
46 |
-
| impact | التأثير | نص |
|
47 |
-
| probability | الاحتمالية | نص |
|
48 |
-
| risk_score | درجة المخاطرة | رقم |
|
49 |
-
| response_strategy | استراتيجية الاستجابة | نص |
|
50 |
-
| actual_impact | التأثير الفعلي | نص |
|
51 |
-
| actual_cost | التكلفة الفعلية | رقم |
|
52 |
-
|
53 |
-
## الإحصاءات
|
54 |
-
|
55 |
-
- عدد المشاريع: 500+
|
56 |
-
- الفترة الزمنية: 2018-2024
|
57 |
-
- التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية
|
58 |
-
|
59 |
-
## الترخيص والقيود
|
60 |
-
|
61 |
-
هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
models/trained/README.md
DELETED
@@ -1,27 +0,0 @@
|
|
1 |
-
# النماذج المدربة
|
2 |
-
|
3 |
-
يحتوي هذا المجلد على النماذج المدربة الجاهزة للاستخدام في نظام تسعير المناقصات.
|
4 |
-
|
5 |
-
## النماذج المتوفرة
|
6 |
-
|
7 |
-
- `cost_prediction.pkl`: نموذج التنبؤ بالتكاليف (Random Forest)
|
8 |
-
- `risk_assessment.pkl`: نموذج تقييم المخاطر (Gradient Boosting)
|
9 |
-
- `local_content_prediction.pkl`: نموذج التنبؤ بالمحتوى المحلي (XGBoost)
|
10 |
-
- `document_classifier.pkl`: نموذج تصنيف المستندات (BERT فائق)
|
11 |
-
- `entity_recognition.pkl`: نموذج التعرف على الكيانات (BiLSTM-CRF)
|
12 |
-
|
13 |
-
## إصدارات النماذج
|
14 |
-
|
15 |
-
| النموذج | الإصدار | تاريخ التدريب | المؤشرات الرئيسية | مجموعة التدريب |
|
16 |
-
|---------|---------|----------------|-------------------|----------------|
|
17 |
-
| cost_prediction.pkl | v1.2 | 2024-02-15 | MAE: 45,000 ريال | 500 مشروع |
|
18 |
-
| risk_assessment.pkl | v1.1 | 2024-02-10 | Accuracy: 87% | 350 مشروع |
|
19 |
-
| local_content_prediction.pkl | v1.0 | 2024-01-25 | RMSE: 3.2% | 280 مشروع |
|
20 |
-
| document_classifier.pkl | v2.1 | 2024-03-01 | F1: 0.92 | 1200 مستند |
|
21 |
-
| entity_recognition.pkl | v1.3 | 2024-03-05 | F1: 0.88 | 800 مستند |
|
22 |
-
|
23 |
-
## ملاحظات الاستخدام
|
24 |
-
|
25 |
-
- تم تدريب النماذج على بيانات مشاريع البناء والإنشاءات في المملكة العربية السعودية
|
26 |
-
- يتم تحديث النماذج بشكل دوري كل 3 أشهر لضمان دقتها
|
27 |
-
- للحصول على أفضل النتائج، استخدم البيانات بنفس التنسيق المستخدم في التدريب
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|