Π Π°Π·Π±ΠΎΡ ΡΠΎΠ±Π΅ΡΠ΅Π΄ΠΎΠ²Π°Π½ΠΈΡ Π½Π° DSML-ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠ° (350 000 ΡΡΠ±.)
ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΡΠ΅Π·ΠΈΡΡ:
Π£ΡΠΏΠ΅Ρ
Π½Π° ΡΠΎΠ±Π΅ΡΠ΅Π΄ΠΎΠ²Π°Π½ΠΈΠΈ Π·Π°Π²ΠΈΡΠΈΡ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ ΠΎΡ Π·Π½Π°Π½ΠΈΡ ΡΠ°ΠΊΡΠΎΠ², Π½ΠΎ ΠΈ ΠΎΡ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΠΉ ΠΌΠ΅ΡΡΠΈΠΊ ΠΈ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.
ΠΠ°ΠΆΠ΄ΡΠΉ Π»ΠΈΡΠ½ΠΈΠΉ ΠΌΠ΅ΡΡΡ ΡΠ°ΠΌΠΎΡΡΠΎΡΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠΈ β ΡΡΠΎ ΡΠΏΡΡΠ΅Π½Π½ΡΠΉ Π΄ΠΎΡ
ΠΎΠ΄ (Π² IT ΠΌΠΎΠΆΠ½ΠΎ ΡΡΠ°Π·Ρ ΡΡΡΡΠΎΠΈΡΡΡΡ Π½Π° Π·Π°ΡΠΏΠ»Π°ΡΡ ΠΎΡ 200 000 ΡΡΠ±.).
ΠΠ°ΠΆΠ½ΠΎ ΡΠΌΠ΅ΡΡ ΠΎΠ±ΡΡΡΠ½ΡΡΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ ΠΈ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΈ ΠΏΡΠΎΡΡΡΠΌ ΡΠ·ΡΠΊΠΎΠΌ, ΠΏΡΠΎΠ³ΠΎΠ²Π°ΡΠΈΠ²Π°Ρ ΠΈΡ
ΡΠΈΠ»ΡΠ½ΡΠ΅ ΠΈ ΡΠ»Π°Π±ΡΠ΅ ΡΡΠΎΡΠΎΠ½Ρ.
ΠΠ°ΡΡΠΎΡΡΠΈΠΉ ΠΌΠ΅Π½ΡΠΎΡ ΡΡΠΊΠΎΡΡΠ΅Ρ ΠΏΡΡΡ ΠΊ ΠΎΡΡΠ΅ΡΡ, ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΡ ΠΎΠ±ΡΠ°ΡΠ½ΡΡ ΡΠ²ΡΠ·Ρ, Π³Π°ΡΠ°Π½ΡΠΈΠΈ ΠΈ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΡ.
ΠΡΠΈΠ±ΠΊΠ° Π² ΠΏΡΠΎΠ³Π½ΠΎΠ·ΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ ΡΠΏΡΠΎΡΠ°
ΠΠ΅ΡΡΠΈΠΊΠ° MAPE (Mean Absolute Percentage Error):
- ΠΡΠΎ ΡΡΠ΅Π΄Π½ΡΡ Π°Π±ΡΠΎΠ»ΡΡΠ½Π°Ρ ΠΏΡΠΎΡΠ΅Π½ΡΠ½Π°Ρ ΠΎΡΠΈΠ±ΠΊΠ°, ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°ΡΡΠ°Ρ, Π½Π°ΡΠΊΠΎΠ»ΡΠΊΠΎ Π² ΡΡΠ΅Π΄Π½Π΅ΠΌ ΠΏΡΠΎΠ³Π½ΠΎΠ· ΠΎΡΠΊΠ»ΠΎΠ½ΡΠ΅ΡΡΡ ΠΎΡ ΡΠ°ΠΊΡΠ° Π² ΠΏΡΠΎΡΠ΅Π½ΡΠ°Ρ .
- ΠΠ°Π½Π΄ΠΈΠ΄Π°Ρ Π½Π°Π·Π²Π°Π» MAPE (~18%), Π½ΠΎ Π½Π΅ ΠΎΠ±ΡΡΡΠ½ΠΈΠ» Π΅Ρ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΡ.
ΠΠ»ΡΡΠ΅Π²Π°Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠ° MAPE:
- ΠΠ΅ΡΡΠΈΠΊΠ° "Π»ΠΎΠΌΠ°Π΅ΡΡΡ" Π½Π° ΠΌΠ°Π»Π΅Π½ΡΠΊΠΈΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡΡ ΡΠΏΡΠΎΡΠ°. ΠΠ°ΠΆΠ΅ Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠ΅ Π°Π±ΡΠΎΠ»ΡΡΠ½ΠΎΠ΅ ΠΎΡΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ ΠΏΡΠΈ ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΎΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠΈ, Π±Π»ΠΈΠ·ΠΊΠΎΠΌ ΠΊ Π½ΡΠ»Ρ, Π΄Π°ΡΡ ΠΎΠ³ΡΠΎΠΌΠ½ΡΡ ΠΏΡΠΎΡΠ΅Π½ΡΠ½ΡΡ ΠΎΡΠΈΠ±ΠΊΡ.
- ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ: Π€Π°ΠΊΡ = 1, ΠΡΠΎΠ³Π½ΠΎΠ· = 3. ΠΠ±ΡΠΎΠ»ΡΡΠ½Π°Ρ ΠΎΡΠΈΠ±ΠΊΠ° = 2, Π½ΠΎ ΠΏΡΠΎΡΠ΅Π½ΡΠ½Π°Ρ ΠΎΡΠΈΠ±ΠΊΠ° β 200%.
- ΠΡΠΎ ΠΌΠΎΠΆΠ΅Ρ ΡΠΈΠ»ΡΠ½ΠΎ ΠΈΡΠΊΠ°ΠΆΠ°ΡΡ ΠΎΠ±ΡΡΡ ΠΊΠ°ΡΡΠΈΠ½Ρ, ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ Π² ΠΊΠ°ΡΠ΅Π³ΠΎΡΠΈΡΡ Ρ Π½ΠΈΠ·ΠΊΠΈΠΌ ΠΈΠ»ΠΈ Π½Π΅ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΡΠΌ ΡΠΏΡΠΎΡΠΎΠΌ.
Π§ΡΠΎ Π½ΡΠΆΠ½ΠΎ Π±ΡΠ»ΠΎ Π΄ΠΎΠ±Π°Π²ΠΈΡΡ Π² ΠΎΡΠ²Π΅Ρ:
- ΠΠ±ΡΡΡΠ½ΠΈΡΡ, Π² ΠΊΠ°ΠΊΠΈΡ ΡΠ»ΡΡΠ°ΡΡ MAPE Π°Π΄Π΅ΠΊΠ²Π°ΡΠ½Π° (ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΡΠΉ ΡΠΏΡΠΎΡ, Π½Π΅Ρ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ, Π±Π»ΠΈΠ·ΠΊΠΈΡ ΠΊ Π½ΡΠ»Ρ).
- Π£ΠΏΠΎΠΌΡΠ½ΡΡΡ, ΡΡΠΎ ΠΎΡΠΈΠ±ΠΊΠ° ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΡΠ°Π·Π½ΠΎΠΉ Π΄Π»Ρ ΡΠ°Π·Π½ΡΡ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ΠΎΠ² ΡΠΏΡΠΎΡΠ° (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π΄Π»Ρ ΡΡΠ΅Π΄Π½ΠΈΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ β ΠΌΠ΅Π½ΡΡΠ΅, Π΄Π»Ρ "Ρ Π²ΠΎΡΡΠΎΠ²" β Π±ΠΎΠ»ΡΡΠ΅).
ΠΠ΅ΡΡΠΈΠΊΠΈ Π² Π·Π°Π΄Π°ΡΠ΅ ΠΊΡΠ΅Π΄ΠΈΡΠ½ΠΎΠ³ΠΎ ΡΠΊΠΎΡΠΈΠ½Π³Π°
ΠΠ°Π½Π΄ΠΈΠ΄Π°Ρ Π½Π°Π·Π²Π°Π» Π±Π°Π·ΠΎΠ²ΡΠΉ Π½Π°Π±ΠΎΡ (Precision, Recall), Π½ΠΎ ΠΎΡΠ²Π΅Ρ Π±ΡΠ» ΠΏΠΎΠ²Π΅ΡΡ Π½ΠΎΡΡΠ½ΡΠΌ.
ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΌΠ΅ΡΡΠΈΠΊΠΈ Π΄Π»Ρ ΡΠΊΠΎΡΠΈΠ½Π³Π° ΠΈ ΡΡΠΎ ΠΎ Π½ΠΈΡ
Π½ΡΠΆΠ½ΠΎ Π·Π½Π°ΡΡ:
- AUC-ROC (ΠΈ Gini):
- ΠΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΡ (Π½Π°ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ°ΡΡΠΎ ΠΏΠ»ΠΎΡ ΠΎΠΉ ΠΊΠ»ΠΈΠ΅Π½Ρ ΠΏΠΎΠ»ΡΡΠ°Π΅Ρ ΡΠΊΠΎΡ Π²ΡΡΠ΅, ΡΠ΅ΠΌ Ρ ΠΎΡΠΎΡΠΈΠΉ).
- ΠΠ°ΠΆΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·Π°ΡΡ ΡΠ²ΡΠ·Ρ: Gini = 2 * AUC - 1.
- Precision ΠΈ Recall:
- ΠΠΎΠ»Π΅Π·Π½Ρ, Π½ΠΎ Π·Π°Π²ΠΈΡΡΡ ΠΎΡ Π²ΡΠ±ΡΠ°Π½Π½ΠΎΠ³ΠΎ ΠΏΠΎΡΠΎΠ³Π° ΠΎΡΡΠ΅ΡΠ΅Π½ΠΈΡ (threshold).
- Π-ΡΡΠ°ΡΠΈΡΡΠΈΠΊΠ° (K-S):
- ΠΡΠ°ΠΊΡΠΈΡΠ½Π°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ°, ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°ΡΡΠ°Ρ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΡΠ°Π·Π΄Π΅Π»Π΅Π½ΠΈΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠΉ Ρ ΠΎΡΠΎΡΠΈΡ ΠΈ ΠΏΠ»ΠΎΡ ΠΈΡ ΠΊΠ»ΠΈΠ΅Π½ΡΠΎΠ².
- Π‘ΡΠ°Π±ΠΈΠ»ΡΠ½ΠΎΡΡΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π²ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ:
- PSI (Population Stability Index) β ΠΌΠ΅ΡΡΠΈΠΊΠ°, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ ΠΎΡΠ΅Π½ΠΈΡΡ, Π½Π°ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΈΠ·ΠΌΠ΅Π½ΠΈΠ»ΠΎΡΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ Ρ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. ΠΡΡΠΎΠΊΠΈΠΉ PSI ΡΠΈΠ³Π½Π°Π»ΠΈΠ·ΠΈΡΡΠ΅Ρ, ΡΡΠΎ ΠΌΠΎΠ΄Π΅Π»Ρ ΡΠ°Π±ΠΎΡΠ°Π΅Ρ Π½Π° "Π΄ΡΡΠ³ΠΈΡ " Π΄Π°Π½Π½ΡΡ .
Average Precision (AP) ΠΈ PR-ΠΊΡΠΈΠ²Π°Ρ
PR-ΠΊΡΠΈΠ²Π°Ρ (Precision-Recall Curve):
- Π‘ΡΡΠΎΠΈΡΡΡ ΠΏΡΠΈ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΈ ΠΏΠΎΡΠΎΠ³Π° ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ Π±Π°Π»Π°Π½Ρ ΠΌΠ΅ΠΆΠ΄Ρ ΡΠΎΡΠ½ΠΎΡΡΡΡ (Precision) ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΠΎΠΉ (Recall).
Average Precision β ΡΡΠΎ ΠΏΠ»ΠΎΡΠ°Π΄Ρ ΠΏΠΎΠ΄ PR-ΠΊΡΠΈΠ²ΠΎΠΉ.
- ΠΠ°ΡΡ ΠΎΠ΄Π½Ρ ΠΈΡΠΎΠ³ΠΎΠ²ΡΡ ΠΎΡΠ΅Π½ΠΊΡ ΡΠ°Π½ΠΆΠΈΡΡΡΡΠ΅ΠΉ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· ΠΏΡΠΈΠ²ΡΠ·ΠΊΠΈ ΠΊ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΠΎΠΌΡ ΠΏΠΎΡΠΎΠ³Ρ.
- Π£Π΄ΠΎΠ±Π½Π° Π΄Π»Ρ Π·Π°Π΄Π°Ρ Ρ Π΄ΠΈΡΠ±Π°Π»Π°Π½ΡΠΎΠΌ ΠΊΠ»Π°ΡΡΠΎΠ² (ΠΏΠΎΠΈΡΠΊ, ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠΈΠΈ, Π°Π½ΡΠΈΡΡΠΎΠ΄).
- MAP (Mean Average Precision) β ΡΡΡΠ΅Π΄Π½Π΅Π½ΠΈΠ΅ AP ΠΏΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌ ΠΊΠ»Π°ΡΡΠ°ΠΌ ΠΈΠ»ΠΈ Π·Π°ΠΏΡΠΎΡΠ°ΠΌ.
ΠΡΠΎΠΊΠ»ΡΡΠΈΠ΅ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ (Curse of Dimensionality)
Π‘ΡΡΡ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ:
- Π ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅ΡΠ½ΠΎΠΌ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅ ΡΠ°ΡΡΡΠΎΡΠ½ΠΈΡ ΠΌΠ΅ΠΆΠ΄Ρ Π²ΡΠ΅ΠΌΠΈ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌΠΈ ΡΡΠ°Π½ΠΎΠ²ΡΡΡΡ ΠΏΡΠΈΠΌΠ΅ΡΠ½ΠΎ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡΠΌΠΈ.
- ΠΡΠΎ Π»ΠΎΠΌΠ°Π΅Ρ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΠ΅ Π½Π° ΡΠ°ΡΡΡΠΎΡΠ½ΠΈΡΡ (KNN, k-means).
Π‘ΠΏΠΎΡΠΎΠ±Ρ Π±ΠΎΡΡΠ±Ρ:
- PCA (Principal Component Analysis): ΠΠΈΠ½Π΅ΠΉΠ½ΠΎΠ΅ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ Π΄Π»Ρ ΡΠΎΠΊΡΠ°ΡΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ Ρ ΡΠΎΡ ΡΠ°Π½Π΅Π½ΠΈΠ΅ΠΌ ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡΠ½ΠΎΠΉ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ.
- t-SNE (t-Distributed Stochastic Neighbor Embedding): ΠΠ΅Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ ΠΌΠ΅ΡΠΎΠ΄, ΡΠ°ΡΡΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ.
- ΠΡΠ±ΠΎΡ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ²: ΠΠ°Π½ΡΠ°Π»ΡΠ½ΡΠΉ, Ρ ΠΏΠΎΠΌΠΎΡΡΡ L1-ΡΠ΅Π³ΡΠ»ΡΡΠΈΠ·Π°ΡΠΈΠΈ, ΠΈΡΠ΅ΡΠ°ΡΠΈΠ²Π½ΡΠΉ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΠ΅ΠΊΡΡΡΠΈΠ²Π½ΠΎΠ΅ ΠΈΡΠΊΠ»ΡΡΠ΅Π½ΠΈΠ΅).
- SVD (Singular Value Decomposition).
ΠΡΠ»ΡΡΠΈΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°ΡΠ½ΠΎΡΡΡ
ΠΡΠ»ΡΡΠΈΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°ΡΠ½ΠΎΡΡΡ β ΡΠΈΡΡΠ°ΡΠΈΡ, ΠΊΠΎΠ³Π΄Π° ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ ΡΠΈΠ»ΡΠ½ΠΎ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ ΡΠ²ΡΠ·Π°Π½Ρ ΠΌΠ΅ΠΆΠ΄Ρ ΡΠΎΠ±ΠΎΠΉ.
ΠΡΠΎΠ±Π»Π΅ΠΌΡ:
- ΠΠ΅ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΠΎΡΡΡ ΠΈ Π½Π΅ΠΈΠ½ΡΠ΅ΡΠΏΡΠ΅ΡΠΈΡΡΠ΅ΠΌΠΎΡΡΡ Π²Π΅ΡΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ (ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ "ΠΎΡΠΆΠΈΡΠ°ΡΡ" Π΄ΡΡΠ³ Π΄ΡΡΠ³Π°).
- ΠΠ°ΡΡΠΈΡΠ° ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² ΡΡΠ°Π½ΠΎΠ²ΠΈΡΡΡ ΠΏΠ»ΠΎΡ ΠΎ ΠΎΠ±ΡΡΠ»ΠΎΠ²Π»Π΅Π½Π½ΠΎΠΉ.
ΠΠΈΠ°Π³Π½ΠΎΡΡΠΈΠΊΠ° ΠΈ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅:
- ΠΠ΅ΡΡΠΈΠΊΠ°: VIF (Variance Inflation Factor). ΠΠ½Π°ΡΠ΅Π½ΠΈΠ΅ >5-10 β ΡΠΈΠ³Π½Π°Π» ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ.
- Π‘ΠΏΠΎΡΠΎΠ±Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ: Π£Π΄Π°Π»Π΅Π½ΠΈΠ΅ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ², PCA, ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΠ΅Π³ΡΠ»ΡΡΠΈΠ·Π°ΡΠΈΠΈ (L1/L2).
ΠΠΊΡΡΡΠ°ΠΏΠΎΠ»ΡΡΠΈΡ ΠΌΠΎΠ΄Π΅Π»ΡΠΌΠΈ
ΠΠ°ΠΊ ΡΠ°Π·Π½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π²Π΅Π΄ΡΡ ΡΠ΅Π±Ρ Π·Π° ΠΏΡΠ΅Π΄Π΅Π»Π°ΠΌΠΈ ΠΎΠ±ΡΡΠ°ΡΡΠ΅ΠΉ Π²ΡΠ±ΠΎΡΠΊΠΈ?
- ΠΠΈΠ½Π΅ΠΉΠ½Π°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ: Π£ΠΌΠ΅Π΅Ρ ΡΠΊΡΡΡΠ°ΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°ΡΡ (ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠ°Π΅Ρ Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ ΡΡΠ΅Π½Π΄).
- Π Π΅ΡΠ°ΡΡΠΈΠ΅ Π΄Π΅ΡΠ΅Π²ΡΡ (ΠΈ Random Forest): ΠΠ΅ ΡΠΌΠ΅ΡΡ ΡΠΊΡΡΡΠ°ΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°ΡΡ. ΠΠ° ΠΏΡΠ΅Π΄Π΅Π»Π°ΠΌΠΈ ΠΎΠ±ΡΡΠ°ΡΡΠ΅Π³ΠΎ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π° Π²ΡΠ΄Π°ΡΡ ΠΊΠΎΠ½ΡΡΠ°Π½ΡΠ½ΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ (ΠΏΠ»Π°ΡΠΎ), ΡΠ°ΠΊ ΠΊΠ°ΠΊ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠ΅ β ΡΡΠΎ ΡΡΠ΅Π΄Π½Π΅Π΅ Π² Π»ΠΈΡΡΠ΅.
- ΠΡΠ°Π΄ΠΈΠ΅Π½ΡΠ½ΡΠΉ Π±ΡΡΡΠΈΠ½Π³ Π½Π° Π΄Π΅ΡΠ΅Π²ΡΡΡ
: Π ΡΠ΅Π»ΠΎΠΌ ΡΠΎΠΆΠ΅ Π½Π΅ ΡΠΊΡΡΡΠ°ΠΏΠΎΠ»ΠΈΡΡΠ΅Ρ. Π‘Π»ΠΎΠΆΠ½Π°Ρ ΠΊΡΠΈΠ²Π°Ρ ΡΠΎΠ±ΠΈΡΠ°Π΅ΡΡΡ ΠΈΠ· ΠΊΡΡΠΎΡΠΊΠΎΠ² Π΄Π΅ΡΠ΅Π²ΡΠ΅Π², ΠΏΠΎΡΡΠΎΠΌΡ Π·Π° ΠΏΡΠ΅Π΄Π΅Π»Π°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ
ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ ΡΡΡΠ΅ΠΌΠΈΡΡΡ ΠΊ ΠΏΠ»Π°ΡΠΎ ΠΈΠ»ΠΈ Π·Π°ΡΡΡ
Π°Π½ΠΈΡ. ΠΡΡΠΎΠΊΠΈΠΉ
learning_rateΠ²Π΅Π΄ΡΡ ΠΊ Π½Π΅ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΏΠ΅ΡΠ΅ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ, Π° Π½Π΅ ΠΊ "Π²ΠΎΠ»ΡΠ΅Π±Π½ΠΎΠΉ" ΡΠΊΡΡΡΠ°ΠΏΠΎΠ»ΡΡΠΈΠΈ.
ΠΡΠ²ΠΎΠ΄Ρ
Π£Π²Π΅ΡΠ΅Π½Π½ΠΎΡΡΡ ΠΈ Π΄ΠΈΠ°Π»ΠΎΠ³ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ Π²Π°ΠΆΠ½Ρ, ΡΠ΅ΠΌ ΡΠ΅Ρ
Π½ΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π·Π½Π°Π½ΠΈΡ.
ΠΡΠΆΠ½ΠΎ Π½Π΅ ΠΏΡΠΎΡΡΠΎ ΠΏΠ΅ΡΠ΅ΡΠΈΡΠ»ΡΡΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ, Π° ΠΏΠΎΠ½ΠΈΠΌΠ°ΡΡ, Π΄Π»Ρ ΡΠ΅Π³ΠΎ ΠΊΠ°ΠΆΠ΄Π°Ρ Π½ΡΠΆΠ½Π° (ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅, ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΠΎΡΡΡ, ΠΏΠΎΡΠΎΠ³).
ΠΠ»ΡΠ±ΠΈΠ½Π° ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ (ΠΏΠΎΡΠ΅ΠΌΡ Π²ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠ°, ΠΊΠ°ΠΊ Π΅Ρ Π΄ΠΈΠ°Π³Π½ΠΎΡΡΠΈΡΠΎΠ²Π°ΡΡ ΠΈ ΡΠ΅ΡΠ°ΡΡ) ΠΎΡΠ»ΠΈΡΠ°Π΅Ρ ΡΠΈΠ»ΡΠ½ΠΎΠ³ΠΎ ΠΊΠ°Π½Π΄ΠΈΠ΄Π°ΡΠ°.
ΠΠ½Π²Π΅ΡΡΠΈΡΠΈΡ Π² ΠΌΠ΅Π½ΡΠΎΡΡΡΠ²ΠΎ Ρ ΡΡΡΠΊΠΈΠΌ ΠΏΠ»Π°Π½ΠΎΠΌ ΠΈ Π³Π°ΡΠ°Π½ΡΠΈΡΠΌΠΈ ΠΌΠΎΠΆΠ΅Ρ Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΡΠΎΠΊΡΠ°ΡΠΈΡΡ ΠΏΡΡΡ ΠΊ Π²ΡΡΠΎΠΊΠΎΠΎΠΏΠ»Π°ΡΠΈΠ²Π°Π΅ΠΌΠΎΠΉ ΠΏΠΎΠ·ΠΈΡΠΈΠΈ.