ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

АнсамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ машинного обучСния

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ я Ρ€Π΅ΡˆΠΈΠ» ΠΎΡΠ²Π΅Ρ‚ΠΈΡ‚ΡŒ эту Ρ‚Π΅ΠΌΡƒ Π² Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΈ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ансамблСй с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ scikit-learn.

Π§Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ансамбль?

ΠœΠ΅Ρ‚ΠΎΠ΄ машинного обучСния, Π³Π΄Π΅ нСсколько ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎΠ΄Π½ΠΎΠΉ ΠΈ Ρ‚ΠΎΠΉ ΠΆΠ΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ для получСния Π»ΡƒΡ‡ΡˆΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² называСтся ансамблСвым ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ. Основная прСдпосылка Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π±ΡƒΠ΄Π΅Ρ‚ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π΅Π½, Ρ‡Π΅ΠΌ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Когда говорится ΠΎΠ± ансамблях, Ρ‚ΠΎ вводится понятиС слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°(ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π²Ρ€ΠΎΠ΄Π΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии ΠΈΠ»ΠΈ Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ). ΠœΠ½ΠΎΠΆΠ΅ΡΡ‚Π²ΠΎ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΡΡ‚Ρ€ΠΎΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π±Π»ΠΎΠΊΠ°ΠΌΠΈ для Π±ΠΎΠ»Π΅Π΅ слоТных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. ОбъСдинСниС слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ качСства ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ смСщСния ΠΈΠ»ΠΈ разброса, называСтся ΡΠΈΠ»ΡŒΠ½Ρ‹ΠΌ ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠΌ.

Π’ΠΈΠ΄Ρ‹ ансамблСвых ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ²

НаиболСС популярными ансамблСвыми ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ: стСкинг, бэггинг, бустинг.

Π‘Ρ‚Π΅ΠΊΠΈΠ½Π³. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ нСсколько Ρ€Π°Π·Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ². Π˜Ρ… ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ для построСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°, основанного Π½Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°Ρ… Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… слабых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Бэггинг. Π’ этом случаС ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚. ΠŸΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· ΠΏΡƒΡ‚Ρ‘ΠΌ усрСднСния. Если ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² качСствС слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Ρ‚ΠΎ получится случайный лСс RandomForestClassifier / RandomForestRegressor.

Бустинг. ΠŸΡ€ΠΈ использовании Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° нСсколько ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ, исправляя ошибки Π΄Ρ€ΡƒΠ³ Π΄Ρ€ΡƒΠ³Π°.

Π‘Ρ‚Π΅ΠΊΠΈΠ½Π³

Π Π°Π±ΠΎΡ‚Π° этого Ρ‚ΠΈΠΏΠ° ансамблСй довольно проста. На Π²Ρ…ΠΎΠ΄ всСх слабых ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ‚ΠΎΡ€ΠΎΠ² подаётся ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· ΠΈΠ΄Ρ‘Ρ‚ ΠΊ Ρ„ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая называСтся ΡΠΌΠ΅ΡΠΈΡ‚Π΅Π»ΡŒ, ΠΌΠ΅Ρ‚Π°-ΡƒΡ‡Π΅Π½ΠΈΠΊ ΠΈΠ»ΠΈ ΠΌΠ΅Ρ‚Π°-модСль, послС Ρ‡Π΅Π³ΠΎ Ρ‚Π° Π²Ρ‹Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΈΠ½Π°Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚Π°-ΠΌΠΎΠ΄Π΅Π»ΠΈ

ΠŸΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠ΅Ρ‚Π°-ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΏΡ€ΠΈΡ‘ΠΌ ΡƒΠ΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅ΠΌΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π°. Π‘Π½Π°Ρ‡Π°Π»Π° Π½Π°Π±ΠΎΡ€ раздСляСтся Π½Π° 2 части. Π‘Π»Π°Π±Ρ‹Π΅ ΡƒΡ‡Π΅Π½ΠΈΠΊΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ Π½Π° ΠΏΠ΅Ρ€Π²ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π΅ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ Π½Π°Π±ΠΎΡ€Π°, Π·Π°Ρ‚Π΅ΠΌ Π½Π° Π²Ρ‚ΠΎΡ€ΠΎΠΉ. Π—Π°Ρ‚Π΅ΠΌ создаётся Π½ΠΎΠ²Ρ‹ΠΉ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ Π½Π° основС ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ², сдСланных Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ… ΠΏΠ΅Ρ€Π²ΠΎΠΉ ΠΈ Π²Ρ‚ΠΎΡ€ΠΎΠΉ части Π½Π°Π±ΠΎΡ€Π°. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±Ρ€Π°Π·Π΅Ρ† ΠΈΠ· Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° приходится ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ², сколько слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π² ансамблС (Π² ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Π½Π° ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ΅ Ρ‚Ρ€ΠΈ). ΠœΠ΅Ρ‚Π°-модСль учится ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ значСния Π½Π° основС Π½ΠΎΠ²ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π°.

Бэггинг

Основная идСя бэггинга Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ нСсколько ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… ΠΎΠ±Ρ€Π°Π·Ρ†Π°Ρ…. РаспрСдСлСниС Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ нСизвСстно, поэтому ΠΌΠΎΠ΄Π΅Π»ΠΈ получатся Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Если класс прСдсказываСт Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ слабых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Ρ‚ΠΎ ΠΎΠ½ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ большС голосов ΠΈ Π΄Π°Π½Π½Ρ‹ΠΉ класс являСтся Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ прСдсказывания ансамбля. Π­Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Тёсткого голосования. ΠŸΡ€ΠΈ мягком голосовании Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ вСроятности прСдсказывания ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса, Π·Π°Ρ‚Π΅ΠΌ вСроятности ΡƒΡΡ€Π΅Π΄Π½ΡΡŽΡ‚ΡΡ ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ являСтся класс с большой Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ.

Бустинг

ΠœΠ΅Ρ‚ΠΎΠ΄ бустинга Π² Ρ‡Ρ‘ΠΌ Ρ‚ΠΎ схоТ с ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ бэггинга: бСрётся мноТСство ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ сильного ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°. Но Ρ€Π°Π·Π½ΠΈΡ†Π° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈΡΠΏΠΎΡΠ°Π±Π»ΠΈΠ²Π°ΡŽΡ‚ΡΡ ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ каТдая модСль Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΡΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ ошибки ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ.

Адаптивный бустинг (AdaBoost)

Π”Π°Π½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ сначала ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ ΠΏΠ΅Ρ€Π²ΡƒΡŽ Π±Π°Π·ΠΎΠ²ΡƒΡŽ модСль(допустим Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ) Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅. ΠžΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ вСс Π½Π΅ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ прСдсказанных Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ увСличиваСтся. На Π²Ρ…ΠΎΠ΄ Π²Ρ‚ΠΎΡ€ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΠ΄Π°ΡŽΡ‚ΡΡ ΠΎΠ±Π½ΠΎΠ²Π»Ρ‘Π½Π½Ρ‹Π΅ вСса ΠΈ модСль обучаСтся, послС Ρ‡Π΅Π³ΠΎ Π²Ρ‹Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΠΈ Ρ†ΠΈΠΊΠ» повторяСтся.

Adaboost обновляСт вСса ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ. ВСса Ρ…ΠΎΡ€ΠΎΡˆΠΎ классифицированных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°ΡŽΡ‚ΡΡ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ вСсов Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ классифицированных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². МодСли, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Π»ΡƒΡ‡ΡˆΠ΅, ΠΈΠΌΠ΅ΡŽΡ‚ больший вСс Π² ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля.

ΠŸΡ€ΠΈ Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½ΠΎΠΌ бустингС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ (добавляСм слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π·Π° Π΄Ρ€ΡƒΠ³ΠΈΠΌ, просматривая ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΡŽ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΉΡ‚ΠΈ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΡƒΡŽ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡƒΡŽ ΠΏΠ°Ρ€Ρƒ (коэффициСнт, слабый ΡƒΡ‡Π΅Π½ΠΈΠΊ) для добавлСния ΠΊ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля) измСнСния вСсов. Он Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ быстрСС, Ρ‡Π΅ΠΌ аналитичСский ΠΌΠ΅Ρ‚ΠΎΠ΄.

Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг

Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ слабыС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, исправляя ошибки ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ…. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ бустинга Ρ‚Π°ΠΊΠΆΠ΅ являСтся ΡΡ€Π΅Π΄Π½Π΅Π²Π·Π²Π΅ΡˆΠ΅Π½Π½Π°Ρ сумма Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. ΠŸΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΈΠ°Π»ΡŒΠ½ΠΎΠ΅ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ Adaboost это способ измСнСния вСсов. Адаптивный бустинг ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ. Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг оптимизируСтся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска.

Π’Ρ‹Π²ΠΎΠ΄

АнсамблСвыС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΌΠΎΡ‰Π½Ρ‹ΠΌ инструмСнтом для Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…. ИдСя ΠΎΠ± объСдинСнии простых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»Π° Π΄Π΅Π»Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠΈΠ΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹. Но всё ΠΆΠ΅ для построСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ² сначала Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ простыС ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ Π΄ΠΎΠ±ΠΈΡ‚ΡŒΡΡ Π½ΡƒΠΆΠ½ΠΎΠΉ точности. Если ΠΆΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ вас Π½Π΅ ΡƒΡΡ‚Ρ€Π°ΠΈΠ²Π°ΡŽΡ‚, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ансамбли.

Помимо Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ scikit-learn Π² python Π΅ΡΡ‚ΡŒ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° XGBoost, которая прСдоставляСт Π±ΠΎΠ»Π΅Π΅ ΠΎΠ±ΡˆΠΈΡ€Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ансамблСвых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ с Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎΠΉ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅: ансамбль смСшивания Π½Π° Python

БмСшиваниС β€” это ансамблСвый Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ машинного обучСния. Π­Ρ‚ΠΎ Ρ€Π°Π·Π³ΠΎΠ²ΠΎΡ€Π½ΠΎΠ΅ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ для стСкового обобщСния (stacked generalization) [Π΄Π°Π»Π΅Π΅ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅Ρ€ΠΌΠΈΠ½ Β«ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅Β» вмСсто принятого Π² Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… Ρ€Π°Π±ΠΎΡ‚Π°Ρ… Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π° «стСкинг»] ΠΈΠ»ΠΈ ансамбля пакСтирования, Π³Π΄Π΅ вмСсто Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ… Π²Π½Π΅ Π³Ρ€ΡƒΠΏΠΏ, сдСланных Π±Π°Π·ΠΎΠ²ΠΎΠΉ модСлью, модСль обучаСтся Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ…, сдСланных Π½Π° нСзависимом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠžΠ±Π·ΠΎΡ€ Ρ‚ΡƒΡ‚ΠΎΡ€ΠΈΠ°Π»Π°

Π­Ρ‚ΠΎΡ‚ Ρ‚ΡƒΡ‚ΠΎΡ€ΠΈΠ°Π» Ρ€Π°Π·Π΄Π΅Π»Ρ‘Π½ Π½Π° Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ части. Π’ΠΎΡ‚ ΠΎΠ½ΠΈ:

Π‘ΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль

БмСшиваниС β€” это ΠΌΠ΅Ρ‚ΠΎΠ΄ ансамблСвого машинного обучСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ модСль машинного обучСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΠ·Π½Π°Ρ‚ΡŒ, ΠΊΠ°ΠΊ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ β€” участников ансамбля.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, смСшиваниС β€” это Ρ‚ΠΎ ΠΆΠ΅ самоС, Ρ‡Ρ‚ΠΎ ΠΈ стСковоС ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅, извСстноС ΠΊΠ°ΠΊ стСкинг. Часто смСшиваниС ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ взаимозамСняСмы ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² ΠΎΠ΄Π½ΠΎΠΉ ΠΈ Ρ‚ΠΎΠΉ ΠΆΠ΅ ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΈΠ»ΠΈ Π² описании ΠΌΠΎΠ΄Π΅Π»ΠΈ.

МногиС ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΈ машинного обучСния добились успСха, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ связанныС с Π½ΠΈΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ для ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ точности прогнозирования Π² сравнСнии с любой ΠΈΠ· ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… контСкстах ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Ρ‚Π°ΠΊΠΆΠ΅ называСтся смСшиваниСм. Π—Π΄Π΅ΡΡŒ ΠΌΡ‹ Ρ‚Π°ΠΊΠΆΠ΅ Π±ΡƒΠ΄Π΅ΠΌ Π²Π·Π°ΠΈΠΌΠΎΠ·Π°ΠΌΠ΅Π½ΡΡ‚ΡŒ Ρ‚Π΅Ρ€ΠΌΠΈΠ½Ρ‹.
Feature-Weighted Linear Stacking, 2009.

АрхитСктура ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ содСрТит Π΄Π²Π΅ ΠΈΠ»ΠΈ Π±ΠΎΠ»Π΅Π΅ Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, часто Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… модСлями Π½ΡƒΠ»Π΅Π²ΠΎΠ³ΠΎ уровня, Π° ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ, которая ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, β€” модСлью ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ уровня. ΠœΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ обучаСтся Π½Π° основС ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ², сдСланных Π±Π°Π·ΠΎΠ²Ρ‹ΠΌΠΈ модСлями Π½Π° Π΄Π°Π½Π½Ρ‹Ρ… Π²Π½Π΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

НашС Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ с RMSE=0,8643^2 прСдставляСт собой Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ΅ смСшСниС ΠΈΠ· Π±ΠΎΠ»Π΅Π΅ Ρ‡Π΅ΠΌ 100 Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ². [… ] На протяТСнии всСго описания ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΌΡ‹ выдСляСм ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Π΅ ΠΏΡ€Π΅Π΄ΠΈΠΊΡ‚ΠΎΡ€Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ участвовали Π² ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΌ смСшанном Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ.
The BellKor 2008 Solution to the Netflix Prize, 2008.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, смСшиваниС β€” это Ρ€Π°Π·Π³ΠΎΠ²ΠΎΡ€Π½Ρ‹ΠΉ Ρ‚Π΅Ρ€ΠΌΠΈΠ½ для ансамблСвого обучСния с модСльной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΎΠΉ Ρ‚ΠΈΠΏΠ° пакСтирования. Он Ρ€Π΅Π΄ΠΊΠΎ, Ссли Π²ΠΎΠΎΠ±Ρ‰Π΅ ΠΊΠΎΠ³Π΄Π°-Π½ΠΈΠ±ΡƒΠ΄ΡŒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² ΡƒΡ‡Π΅Π±Π½ΠΈΠΊΠ°Ρ… ΠΈΠ»ΠΈ Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… Ρ€Π°Π±ΠΎΡ‚Π°Ρ…, ΠΊΡ€ΠΎΠΌΠ΅ Ρ‚Π΅Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ связаны с ΠΌΠ°ΡˆΠΈΠ½Π½Ρ‹ΠΌ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ Π½Π° сорСвнованиях. Π§Π°Ρ‰Π΅ всСго Ρ‚Π΅Ρ€ΠΌΠΈΠ½ «смСшиваниС» ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для описания спСцифичСского примСнСния пакСтирования, ΠΊΠΎΠ³Π΄Π° ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ обучаСтся Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ…, сдСланных Π±Π°Π·ΠΎΠ²Ρ‹ΠΌΠΈ модСлями с нСзависимым Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ… Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ. Π’ этом контСкстС ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π·Π°Ρ€Π΅Π·Π΅Ρ€Π²ΠΈΡ€ΠΎΠ²Π°Π½ΠΎ для ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌΠΎΠΉ Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ… Π²ΠΎ врСмя ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ.

БмСшиваниС β€” это слово, Π²Π²Π΅Π΄Ρ‘Π½Π½ΠΎΠ΅ побСдитСлями Netflix. Оно ΠΎΡ‡Π΅Π½ΡŒ Π±Π»ΠΈΠ·ΠΊΠΎ ΠΊ ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΡŽ, Π½ΠΎ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΡ‰Π΅ ΠΈ риск ΡƒΡ‚Π΅Ρ‡ΠΊΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ мСньшС. [… ] Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ смСшивания, вмСсто Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π²ΠΎ врСмя кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ для Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π°, Π²Ρ‹ создаётС нСбольшой нСзависимый Π½Π°Π±ΠΎΡ€, скаТСм, 10% ΠΎΡ‚ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ. Π—Π°Ρ‚Π΅ΠΌ модСль пакСтирования трСнируСтся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π° этом нСбольшом Π½Π°Π±ΠΎΡ€Π΅.
Kaggle Ensemble Guide, MLWave, 2015.

ΠœΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ послСднСС ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ смСшивания. Π”Π°Π²Π°ΠΉΡ‚Π΅ посмотрим, ΠΊΠ°ΠΊ ΠΎΠ½ΠΎ рСализуСтся.

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° смСшанного ансамбля

Π‘ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° scikit-learn Π½Π΅ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ смСшиваниС ΠΈΠ· ΠΊΠΎΡ€ΠΎΠ±ΠΊΠΈ Π½Π° ΠΌΠΎΠΌΠ΅Π½Ρ‚ написания ΡΡ‚Π°Ρ‚ΡŒΠΈ. Но ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π³ΠΎ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ scikit-learn. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π½ΡƒΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ряд Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π­Ρ‚ΠΎ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π»ΡŽΠ±Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π°ΠΌ нравятся Π² Π·Π°Π΄Π°Ρ‡Π΅ рСгрСссии ΠΈΠ»ΠΈ классификации. ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ get_models(), которая Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ список ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π³Π΄Π΅ каТдая модСль опрСдСляСтся ΠΊΠ°ΠΊ ΠΊΠΎΡ€Ρ‚Π΅ΠΆ с Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ ΠΈ настроСнным классификатором ΠΈΠ»ΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠΌ рСгрСссии. НапримСр, для Π·Π°Π΄Π°Ρ‡ΠΈ классификации ΠΌΡ‹ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π»ΠΎΠ³ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ, kNN, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, SVM ΠΈ Π½Π°ΠΈΠ²Π½ΡƒΡŽ Π±Π°ΠΉΠ΅ΡΠΎΠ²ΡΠΊΡƒΡŽ модСль.

Π”Π°Π»Π΅Π΅ Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ ΡΠΌΠ΅ΡˆΠΈΠ²Π°ΡŽΡ‰ΡƒΡŽ модСль. Напомним, Ρ‡Ρ‚ΠΎ Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. ΠœΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ обучаСтся Π½Π° ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°Ρ…, сдСланных ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ модСлью Π½Π° нСзависимом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π² Ρ†ΠΈΠΊΠ»Π΅ ΠΏΠ΅Ρ€Π΅Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² спискС ΠΈ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΈΠ· Π½ΠΈΡ… ΠΏΠΎ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΠΈ Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Π² этом Ρ†ΠΈΠΊΠ»Π΅ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π΅Π½Π½ΡƒΡŽ модСль, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· Π½Π° нСзависимом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… (Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ) ΠΈ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π½Π° Π±ΡƒΠ΄ΡƒΡ‰Π΅Π΅.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Ρƒ нас Π΅ΡΡ‚ΡŒ Β«meta_X*Β», ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠΉ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для обучСния ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ столбСц ΠΈΠ»ΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ прСдставляСт Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΎΠ΄Π½ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ. КаТдая строка прСдставляСт собой ΠΎΠ΄ΠΈΠ½ сэмпл ΠΈΠ· нСзависимого Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…. ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ hstack() Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ этот Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… прСдставляСт собой Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив numpy, ΠΊΠ°ΠΊ ΠΈ оТидалось модСлью машинного обучСния.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°ΡˆΡƒ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ любая модСль машинного обучСния, которая Π½Π°ΠΌ нравится, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ логистичСская рСгрСссия для Π·Π°Π΄Π°Ρ‡ΠΈ классификации.

МоТно ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ всё это вмСстС Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ с ΠΈΠΌΠ΅Π½Π΅ΠΌ fit_ensemble(), которая ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ ΡΠΌΠ΅ΡˆΠΈΠ²Π°ΡŽΡ‰ΡƒΡŽ модСль с использованиСм ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ ΠΈ нСзависимого Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ.

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ шаг β€” использованиС ΡΠΌΠ΅ΡˆΠΈΠ²Π°ΡŽΡ‰Π΅Π³ΠΎ ансамбля для прогнозирования Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΎ двухэтапный процСсс. ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ шаг β€” использованиС ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ для прогнозирования. Π—Π°Ρ‚Π΅ΠΌ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΡΠΎΠ±ΠΈΡ€Π°ΡŽΡ‚ΡΡ вмСстС ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² качСствС Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… для ΠΌΠΎΠ΄Π΅Π»ΠΈ смСшивания, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·.

ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‚ ΠΆΠ΅ Ρ†ΠΈΠΊΠ», Ρ‡Ρ‚ΠΎ ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ΠΎ Π΅ΡΡ‚ΡŒ ΡΠΎΠ±Ρ€Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, ΡΠ»ΠΎΠΆΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ вмСстС ΠΈ Π²Ρ‹Π·Π²Π°Ρ‚ΡŒ predict() Π² ΡΠΌΠ΅ΡˆΠΈΠ²Π°ΡŽΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ с этим Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ… мСтауровня. Ѐункция predict_ensemble() Π½ΠΈΠΆΠ΅ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅Ρ‚ эти дСйствия. Учитывая ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ списка Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΡΠΌΠ΅ΡˆΠΈΠ²Π°Ρ‚Π΅Π»Ρ ансамбля ΠΈ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, тСстовый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Π½ΠΎΠ²Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅), для Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΎΠ½Π° Π²Π΅Ρ€Π½Ρ‘Ρ‚ Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ².

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Ρƒ нас Π΅ΡΡ‚ΡŒ всС элСмСнты, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ для Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ смСшанного ансамбля для Π·Π°Π΄Π°Ρ‡ классификации ΠΈΠ»ΠΈ рСгрСссионного прогностичСского модСлирования.

Π‘ΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль для Π·Π°Π΄Π°Ρ‡ΠΈ классификации

Π’ этом Ρ€Π°Π·Π΄Π΅Π»Π΅ ΠΌΡ‹ рассмотрим использованиС смСшивания для Π·Π°Π΄Π°Ρ‡ΠΈ классификации. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ make_classification(), Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΡΠΈΠ½Ρ‚Π΅Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации с 10 000 ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ ΠΈ 20 Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ. Π’Π΅ΡΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½ Π½ΠΈΠΆΠ΅.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° создаёт Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ€Π΅Π·ΡŽΠΌΠΈΡ€ΡƒΠ΅Ρ‚ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅.

Π”Π°Π»Π΅Π΅ Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… сначала Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ ΠΈ тСстовыС Π½Π°Π±ΠΎΡ€Ρ‹, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ Π½Π° подмноТСство, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠ΅ для обучСния Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΈ подмноТСство, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠ΅ для обучСния ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ этом случаС ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 50-50 для Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ ΠΈ тСстового Π½Π°Π±ΠΎΡ€ΠΎΠ², Π° Π·Π°Ρ‚Π΅ΠΌ β€” Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ 67-33 для Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° ΠΈ Π½Π°Π±ΠΎΡ€Π° Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ.

Π—Π°Ρ‚Π΅ΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ get_models() ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ Ρ€Π°Π·Π΄Π΅Π»Π° для создания ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… Π² ансамблС классификационных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. ПослС функция fit_ensemble() ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π²Ρ‹Π·Π²Π°Π½Π° для обучСния смСшанного ансамбля Π½Π° этих Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Π° функция predict_ensemble() ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ² Π½Π° нСзависимом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

НаконСц, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ смСшивания, сообщив ΠΎ точности классификации Π² тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

ΠŸΠΎΠ»Π½Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΎΡ†Π΅Π½ΠΊΠΈ смСшанного ансамбля Π² Π·Π°Π΄Π°Ρ‡Π΅ синтСтичСской Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½ Π½ΠΈΠΆΠ΅.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° сначала сообщаСт Ρ€Π΅Π·ΡŽΠΌΠ΅ всСх Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π·Π°Ρ‚Π΅ΠΌ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ансамбля Π² тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅: ваши Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ с ΡƒΡ‡Ρ‘Ρ‚ΠΎΠΌ стохастичСского Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΈΠ»ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠΉ Π² числовой точности. ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ нСсколько Ρ€Π°Π· ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ срСдний Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Π—Π΄Π΅ΡΡŒ ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль достиг точности классификации ΠΎΠΊΠΎΠ»ΠΎ 97,900%.

Π’ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· Ρ‡Ρ‘Ρ‚ΠΊΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠΊ классов Π±Ρ‹Π» ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½Ρ‘Π½ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ смСшивания. Π­Ρ‚ΠΎ Ρ‚ΠΈΠΏ Тёсткого голосования. ΠΠ»ΡŒΡ‚Π΅Ρ€Π½Π°Ρ‚ΠΈΠ²Π° β€” ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΠ³Π΄Π° каТдая модСль ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ вСроятности классов ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ для смСшивания вСроятностСй. Π­Ρ‚ΠΎ своСго Ρ€ΠΎΠ΄Π° мягкоС голосованиС, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΈΠ½ΠΎΠ³Π΄Π° ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡŽ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°ΡŽΡ‰ΠΈΠ΅ вСроятности, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ модСль SVM.

Π—Π°Ρ‚Π΅ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ вмСсто Ρ‡Ρ‘Ρ‚ΠΊΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠΊ классов ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ вСроятности. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ достигнуто Π²Ρ‹Π·ΠΎΠ²ΠΎΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ predict_proba () Π²Π½ΡƒΡ‚Ρ€ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ fit_ensemble() ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ ΠΌΠ΅Ρ‚Π°-Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΉ для обучСния ΠΌΠ΅Ρ‚Π°-ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ n столбцов Π½Π° классификатор, Π³Π΄Π΅ n β€” количСство классов Π² Π·Π°Π΄Π°Ρ‡Π΅ прогнозирования, Π² нашСм случаС классов Π΄Π²Π°. Нам Ρ‚Π°ΠΊΠΆΠ΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹, сдСланныС Π±Π°Π·ΠΎΠ²Ρ‹ΠΌΠΈ модСлями, ΠΏΡ€ΠΈ использовании ΡΠΌΠ΅ΡˆΠΈΠ²Π°ΡŽΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ для прогнозирования Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ….

Π’Π΅ΡΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ использования смСшивания Π½Π° спрогнозированных вСроятностях классов для Π·Π°Π΄Π°Ρ‡ΠΈ синтСтичСской Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½ Π½ΠΈΠΆΠ΅.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° сначала сообщаСт Ρ€Π΅Π·ΡŽΠΌΠ΅ всСх Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π·Π°Ρ‚Π΅ΠΌ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ансамбля Π² тСстовом Π½Π°Π±ΠΎΡ€Π΅.

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅: ваши Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ, учитывая стохастичСский Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΈΠ»ΠΈ различия Π² числовой точности. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ нСсколько Ρ€Π°Π· ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ срСдний Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Π—Π΄Π΅ΡΡŒ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ смСшСниС вСроятностСй классов ΠΏΡ€ΠΈΠ²Π΅Π»ΠΎ ΠΊ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡŽ точности классификации ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π΄ΠΎ 98,240 %.

Π‘ΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль эффСктивСн Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ‚ΠΎΠΌ случаС, Ссли ΠΎΠ½ способСн ΠΏΡ€Π΅Π²Π·ΠΎΠΉΡ‚ΠΈ Π»ΡŽΠ±ΡƒΡŽ ΠΈΠ· ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² Π½Ρ‘ΠΌ. ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΡ‚ΡŒ это, ΠΎΡ†Π΅Π½ΠΈΠ² ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΈΠ· Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. КаТдая базовая модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π΅Π½Π° Π½Π° всём ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… (Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ансамбля смСшивания) ΠΈ ΠΎΡ†Π΅Π½Π΅Π½Π° Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… (Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ Π² ансамблС смСшивания). ΠŸΡ€ΠΈΠΌΠ΅Ρ€ Π½ΠΈΠΆΠ΅ дСмонстрируСт это, оцСнивая ΠΊΠ°ΠΆΠ΄ΡƒΡŽ Π±Π°Π·ΠΎΠ²ΡƒΡŽ модСль Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° сначала сообщаСт Ρ€Π΅Π·ΡŽΠΌΠ΅ всСх Ρ‚Ρ€Ρ‘Ρ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π·Π°Ρ‚Π΅ΠΌ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² тСстовом Π½Π°Π±ΠΎΡ€Π΅.

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅: ваши Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ учитывая стохастичСский Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρƒ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΈΠ»ΠΈ различия Π² числовой точности. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ нСсколько Ρ€Π°Π· ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ срСдний Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Π’ этом случаС ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ всС ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Ρ…ΡƒΠΆΠ΅ смСшанного ансамбля. Π˜Π½Ρ‚Π΅Ρ€Π΅ΡΠ½ΠΎ Π²ΠΎΡ‚ Ρ‡Ρ‚ΠΎ: ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ SVM ΠΎΡ‡Π΅Π½ΡŒ Π±Π»ΠΈΠ·ΠΎΠΊ ΠΊ Π΄ΠΎΡΡ‚ΠΈΠΆΠ΅Π½ΠΈΡŽ точности 98,200 % ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ 98,240 %, достигнутой с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ смСшанного ансамбля.

ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль Π² качСствС нашСй ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π­Ρ‚ΠΎ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ансамбля Π½Π° всём Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ составлСниС ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ² Π½Π° Π½ΠΎΠ²Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ…. Π’ частности, вСсь ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ разбиваСтся Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Π½Π°Π±ΠΎΡ€Ρ‹ для обучСния Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΈ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ соотвСтствСнно, Π° Π·Π°Ρ‚Π΅ΠΌ ансамбль ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ. ΠŸΠΎΠ»Π½Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ составлСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π° ΠΏΠΎ Π½ΠΎΠ²Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ с использованиСм смСшанного ансамбля для классификации выглядит Ρ‚Π°ΠΊ:

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ модСль смСшанного ансамбля Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π·Π°Ρ‚Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для прогнозирования Π½ΠΎΠ²ΠΎΠΉ строки Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠ°ΠΊ это Π±Ρ‹Π»ΠΎ Π±Ρ‹ ΠΏΡ€ΠΈ использовании ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ.

Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим, ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ‹ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль для рСгрСссии.

Π‘ΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль для Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Π’ этом Ρ€Π°Π·Π΄Π΅Π»Π΅ ΠΌΡ‹ рассмотрим использованиС пакСтирования для рСгрСссионной Π·Π°Π΄Π°Ρ‡ΠΈ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ make_regression(), Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΡΠΈΠ½Ρ‚Π΅Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΠΎΠ½Π½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ с 10 000 сэмплов ΠΈ 20 Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ. Π’Π΅ΡΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ Π½ΠΈΠΆΠ΅.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° создаёт Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ€Π΅Π·ΡŽΠΌΠΈΡ€ΡƒΠ΅Ρ‚ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹.

Π”Π°Π»Π΅Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ список рСгрСссионных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ для примСнСния Π² качСствС Π±Π°Π·ΠΎΠ²Ρ‹Ρ…. Π’ этом случаС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ, kNN, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ SVM.

Ѐункция fit_ensemble(), ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ для обучСния ансамбля, Π½Π΅ измСняСтся, Π·Π° ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ΠΌ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ модСль, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ для смСшивания, Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½Π° Π½Π° Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΠΎΠ½Π½ΡƒΡŽ. Π—Π΄Π΅ΡΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ модСль Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии.

Учитывая, Ρ‡Ρ‚ΠΎ это Π·Π°Π΄Π°Ρ‡Π° рСгрСссии, ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ошибок, Π² Π΄Π°Π½Π½ΠΎΠΌ случаС срСднСй Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠΉ ошибки, ΠΈΠ»ΠΈ (сокращённо) MAE.

Π’Π΅ΡΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ смСшанного ансамбля для Π·Π°Π΄Π°Ρ‡ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π½ΠΎΠ³ΠΎ модСлирования синтСтичСской рСгрСссии ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½ Π½ΠΈΠΆΠ΅:

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ сначала Π²Ρ‹Π²ΠΎΠ΄ΠΈΡ‚ Ρ€Π΅Π·ΡŽΠΌΠ΅ Ρ‚Ρ€Ρ‘Ρ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π·Π°Ρ‚Π΅ΠΌ MAE Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅.

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅: ваши Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ, учитывая стохастичСский Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΈΠ»ΠΈ различия Π² числовой точности. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ нСсколько Ρ€Π°Π· ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ срСдний Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Π—Π΄Π΅ΡΡŒ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ ансамбль достиг MAE ΠΎΠΊΠΎΠ»ΠΎ 0,237 Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

Как ΠΈ Π² случаС с классификациСй, ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль ΠΏΠΎΠ»Π΅Π·Π΅Π½ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ‚ΠΎΠΌ случаС, Ссли ΠΎΠ½ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ любая ΠΈΠ· Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ансамбля.

ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ это, ΠΎΡ†Π΅Π½ΠΈΠ² ΠΊΠ°ΠΆΠ΄ΡƒΡŽ Π±Π°Π·ΠΎΠ²ΡƒΡŽ модСль ΠΈΠ·ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎ, сначала ΠΎΠ±ΡƒΡ‡ΠΈΠ² Π΅Π΅ Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΌ Π½Π°Π±ΠΎΡ€Π΅ Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ (Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ансамбля) ΠΈ сдСлав ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… (ΠΊΠ°ΠΊ Π² ансамблС). Π’ ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½Π½ΠΎΠΌ Π½ΠΈΠΆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ каТдая ΠΈΠ· Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ оцСниваСтся ΠΈΠ·ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎ Π½Π° основС Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… синтСтичСского рСгрСссионного прогностичСского модСлирования.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° сначала Ρ€Π΅Π·ΡŽΠΌΠΈΡ€ΡƒΠ΅Ρ‚ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ ΠΈ тСстовый Π½Π°Π±ΠΎΡ€Ρ‹, Π° Π·Π°Ρ‚Π΅ΠΌ MAE ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅: ваши Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ, учитывая стохастичСский Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΈΠ»ΠΈ различия Π² числовой точности. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ нСсколько Ρ€Π°Π· ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ срСдний Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Π—Π΄Π΅ΡΡŒ Π²ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ Π½Π° самом Π΄Π΅Π»Π΅ линСйная рСгрСссионная модСль ΠΏΠΎΠΊΠ°Π·Π°Π»Π° сСбя Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль, достигнув MAE 0,236 ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с 0,237. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ связано с Ρ‚Π΅ΠΌ, ΠΊΠ°ΠΊ Π±Ρ‹Π» построСн синтСтичСский Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ….

Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ Π² этом случаС ΠΌΡ‹ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Π»ΠΈ Π±Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΠΎΠ½Π½ΡƒΡŽ модСль ΠΈΠΌΠ΅Π½Π½ΠΎ для этой Π·Π°Π΄Π°Ρ‡ΠΈ. Битуация ΠΏΠΎΠ΄Ρ‡Ρ‘Ρ€ΠΊΠΈΠ²Π°Π΅Ρ‚ Π²Π°ΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ вносящих Π²ΠΊΠ»Π°Π΄ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Π°Π½ΡΠ°ΠΌΠ±Π»Π΅Π²ΡƒΡŽ модСль ΠΊΠ°ΠΊ ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΡƒΡŽ.

ΠžΠΏΡΡ‚ΡŒ ΠΆΠ΅, ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹ΠΉ ансамбль Π² качСствС ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ рСгрСссии. ΠŸΠΎΠ΄Ρ…ΠΎΠ΄ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ всСго Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ ΠΈ тСстовый Π½Π°Π±ΠΎΡ€Ρ‹, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π° Π½ΠΈΡ… ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ Π±Π°Π·ΠΎΠ²ΡƒΡŽ ΠΈ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ соотвСтствСнно, Π·Π°Ρ‚Π΅ΠΌ ансамбль ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для прогнозирования Π½ΠΎΠ²ΠΎΠΉ строки Π΄Π°Π½Π½Ρ‹Ρ…. Π’Π΅ΡΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ составлСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π° ΠΏΠΎ Π½ΠΎΠ²Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ смСшанного ансамбля для Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½ Π½ΠΈΠΆΠ΅.

Запуск ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля Π½Π° Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π·Π°Ρ‚Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для прогнозирования Π½ΠΎΠ²ΠΎΠΉ строки Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠ°ΠΊ это Π±Ρ‹Π»ΠΎ Π±Ρ‹ ΠΏΡ€ΠΈ использовании ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ.

И Π½Π΅ Π·Π°Π±Ρ‹Π²Π°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ ΠΏΡ€ΠΎΠΌΠΎΠΊΠΎΠ΄ HABR, Π΄ΠΎΠ±Π°Π²Π»ΡΡŽΡ‰ΠΈΠΉ 10% ΠΊ скидкС Π½Π° Π±Π°Π½Π½Π΅Ρ€Π΅.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

АнсамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹: бэггинг, бустинг ΠΈ стСкинг

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

«Единство это сила». Π­Ρ‚Π° старая ΠΏΠΎΠ³ΠΎΠ²ΠΎΡ€ΠΊΠ° довольно Ρ…ΠΎΡ€ΠΎΡˆΠΎ Π²Ρ‹Ρ€Π°ΠΆΠ°Π΅Ρ‚ ΠΎΡΠ½ΠΎΠ²Π½ΡƒΡŽ идСю, Π·Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ стоят ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠΎΡ‰Π½Ρ‹Π΅ «ансамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹Β» Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. АнсамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ часто Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ Ρ‚ΠΎΠΏ Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ΠΎΠ² Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… сорСвнованиях ΠΏΠΎ ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ, Π² Ρ‚ΠΎΠΌ числС Π½Π° Kaggle. Если Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ Π³Ρ€ΡƒΠ±ΠΎ, ΠΎΠ½ΠΈ основаны Π½Π° Π³ΠΈΠΏΠΎΡ‚Π΅Π·Π΅ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ объСдинСниС Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π²ΠΎΠ΅Π΄ΠΈΠ½ΠΎ часто ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ созданию Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ ΠΌΠΎΡ‰Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ЦСль этой ΡΡ‚Π°Ρ‚ΡŒΠΈ β€” объяснСниС Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… понятий ансамблСвого обучСния. ΠœΡ‹ обсудим Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ общСизвСстныС понятия, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ бутстрэп, бэггинг, случайный лСс, бустинг, стСкинг ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ основами ансамблСвых ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ². Π§Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ связь ΠΌΠ΅ΠΆΠ΄Ρƒ всСми этими ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ ясной, ΠΌΡ‹ постараСмся ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΈΡ… Π² Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ ΡˆΠΈΡ€ΠΎΠΊΠΎΠΉ ΠΈ Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎΠΉ структурС, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ, ΠΌΡ‹ надССмся, Π±ΡƒΠ΄Π΅Ρ‚ Π»Π΅Π³Ρ‡Π΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΈ Π·Π°ΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ.

План

Π’ ΠΏΠ΅Ρ€Π²ΠΎΠΌ Ρ€Π°Π·Π΄Π΅Π»Π΅ этой ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΌΡ‹ прСдставим понятия слабых ΠΈ ΡΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΈ прСдставим Ρ‚Ρ€ΠΈ основных ΠΌΠ΅Ρ‚ΠΎΠ΄Π° обучСния Π² ансамблС: бэггинг, бустинг ΠΈ стСкинг. Π—Π°Ρ‚Π΅ΠΌ Π²ΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΌ Ρ€Π°Π·Π΄Π΅Π»Π΅ ΠΌΡ‹ сфокусируСм Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° бэггингС ΠΈ обсудим Ρ‚Π°ΠΊΠΈΠ΅ понятия, ΠΊΠ°ΠΊ бутстрэп, бэггинг ΠΈ случайный лСс. Π’ Ρ‚Ρ€Π΅Ρ‚ΡŒΠ΅ΠΌ Ρ€Π°Π·Π΄Π΅Π»Π΅ ΠΌΡ‹ прСдставим бустинг ΠΈ, Π² частности, Π΄Π²Π° Π΅Π³ΠΎ самых популярных Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π°: Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½Ρ‹ΠΉ бустинг (adaboost) ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг. НаконСц, Π² Ρ‡Π΅Ρ‚Π²Π΅Ρ€Ρ‚ΠΎΠΌ Ρ€Π°Π·Π΄Π΅Π»Π΅ ΠΌΡ‹ Π΄Π°Π΄ΠΈΠΌ ΠΎΠ±Π·ΠΎΡ€ стСкинга.

Π§Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ансамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹?

АнсамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ β€” это ΠΏΠ°Ρ€Π°Π΄ΠΈΠ³ΠΌΠ° машинного обучСния, Π³Π΄Π΅ нСсколько ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (часто Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… «слабыми ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°ΠΌΠΈΒ») ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎΠ΄Π½ΠΎΠΉ ΠΈ Ρ‚ΠΎΠΉ ΠΆΠ΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ для получСния Π»ΡƒΡ‡ΡˆΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ². Основная Π³ΠΈΠΏΠΎΡ‚Π΅Π·Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΌ сочСтании слабых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΈ/ΠΈΠ»ΠΈ Π½Π°Π΄Π΅ΠΆΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Один слабый ΡƒΡ‡Π΅Π½ΠΈΠΊ

Π’ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, нСзависимо ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, сталкиваСмся Π»ΠΈ ΠΌΡ‹ с ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ классификации ΠΈΠ»ΠΈ рСгрСссии, Π²Ρ‹Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‡Ρ€Π΅Π·Π²Ρ‹Ρ‡Π°ΠΉΠ½ΠΎ Π²Π°ΠΆΠ΅Π½, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΊΠ°ΠΊΠΈΠ΅-Π»ΠΈΠ±ΠΎ ΡˆΠ°Π½ΡΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹. Π­Ρ‚ΠΎΡ‚ Π²Ρ‹Π±ΠΎΡ€ ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°Π²ΠΈΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ΠΈ: количСства Π΄Π°Π½Π½Ρ‹Ρ…, размСрности пространства, Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρ‹ распрСдСлСния…

Π‘Π»Π°Π±ΠΎΠ΅ смСщСниС (bias) ΠΈ разброс (variance) ΠΌΠΎΠ΄Π΅Π»ΠΈ, хотя ΠΎΠ½ΠΈ Ρ‡Π°Ρ‰Π΅ всСго ΠΈΠ·ΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π² ΠΏΡ€ΠΎΡ‚ΠΈΠ²ΠΎΠΏΠΎΠ»ΠΎΠΆΠ½Ρ‹Ρ… направлСниях, ΡΠ²Π»ΡΡŽΡ‚ΡΡ двумя Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ особСнностями, ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΌΠΈ для ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π”Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Β«Ρ€Π΅ΡˆΠΈΡ‚ΡŒΒ» ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π² нашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Ρ‹Π»ΠΎ достаточно стСпСнСй свободы для Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π±Π°Π·ΠΎΠ²ΠΎΠΉ слоТности Π΄Π°Π½Π½Ρ‹Ρ…, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΌΡ‹ Ρ€Π°Π±ΠΎΡ‚Π°Π΅ΠΌ, Π½ΠΎ ΠΌΡ‹ Ρ‚Π°ΠΊΠΆΠ΅ Ρ…ΠΎΡ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρƒ Π½Π΅Π΅ Π±Ρ‹Π»ΠΎ Π½Π΅ слишком ΠΌΠ½ΠΎΠ³ΠΎ стСпСнСй свободы, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ Π΅Π΅ высокого разброса ΠΈ Π±Ρ‹Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ устойчивой. Π­Ρ‚ΠΎ Ρ…ΠΎΡ€ΠΎΡˆΠΎ извСстный компромисс ΠΌΠ΅ΠΆΠ΄Ρƒ смСщСниСм ΠΈ разбросом.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ компромисса ΠΌΠ΅ΠΆΠ΄Ρƒ смСщСниСм ΠΈ разбросом

Π’ ансамблСвой Ρ‚Π΅ΠΎΡ€ΠΈΠΈ обучСния ΠΌΡ‹ Π²Π²ΠΎΠ΄ΠΈΠΌ понятия слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² (ΠΈΠ»ΠΈ Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² качСствС ΡΡ‚Ρ€ΠΎΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π±Π»ΠΎΠΊΠΎΠ² для проСктирования Π±ΠΎΠ»Π΅Π΅ слоТных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΡƒΡ‚Π΅ΠΌ объСдинСния Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΈΠ· Π½ΠΈΡ…. Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв эти Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ сами ΠΏΠΎ сСбС Π½Π΅ Ρ‚Π°ΠΊ Ρ…ΠΎΡ€ΠΎΡˆΠΎ Π² связи с Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ высокоС смСщСниС (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΌΠΎΠ΄Π΅Π»ΠΈ с Π½ΠΈΠ·ΠΊΠΎΠΉ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒΡŽ свободы), Π»ΠΈΠ±ΠΎ с Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠ΅ΡŽΡ‚ слишком большой разброс, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π±Ρ‹Ρ‚ΡŒ устойчивыми (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΌΠΎΠ΄Π΅Π»ΠΈ с высокой ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒΡŽ свободы). Π’ΠΎΠ³Π΄Π° идСя ансамблСвых ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ смСщСниС ΠΈ/ΠΈΠ»ΠΈ разброс Ρ‚Π°ΠΊΠΈΡ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ², объСдиняя нСсколько ΠΈΠ· Π½ΠΈΡ… вмСстС, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ сильного ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° (ΠΈΠ»ΠΈ модСль ансамбля), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ достигаСт Π»ΡƒΡ‡ΡˆΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ².

ОбъСдинСниС слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ²

Π§Ρ‚ΠΎΠ±Ρ‹ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ ансамблСвый ΠΌΠ΅Ρ‚ΠΎΠ΄, Π½Π°ΠΌ сначала Π½ΡƒΠΆΠ½ΠΎ ΠΎΡ‚ΠΎΠ±Ρ€Π°Ρ‚ΡŒ Π½Π°ΡˆΠΈΡ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² для агрСгирования. Π’ основном (Π² Ρ‚ΠΎΠΌ числС Π² Ρ…ΠΎΡ€ΠΎΡˆΠΎ извСстных ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… бэггинга ΠΈ бустинга) ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ СдинствСнный Π±Π°Π·ΠΎΠ²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ обучСния, Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Π΅ слабыС ΡƒΡ‡Π΅Π½ΠΈΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ ΠΏΠΎ-Ρ€Π°Π·Π½ΠΎΠΌΡƒ. ΠŸΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌΠ°Ρ Π½Π°ΠΌΠΈ модСль ансамбля называСтся Β«ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½ΠΎΠΉΒ». Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ‚Π°ΠΊΠΆΠ΅ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ‚ΠΈΠΏΡ‹ Π±Π°Π·ΠΎΠ²Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² обучСния: Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°Π·Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Π΅ слабыС ΡƒΡ‡Π΅Π½ΠΈΠΊΠΈ Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ Π² Β«Ρ€Π°Π·Π½ΠΎΡ€ΠΎΠ΄Π½ΡƒΡŽ Π°Π½ΡΠ°ΠΌΠ±Π»Π΅Π²ΡƒΡŽ модСль».

Одним ΠΈΠ· Π²Π°ΠΆΠ½Ρ‹Ρ… ΠΌΠΎΠΌΠ΅Π½Ρ‚ΠΎΠ² являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ наш Π²Ρ‹Π±ΠΎΡ€ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ согласован с Ρ‚Π΅ΠΌ, ΠΊΠ°ΠΊ ΠΌΡ‹ Π°Π³Ρ€Π΅Π³ΠΈΡ€ΡƒΠ΅ΠΌ эти ΠΌΠΎΠ΄Π΅Π»ΠΈ. Если ΠΌΡ‹ Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² с Π½ΠΈΠ·ΠΊΠΈΠΌ смСщСниСм, Π½ΠΎ высоким разбросом, это Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° агрСгирования, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ‚ΡŒ разброс, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ Ссли ΠΌΡ‹ Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² с Π½ΠΈΠ·ΠΊΠΈΠΌ разбросом, Π½ΠΎ с высоким смСщСниСм, это Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄ агрСгирования, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ‚ΡŒ смСщСниС.

Π­Ρ‚ΠΎ ΠΏΠΎΠ΄Π²ΠΎΠ΄ΠΈΡ‚ нас ΠΊ вопросу ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ эти ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚ΡŒ Ρ‚Ρ€ΠΈ основных Ρ‚ΠΈΠΏΠ° ΠΌΠ΅Ρ‚Π°-Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Ρ‹ Π½Π° объСдинСниС слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ²:

Π“Ρ€ΡƒΠ±ΠΎ говоря, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ бэггинг Π±ΡƒΠ΄Π΅Ρ‚ Π² основном сосрСдоточСн Π½Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠΈ ансамблСвой ΠΌΠΎΠ΄Π΅Π»ΠΈ с мСньшим разбросом, Ρ‡Π΅ΠΌ Π΅Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ бустинг ΠΈ стСкинг Π² основном Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ΡŒ ΡΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с мСньшим смСщСниСм, Ρ‡Π΅ΠΌ ΠΈΡ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹.

Π’ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Ρ€Π°Π·Π΄Π΅Π»Π°Ρ… ΠΌΡ‹ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ расскаТСм ΠΎ бэггингС ΠΈ бустингС (ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΡˆΠΈΡ€Π΅, Ρ‡Π΅ΠΌ стСкинг, ΠΈ позволят Π½Π°ΠΌ ΠΎΠ±ΡΡƒΠ΄ΠΈΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ понятия ансамблСвых ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ²), ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ Π΄Π°Ρ‚ΡŒ ΠΊΡ€Π°Ρ‚ΠΊΠΈΠΉ ΠΎΠ±Π·ΠΎΡ€ стСкинга.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π‘Π»Π°Π±Ρ‹Ρ… ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ модСль с Π»ΡƒΡ‡ΡˆΠΈΠΌΠΈ показатСлями. Бпособ объСдинСния Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ ΠΊ ΠΈΡ… Ρ‚ΠΈΠΏΠ°ΠΌ. МодСли с Π½ΠΈΠ·ΠΊΠΈΠΌ смСщСниСм ΠΈ высоким разбросом слСдуСт ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ модСль Π±ΠΎΠ»Π΅Π΅ устойчивой, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ ΠΌΠΎΠ΄Π΅Π»ΠΈ с Π½ΠΈΠ·ΠΊΠΈΠΌ разбросом ΠΈ высоким смСщСниСм Π»ΡƒΡ‡ΡˆΠ΅ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π°Π½ΡΠ°ΠΌΠ±Π»Π΅Π²ΡƒΡŽ модСль ΠΌΠ΅Π½Π΅Π΅ смСщСнной.

БфокусируСм Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° бэггингС

Π’ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… ΠΌΡ‹ рассматриваСм Ρ€Π°Π·Π½Ρ‹Ρ… ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² нСзависимо Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° Π΄Ρ€ΡƒΠ³Π° ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΈΡ… ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ. НаиболСС извСстным ΠΈΠ· Ρ‚Π°ΠΊΠΈΡ… ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠΌ являСтся «бэггинг» (ΠΎΡ‚ Β«bootstrap aggregationΒ»), Ρ†Π΅Π»ΡŒΡŽ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ являСтся созданиС ансамблСвой ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая являСтся Π±ΠΎΠ»Π΅Π΅ Π½Π°Π΄Π΅ΠΆΠ½ΠΎΠΉ, Ρ‡Π΅ΠΌ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π΅Π΅ ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠ΅.

Бутстрэп

Π”Π°Π²Π°ΠΉΡ‚Π΅ Π½Π°Ρ‡Π½Π΅ΠΌ с опрСдСлСния бутстрэпа. Π­Ρ‚ΠΎΡ‚ статистичСский ΠΌΠ΅Ρ‚ΠΎΠ΄ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° B (Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ) ΠΈΠ· исходного датасСта Ρ€Π°Π·ΠΌΠ΅Ρ€Π° N ΠΏΡƒΡ‚Π΅ΠΌ случайного Π²Ρ‹Π±ΠΎΡ€Π° элСмСнтов с повторСниями Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΠΈΠ· наблюдСний B.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠ˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ процСсса бустрэпа

ΠŸΡ€ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… допущСниях эти Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ довольно Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ статистичСскиС свойства: Π² ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠΈ ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ взятыС нСпосрСдствСнно ΠΈΠ· истинного Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ (ΠΈ часто нСизвСстного) распрСдСлСния Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊ ΠΈ нСзависимо Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ ΠΈ нСзависимыС Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ истинного распрСдСлСния Π΄Π°Π½Π½Ρ‹Ρ… (ΠΏΠΎΡ‡Ρ‚ΠΈ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½Ρ‹Π΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ). Π“ΠΈΠΏΠΎΡ‚Π΅Π·Π°, которая Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ ΠΏΡ€ΠΎΠ²Π΅Ρ€Π΅Π½Π°, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ это ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠ΅ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ, ΠΈΠΌΠ΅Π΅Ρ‚ Π΄Π²Π΅ стороны. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Ρ€Π°Π·ΠΌΠ΅Ρ€ N исходного датасСта Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ достаточно большим, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ…Π²Π°Ρ‚ΠΈΡ‚ΡŒ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ слоТности Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ распрСдСлСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° ΠΈΠ· датасСта Π±Ρ‹Π»Π° Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΌ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠ΅ΠΌ ΠΊ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ ΠΈΠ· Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ распрСдСлСния (Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ). Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Ρ€Π°Π·ΠΌΠ΅Ρ€ датасСта N Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ достаточно большим ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ B, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π½Π΅ слишком сильно ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ (Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ). ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ Π² дальнСйшСм ΠΌΡ‹ ΠΈΠ½ΠΎΠ³Π΄Π° Π±ΡƒΠ΄Π΅ΠΌ ΡΡΡ‹Π»Π°Ρ‚ΡŒΡΡ Π½Π° эти свойства (Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΈ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ) бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ: Ρ‡ΠΈΡ‚Π°Ρ‚Π΅Π»ΡŒ всСгда Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ это Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠ΅.

Бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, для ΠΎΡ†Π΅Π½ΠΊΠΈ разброса ΠΈΠ»ΠΈ Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΠΎΠ² статистичСских ΠΎΡ†Π΅Π½ΠΎΠΊ. По ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ статистичСская ΠΎΡ†Π΅Π½ΠΊΠ° являСтся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… наблюдСний ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, случайной Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ с разбросом, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌ ΠΈΠ· этих наблюдСний. Π§Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ разброс Ρ‚Π°ΠΊΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ, Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π΅Π³ΠΎ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… нСзависимых Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ…, взятых ΠΈΠ· ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‰Π΅Π³ΠΎ распрСдСлСния. Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв рассмотрСниС Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ нСзависимых Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎ Π±Ρ‹ слишком большого количСства Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Ρ€Π΅Π°Π»ΡŒΠ½ΠΎ доступным количСством. Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ бутстрэп, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ нСсколько бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ Β«ΠΏΠΎΡ‡Ρ‚ΠΈ Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅Β» ΠΈ Β«ΠΏΠΎΡ‡Ρ‚ΠΈ нСзависимыС» (ΠΏΠΎΡ‡Ρ‚ΠΈ «нСзависимыС ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ распрСдСлСнныС Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈΒ»). Π­Ρ‚ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ позволят Π½Π°ΠΌ Π°ΠΏΠΏΡ€ΠΎΠΊΡΠΈΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ разброс ΠΎΡ†Π΅Π½ΠΊΠΈ, оцСнивая Π΅Π³ΠΎ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· Π½ΠΈΡ….

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном обучСнииБутстрэп часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ разброса ΠΈΠ»ΠΈ Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… статистичСских ΠΎΡ†Π΅Π½ΠΎΠΊ

Бэггинг

ΠŸΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, нСзависимо ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, ΠΈΠΌΠ΅Π΅ΠΌ Π»ΠΈ ΠΌΡ‹ Π΄Π΅Π»ΠΎ с
ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ классификации ΠΈΠ»ΠΈ рСгрСссии, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ, которая ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ опрСдСляСтся Π² ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ датасСта. Из-Π·Π° тСорСтичСского разброса ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ датасСта (ΠΌΡ‹ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ датасСт являСтся наблюдаСмой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΎΠΉ, исходящСй ΠΈΠ· истинно нСизвСстного Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ распрСдСлСния), подобранная модСль Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠ΄Π²Π΅Ρ€ΠΆΠ΅Π½Π° измСнчивости: Ссли Π±Ρ‹ наблюдался Π΄Ρ€ΡƒΠ³ΠΎΠΉ датасСт, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Π±Ρ‹ Π΄Ρ€ΡƒΠ³ΡƒΡŽ модСль.

ИдСя бэггинга Π² Ρ‚Π°ΠΊΠΎΠΌ случаС проста: ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ нСсколько нСзависимых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ Β«ΡƒΡΡ€Π΅Π΄Π½ΠΈΡ‚ΡŒΒ» ΠΈΡ… ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ модСль с мСньшим разбросом. Однако Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΌΡ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ нСзависимыС ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ для этого потрСбуСтся слишком ΠΌΠ½ΠΎΠ³ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΡ‹ полагаСмся Π½Π° Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Β«ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ свойства» бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ (Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΈ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ) для ΠΏΠΎΠ΄Π±ΠΎΡ€Π° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ практичСски нСзависимы.

Π‘Π½Π°Ρ‡Π°Π»Π° ΠΌΡ‹ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅ΠΌ нСсколько бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ каТдая новая бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° выполняла Ρ€ΠΎΠ»ΡŒ (ΠΏΠΎΡ‡Ρ‚ΠΈ) Π΅Ρ‰Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ нСзависимого датасСта, взятого ΠΈΠ· истинного распрСдСлСния. Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· этих Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΈ, Π½Π°ΠΊΠΎΠ½Π΅Ρ†, Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΌΡ‹ ΠΊΠ°ΠΊ Π±Ρ‹ «усрСднили» ΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ модСль ансамбля с разбросом мСньшим, Ρ‡Π΅ΠΌ Π΅Π΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹. Π“Ρ€ΡƒΠ±ΠΎ говоря, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ нСзависимыми ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ распрСдСлСнными, Ρ‚ΠΎ ΠΆΠ΅ самоС касаСтся ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ². Π—Π°Ρ‚Π΅ΠΌ «усрСднСниС» Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π½Π΅ измСняСт ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚, Π½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ Π΅Π³ΠΎ разброс (Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ усрСднСниС нСзависимых ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ распрСдСлСнных случайных Π²Π΅Π»ΠΈΡ‡ΠΈΠ½ сохраняСт ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, Π½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ разброс).

Π˜Ρ‚Π°ΠΊ, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ L бутстрап Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ (аппроксимации L нСзависимых датасСтов) Ρ€Π°Π·ΠΌΠ΅Ρ€Π° B. Π­Ρ‚ΠΎ обозначаСтся:

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠœΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ L ΠΏΠΎΡ‡Ρ‚ΠΈ нСзависимых слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² (ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π½Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ датасСт):

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

А Π·Π°Ρ‚Π΅ΠΌ объСдиним ΠΈΡ… Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ процСссом усрСднСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ модСль ансамбля с мСньшим разбросом. НапримСр, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π°ΡˆΡƒ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ модСль Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

БущСствуСт нСсколько Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… способов ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ нСсколько ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½ΠΎ. Для Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π±ΡƒΠΊΠ²Π°Π»ΡŒΠ½ΠΎ усрСднСны для получСния Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля. Для Π·Π°Π΄Π°Ρ‡ΠΈ классификации класс, прСдсказываСмый ΠΊΠ°ΠΆΠ΄ΠΎΠΉ модСлью, ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ голос, Π° класс, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ голосов, являСтся ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠΌ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля (это называСтся ΠΌΠ°ΠΆΠΎΡ€ΠΈΡ‚Π°Ρ€Π½Ρ‹ΠΌ голосованиСм). Π§Ρ‚ΠΎ касаСтся Π·Π°Π΄Π°Ρ‡ΠΈ классификации, ΠΌΡ‹ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅ΠΌ Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ вСроятности ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса, прСдсказываСмыС всСми модСлями, ΡƒΡΡ€Π΅Π΄Π½ΠΈΡ‚ΡŒ эти вСроятности ΠΈ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ класс с самой высокой срСднСй Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ (это называСтся мягким голосованиСм). Π‘Ρ€Π΅Π΄Π½ΠΈΠ΅ значСния ΠΈΠ»ΠΈ голоса ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ простыми ΠΈΠ»ΠΈ Π²Π·Π²Π΅ΡˆΠ΅Π½Π½Ρ‹ΠΌΠΈ, Ссли Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π»ΡŽΠ±Ρ‹Π΅ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΈΠΌ вСса.

НаконСц, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· Π±ΠΎΠ»ΡŒΡˆΠΈΡ… прСимущСств бэггинга являСтся Π΅Π³ΠΎ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΠ·ΠΌ. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ нСзависимо Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°, ΠΏΡ€ΠΈ нСобходимости ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ интСнсивного распараллСливания.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном обучСнииБэггинг состоит ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ… ΠΈ построСния ансамблСвой ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая «усрСдняСт» Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ этих слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ²

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹Π΅ лСса

Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΡ‡Π΅Π½ΡŒ популярными Π±Π°Π·ΠΎΠ²Ρ‹ΠΌΠΈ модСлями для ансамблСвых ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ². Π‘ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΡƒΡ‡Π΅Π½ΠΈΠΊΠΈ, состоящиС ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Π·Π²Π°Ρ‚ΡŒ «лСсами». Π”Π΅Ρ€Π΅Π²ΡŒΡ, ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠ΅ лСс, ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π²Ρ‹Π±Ρ€Π°Π½Ρ‹ Π»ΠΈΠ±ΠΎ Π½Π΅Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΌΠΈ (Π³Π»ΡƒΠ±ΠΈΠ½ΠΎΠΉ Π² нСсколько ΡƒΠ·Π»ΠΎΠ²), Π»ΠΈΠ±ΠΎ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΌΠΈ (Π³Π»ΡƒΠ±ΠΈΠ½ΠΎΠΉ Π² мноТСство ΡƒΠ·Π»ΠΎΠ², Ссли Π½Π΅ Π² ΠΏΠΎΠ»Π½ΡƒΡŽ Π³Π»ΡƒΠ±ΠΈΠ½Ρƒ со всСми Π»ΠΈΡΡ‚ΡŒΡΠΌΠΈ). НСглубокиС Π΄Π΅Ρ€Π΅Π²ΡŒΡ ΠΈΠΌΠ΅ΡŽΡ‚ мСньший разброс, Π½ΠΎ Π±ΠΎΠ»Π΅Π΅ высокоС смСщСниС, ΠΈ Ρ‚ΠΎΠ³Π΄Π° для Π½ΠΈΡ… Π»ΡƒΡ‡ΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ станут ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ опишСм ΠΏΠΎΠ·ΠΆΠ΅. Π“Π»ΡƒΠ±ΠΎΠΊΠΈΠ΅ Π΄Π΅Ρ€Π΅Π²ΡŒΡ, с Π΄Ρ€ΡƒΠ³ΠΎΠΉ стороны, ΠΈΠΌΠ΅ΡŽΡ‚ Π½ΠΈΠ·ΠΊΠΎΠ΅ смСщСниС, Π½ΠΎ высокий разброс ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΡΠ²Π»ΡΡŽΡ‚ΡΡ подходящим Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ для бэггинга, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π² основном Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ Π½Π° ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠ΅ разброса.

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс прСдставляСт собой ΠΌΠ΅Ρ‚ΠΎΠ΄ бэггинга, Π³Π΄Π΅ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠ΅ Π΄Π΅Ρ€Π΅Π²ΡŒΡ, ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π½Π° бутстрап Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ…, ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ для получСния Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° с Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΈΠΌ разбросом. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, случайныС лСса Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΠΏΡ€ΠΈΠ΅ΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ нСсколько ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Π±Ρ‹Π»ΠΈ ΠΌΠ΅Π½Π΅Π΅ ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌΠΈ Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ: ΠΏΡ€ΠΈ построСнии ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄Π΅Ρ€Π΅Π²Π° вмСсто Π²Ρ‹Π±ΠΎΡ€Π° всСх ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΠ· датасСта для Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ бутстрэпа ΠΌΡ‹ Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌ ΠΈ сохраняСм Ρ‚ΠΎΠ»ΡŒΠΊΠΎ случайноС ΠΈΡ… подмноТСство для построСния Π΄Π΅Ρ€Π΅Π²Π° (ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ΅ для всСх бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ).

Π’Ρ‹Π±ΠΎΡ€ΠΊΠ° ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Ρ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ всС Π΄Π΅Ρ€Π΅Π²ΡŒΡ Π½Π΅ смотрят Π½Π° ΠΎΠ΄Π½Ρƒ ΠΈ Ρ‚Ρƒ ΠΆΠ΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ для принятия своих Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°ΡŽΡ‚ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡŽ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅ΠΌΡ‹ΠΌΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. Π”Ρ€ΡƒΠ³ΠΎΠ΅ прСимущСство Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° Π΄Π΅Π»Π°Π΅Ρ‚ процСсс принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π±ΠΎΠ»Π΅Π΅ устойчивым ΠΊ ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ: значСния наблюдСния (ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ датасСта ΠΈΠ»ΠΈ Π½Π΅Ρ‚) с ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ ΠΌΠΎΠΆΠ½ΠΎ Π²ΠΎΡΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°Ρ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ рСгрСссии ΠΈΠ»ΠΈ классификации Π½Π° основС Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ, Π³Π΄Π΅ Π΄Π°Π½Π½Ρ‹Π΅ Π½Π΅ ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ случайного лСса сочСтаСт Π² сСбС ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΈ бэггинга ΠΈ Π²Ρ‹Π±ΠΎΡ€Π° подпространства случайных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² для создания Π±ΠΎΠ»Π΅Π΅ устойчивых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠœΠ΅Ρ‚ΠΎΠ΄ случайного лСса β€” это ΠΌΠ΅Ρ‚ΠΎΠ΄ бэггинга с Π΄Π΅Ρ€Π΅Π²ΡŒΡΠΌΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² качСствС слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ². КаТдоС Π΄Π΅Ρ€Π΅Π²ΠΎ помСщаСтся Π² бутстрэп Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ, Ρ‚ΠΎΠ»ΡŒΠΊΠΎ с ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ случайного Π²Ρ‹Π±ΠΎΡ€Π° подмноТСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

БфокусируСм Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° бустингС

Π’ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ слабыС ΠΌΠΎΠ΄Π΅Π»ΠΈ большС Π½Π΅ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ нСзависимо Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°. ИдСя состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° Π΄Π°Π½Π½ΠΎΠΌ этапС зависСло ΠΎΡ‚ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… этапах. Бустинг являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ извСстным ΠΈΠ· этих ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠ², ΠΈ ΠΎΠ½ создаСт Π°Π½ΡΠ°ΠΌΠ±Π»Π΅Π²ΡƒΡŽ модСль, которая ΠΈΠΌΠ΅Π΅Ρ‚ мСньшСС смСщСниС, Ρ‡Π΅ΠΌ ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠ΅ Π΅Π΅ слабыС ΡƒΡ‡Π΅Π½ΠΈΠΊΠΈ.

Бустинг

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ бустинга Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Π² Ρ‚ΠΎΠΌ ΠΆΠ΅ Π΄ΡƒΡ…Π΅, Ρ‡Ρ‚ΠΎ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ бэггинга: ΠΌΡ‹ создаСм сСмСйство ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ сильного ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π»ΡƒΡ‡ΡˆΠ΅ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚. Однако, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ бэггинга, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π² основном Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΎ Π½Π° ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠ΅ разброса, бустинг β€” это ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½Ρ‹ΠΌ способом: каТдая модСль Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ подбираСтся, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ΄Π°Π΅Ρ‚ большСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ Π² датасСтС, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠ»ΠΎΡ…ΠΎ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π»ΠΈΡΡŒ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠΌΠΈ модСлями Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ, каТдая новая модСль фокусируСт свои усилия Π½Π° самых слоТных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°Ρ… Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Π² ΠΊΠΎΠ½Ρ†Π΅ процСсса сильного ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° с Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΈΠΌ смСщСниСм (Π΄Π°ΠΆΠ΅ Ссли получится Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎ бустинг Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΈ этом ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ‚ΡŒ разброс). Бустинг, ΠΊΠ°ΠΊ ΠΈ бэггинг, ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΊΠ°ΠΊ для Π·Π°Π΄Π°Ρ‡ рСгрСссии, Ρ‚Π°ΠΊ ΠΈ для классификации.

Π‘Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ часто Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ для бустинга β€” это ΠΌΠΎΠ΄Π΅Π»ΠΈ с Π½ΠΈΠ·ΠΊΠΈΠΌ разбросом, Π½ΠΎ с высоким смСщСниСм. НапримСр, Ссли ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² качСствС Π½Π°ΡˆΠΈΡ… Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π² основном ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ Π½Π΅Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠ΅ Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ с Π³Π»ΡƒΠ±ΠΈΠ½ΠΎΠΉ Π² нСсколько ΡƒΠ·Π»ΠΎΠ². Другая ваТная ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π°, которая ΠΌΠΎΡ‚ΠΈΠ²ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ с Π½ΠΈΠ·ΠΊΠΈΠΌ разбросом, Π½ΠΎ с высоким смСщСниСм Π² качСствС слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² для бустинга, Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ эти ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ ΠΌΠ΅Π½ΡŒΡˆΠΈΡ… Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Ρ‚Ρ€Π°Ρ‚ (нСсколько стСпСнСй свободы ΠΏΡ€ΠΈ ΠΏΠΎΠ΄Π±ΠΎΡ€Π΅ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ²). Π”Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ вычислСния для ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΈ ΠΊ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌ модСлям Π½Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒΡΡ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½ΠΎ (Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ бэггинга), это ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ слишком дорогостоящим для ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ΄Π±ΠΎΡ€Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… слоТных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

ПослС Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ слабыС ΡƒΡ‡Π΅Π½ΠΈΠΊΠΈ Π²Ρ‹Π±Ρ€Π°Π½Ρ‹, Π½Π°ΠΌ всС Π΅Ρ‰Π΅ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ΄Π³ΠΎΠ½ΡΡ‚ΡŒΡΡ (ΠΊΠ°ΠΊΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΡ‹ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅ΠΌ ΠΏΡ€ΠΈ ΠΏΠΎΠ΄Π±ΠΎΡ€Π΅ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ?) И ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ (ΠΊΠ°ΠΊ ΠΌΡ‹ Π°Π³Ρ€Π΅Π³ΠΈΡ€ΡƒΠ΅ΠΌ Ρ‚Π΅ΠΊΡƒΡ‰ΡƒΡŽ модСль ΠΊ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠΌ?). ΠœΡ‹ обсудим эти вопросы Π² Π΄Π²ΡƒΡ… ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΠΏΠΎΠ΄Ρ€Π°Π·Π΄Π΅Π»Π°Ρ…, Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰ΠΈΡ… Π΄Π²Π° Π²Π°ΠΆΠ½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° бустинга: adaboost (Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½Ρ‹ΠΉ бустинг) ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг.

Π’ Π΄Π²ΡƒΡ… словах, эти Π΄Π²Π° ΠΌΠ΅Ρ‚Π°-Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ Ρ‚Π΅ΠΌ, ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ ΡΠΎΠ·Π΄Π°ΡŽΡ‚ ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π² Ρ…ΠΎΠ΄Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ процСсса. Адаптивный бустинг обновляСт вСса, ΠΏΡ€ΠΈΠΊΡ€Π΅ΠΏΠ»Π΅Π½Π½Ρ‹Π΅ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΈΠ· ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ датасСта, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг обновляСт значСния этих ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². Π­Ρ‚Π° Ρ€Π°Π·Π½ΠΈΡ†Π° исходит ΠΈΠ· Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Π° ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠΏΡ‹Ρ‚Π°ΡŽΡ‚ΡΡ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, Π·Π°ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰ΡƒΡŽΡΡ Π² поискС Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ записана Π² Π²ΠΈΠ΄Π΅ взвСшСнной суммы слабых учащихся.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном обучСнииБустинг состоит Π² ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΌ ΠΏΠΎΠ΄Π±ΠΎΡ€Π΅ слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°, Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Π΅Π³ΠΎ Π² модСль ансамбля ΠΈ Β«ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈΒ» ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ датасСта для Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ ΡƒΡ‡Π΅Ρ‚Π° ΡΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΈ слабых сторон Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля ΠΏΡ€ΠΈ ΠΏΠΎΠ΄Π±ΠΎΡ€Π΅ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Адаптивный бустинг

ΠŸΡ€ΠΈ Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½ΠΎΠΌ бустингС (Β«adaboostΒ») ΠΌΡ‹ пытаСмся ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π°ΡˆΡƒ Π°Π½ΡΠ°ΠΌΠ±Π»Π΅Π²ΡƒΡŽ модСль ΠΊΠ°ΠΊ Π²Π·Π²Π΅ΡˆΠ΅Π½Π½ΡƒΡŽ сумму L слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ².

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Поиск Π»ΡƒΡ‡ΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля с этой Ρ„ΠΎΡ€ΠΌΠΎΠΉ записи ансамблСвой ΠΌΠΎΠ΄Π΅Π»ΠΈ являСтся слоТной Π·Π°Π΄Π°Ρ‡Π΅ΠΉ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ. ВмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π΅Π΅ Π·Π° ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· аналитичСски (находя всС коэффициСнты ΠΈ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π°ΡŽΡ‚ Π»ΡƒΡ‡ΡˆΡƒΡŽ ΠΎΠ±Ρ‰ΡƒΡŽ Π°Π΄Π΄ΠΈΡ‚ΠΈΠ²Π½ΡƒΡŽ модСль), ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ процСсс ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π»ΠΈΠ², Π΄Π°ΠΆΠ΅ нСсмотря Π½Π° Ρ‚ΠΎ Ρ‡Ρ‚ΠΎ ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ Π½Π΅ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΌΡƒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ. Π’ частности, ΠΌΡ‹ добавляСм слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π·Π° Π΄Ρ€ΡƒΠ³ΠΈΠΌ, просматривая ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΡŽ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΉΡ‚ΠΈ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΡƒΡŽ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡƒΡŽ ΠΏΠ°Ρ€Ρƒ (коэффициСнт, слабый ΡƒΡ‡Π΅Π½ΠΈΠΊ) для добавлСния ΠΊ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля. Π”Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, ΠΌΡ‹ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎ опрСдСляСм (s_l), ΠΊΠ°ΠΊ

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π³Π΄Π΅ c_l ΠΈ w_l Π²Ρ‹Π±Ρ€Π°Π½Ρ‹ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎ s_l β€” это модСль, которая Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ соотвСтствуСт ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ, ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, это Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠ΅Π΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ΅ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с s_(l-1). Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π³Π΄Π΅ E(.) β€” ошибка ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΈ Π΄Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π° e(. ) β€” функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ/ошибок. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, вмСсто глобальной ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΏΠΎ всСм L-модСлям Π² суммС, ΠΌΡ‹ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°Π΅ΠΌ ΠΎΠΏΡ‚ΠΈΠΌΡƒΠΌ локальной ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ ΠΏΡƒΡ‚Π΅ΠΌ построСния ΠΈ добавлСния слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΊ сильной ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ.

Π’ частности, ΠΏΡ€ΠΈ рассмотрСнии Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ adaboost ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ пСрСписан Π² процСсс, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ выполняСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΎΠ½ обновляСт вСса ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² датасСтС ΠΈ ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ Π½ΠΎΠ²ΠΎΠ³ΠΎ слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°, удСляя особоС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ наблюдСниям, Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ классифицированным Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ансамблСвой модСлью. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, ΠΎΠ½ добавляСт слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° ΠΊ взвСшСнной суммС Π² соотвСтствии с коэффициСнтом обновлСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²Ρ‹Ρ€Π°ΠΆΠ°Π΅Ρ‚ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ этой слабой ΠΌΠΎΠ΄Π΅Π»ΠΈ: Ρ‡Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅ слабый ΡƒΡ‡Π΅Π½ΠΈΠΊ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΠ» свою Ρ€Π°Π±ΠΎΡ‚Ρƒ, Ρ‚Π΅ΠΌ большС ΠΎΠ½ Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΡ‡Ρ‚Π΅Π½ Π² сильном ΡƒΡ‡Π΅Π½ΠΈΠΊΠ΅.

Π˜Ρ‚Π°ΠΊ, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ сталкиваСмся с Π·Π°Π΄Π°Ρ‡Π΅ΠΉ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации с N ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ Π² нашСм датасСтС, ΠΈ ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ adaboost с Π΄Π°Π½Π½Ρ‹ΠΌ сСмСйством слабых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ самом Π½Π°Ρ‡Π°Π»Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (пСрвая модСль ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ) всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Π΅ вСса 1 / N. Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ повторяСм L Ρ€Π°Π· (для L ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ) ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ шаги:

ΠŸΠΎΠ²Ρ‚ΠΎΡ€ΡΡ эти шаги, ΠΌΡ‹ Π·Π°Ρ‚Π΅ΠΌ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ строим наши L ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ объСдиняСм ΠΈΡ… Π² ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΡŽ, Π²Π·Π²Π΅ΡˆΠ΅Π½Π½ΡƒΡŽ ΠΏΠΎ коэффициСнтам, Π²Ρ‹Ρ€Π°ΠΆΠ°ΡŽΡ‰ΠΈΠΌ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°. ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ исходного Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° adaboost, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ LogitBoost (классификация) ΠΈΠ»ΠΈ L2Boost (рСгрСссия), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π² основном Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ ΠΏΠΎ своСму Π²Ρ‹Π±ΠΎΡ€Ρƒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Adaboost обновляСт вСса ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ. ВСса Ρ…ΠΎΡ€ΠΎΡˆΠΎ классифицированных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°ΡŽΡ‚ΡΡ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ вСсов Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ классифицированных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². МодСли, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Π»ΡƒΡ‡ΡˆΠ΅, ΠΈΠΌΠ΅ΡŽΡ‚ больший вСс Π² ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля.

Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг

ΠŸΡ€ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠΌ бустингС модСль ансамбля, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΡ‹ пытаСмся ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ, Ρ‚Π°ΠΊΠΆΠ΅ прСдставляСт собой Π²Π·Π²Π΅ΡˆΠ΅Π½Π½ΡƒΡŽ сумму слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ².

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Как ΠΌΡ‹ ΡƒΠΆΠ΅ ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π»ΠΈ для adaboost, Π½Π°ΠΉΡ‚ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΡƒΡŽ модСль ΠΏΡ€ΠΈ этой Ρ„ΠΎΡ€ΠΌΠ΅ записи ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля слишком слоТно, ΠΈ трСбуСтся ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄. ОсновноС ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ бустинга Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠΈ процСсса ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ. ΠšΡ‚ΠΎ Π±Ρ‹ ΠΌΠΎΠ³ ΠΏΠΎΠ΄ΡƒΠΌΠ°Ρ‚ΡŒ, Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг сводит Π·Π°Π΄Π°Ρ‡Ρƒ ΠΊ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠΌΡƒ спуску: Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΌΡ‹ подгоняСм слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° ΠΊ Π°Π½Ρ‚ΠΈΠ³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ошибки ΠΏΠΎΠ΄Π±ΠΎΡ€Π° ΠΏΠΎ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡŽ ΠΊ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ ΠΏΡ€ΠΎΡΡΠ½ΠΈΡ‚ΡŒ этот послСдний ΠΌΠΎΠΌΠ΅Π½Ρ‚. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, тСорСтичСский процСсс Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска ΠΏΠΎ ансамблСвой ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ записан ΠΊΠ°ΠΊ

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π³Π΄Π΅ E (.) β€” ошибка ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΈ Π΄Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, c_l β€” коэффициСнт, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ€Ρƒ шага, ΠΈ

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

являСтся Π°Π½Ρ‚ΠΈΠ³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠΌ ошибки ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΈ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля Π½Π° шагС l_1. Π­Ρ‚ΠΎΡ‚ (довольно абстрактный) Π°Π½Ρ‚ΠΈΠ³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ являСтся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ, которая Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ (для ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅): эти ΠΎΡ†Π΅Π½ΠΊΠΈ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ псСвдо-остатками, ΠΏΡ€ΠΈΠΊΡ€Π΅ΠΏΠ»Π΅Π½Π½Ρ‹ΠΌΠΈ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ. Π‘ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΠ³ΠΎ, Π΄Π°ΠΆΠ΅ Ссли ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ для наблюдСний значСния этих псСвдо-остатков, ΠΌΡ‹ Π½Π΅ Ρ…ΠΎΡ‚ΠΈΠΌ Π΄ΠΎΠ±Π°Π²Π»ΡΡ‚ΡŒ Π² Π½Π°ΡˆΡƒ модСль ансамбля ΠΊΠ°ΠΊΡƒΡŽ-Π»ΠΈΠ±ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ: ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½ΠΎΠ²Ρ‹ΠΉ экзСмпляр слабой ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, СстСствСнная Π²Π΅Ρ‰ΡŒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π½ΡƒΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ, это Π½Π°ΡƒΡ‡ΠΈΡ‚ΡŒΡΠ»Π°Π±ΠΎΠ³ΠΎ ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° псСвдо-остаткам для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ наблюдСния. НаконСц, коэффициСнт c_l вычисляСтся Π² соотвСтствии с ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΌ процСссом ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ (Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ поиск для получСния Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° шага c_l).

Π˜Ρ‚Π°ΠΊ, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг с сСмСйством слабых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ самом Π½Π°Ρ‡Π°Π»Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (пСрвая модСль ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ) псСвдо-остатки ΡƒΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°ΡŽΡ‚ΡΡ Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ значСниям ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ повторяСм L Ρ€Π°Π· (для L ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ) ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ шаги:

ΠŸΠΎΠ²Ρ‚ΠΎΡ€ΡΡ эти шаги, ΠΌΡ‹ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ строим наши L ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ Π°Π³Ρ€Π΅Π³ΠΈΡ€ΡƒΠ΅ΠΌ ΠΈΡ… Π² соотвСтствии с ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠΌ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска. ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ, хотя Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½Ρ‹ΠΉ бустинг пытаСтся Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΈΠΌΠ΅Π½Π½ΠΎ Β«Π»ΠΎΠΊΠ°Π»ΡŒΠ½ΡƒΡŽΒ» Π·Π°Π΄Π°Ρ‡Ρƒ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ (Π½Π°ΠΉΡ‚ΠΈ Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° ΠΈ Π΅Π³ΠΎ коэффициСнт, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½ΡƒΠΆΠ½ΠΎ Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊ сильной ΠΌΠΎΠ΄Π΅Π»ΠΈ), Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ вмСсто этого ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ с Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΌ спуском ΠΈ Π΅Π³ΠΎ Π»Π΅Π³Ρ‡Π΅ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΊ Π±ΠΎΠ»ΡŒΡˆΠΎΠΌΡƒ количСству Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅ adaboost для ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½Ρ‹Ρ… Π΄ΠΈΡ„Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Ρ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠ“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг обновляСт значСния наблюдСний Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ. Π‘Π»Π°Π±Ρ‹Ρ… ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ ΠΏΠΎΠ΄Π³ΠΎΠ½ΡΡ‚ΡŒΡΡ ΠΏΠΎΠ΄ псСвдо-остатки, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚, Π² ΠΊΠ°ΠΊΠΎΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ½ΠΈΠ·ΠΈΡ‚ΡŒ ΠΎΡˆΠΈΠ±ΠΊΡƒ.

ΠžΠ±Π·ΠΎΡ€ стСкинга

Π‘Ρ‚Π΅ΠΊΠΈΠ½Π³ ΠΈΠΌΠ΅Π΅Ρ‚ Π΄Π²Π° основных отличия ΠΎΡ‚ бэггинга ΠΈ бустинга. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, стСкинг часто ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ Ρ€Π°Π·Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² (ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Ρ€Π°Π·Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ обучСния), Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ бэггинг ΠΈ бустинг ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ Π² основном ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ². Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, стСкинг ΡƒΡ‡ΠΈΡ‚ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с использованиСм ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ бэггинг ΠΈ бустинг ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ дСтСрминистичСским Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ.

Π‘Ρ‚Π΅ΠΊΠΈΠ½Π³

Как ΠΌΡ‹ ΡƒΠΆΠ΅ ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π»ΠΈ, идСя стСкинга состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Ρ€Π°Π·Π½Ρ‹Ρ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΈ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ ΠΈΡ…, ΠΎΠ±ΡƒΡ‡ΠΈΠ² ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ для Π²Ρ‹Π²ΠΎΠ΄Π° прСдсказаний, основанных Π½Π° мноТСствСнных прСдсказаниях, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅ΠΌΡ‹Ρ… этими слабыми модСлями. Π˜Ρ‚Π°ΠΊ, Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π΄Π²Π΅ Π²Π΅Ρ‰ΠΈ для построСния нашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ стСка: L ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ, ΠΈ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ, которая ΠΈΡ… ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚.

НапримСр, для Π·Π°Π΄Π°Ρ‡ΠΈ классификации ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π² качСствС слабого ΡƒΡ‡Π΅Π½ΠΈΠΊΠ° Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ классификатор KNN, Π»ΠΎΠ³ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ ΠΈ SVM ΠΈ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ Π² качСствС ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π—Π°Ρ‚Π΅ΠΌ нСйронная ΡΠ΅Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ‚ Π² качСствС Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ‚Ρ€Π΅Ρ… Π½Π°ΡˆΠΈΡ… слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² ΠΈ научится Π΄Π°Π²Π°Ρ‚ΡŒ ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π½Π° ΠΈΡ… основС.

Π˜Ρ‚Π°ΠΊ, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ стСковый ансамбль, составлСнный ΠΈΠ· L слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ². Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ шаги:

На ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… этапах ΠΌΡ‹ Ρ€Π°Π·Π±ΠΈΠ»ΠΈ датасСт Π½Π° Π΄Π²Π΅ части, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ использовались для обучСния слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ², Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ ΠΊ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹ΠΌ нСдостатком этого раздСлСния нашСго датасСта Π½Π° Π΄Π²Π΅ части являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π° Π΄Π°Π½Π½Ρ‹Ρ… для обучСния Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π° Π΄Π°Π½Π½Ρ‹Ρ… для обучСния ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€Π΅ΠΎΠ΄ΠΎΠ»Π΅Ρ‚ΡŒ это ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ, ΠΎΠ΄Π½Π°ΠΊΠΎ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρƒ Β«k-fold кросс-ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Β» (Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎΠΌΡƒ Ρ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ дСлаСтся Π² k-fold кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ), Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Ρ‹ для обучСния ΠΌΠ΅Ρ‚Π°-ΠΌΠΎΠ΄Π΅Π»ΠΈ: для любого ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° прСдсказаниС слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² дСлаСтся Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ… этих слабых ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ², ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π½Π° k-1 Ρ„ΠΎΠ»Π΄Π°Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ содСрТат рассматриваСмого ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°. Π”Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, ΠΎΠ½ обучаСтся ΠΏΠΎ k-1 Ρ„ΠΎΠ»Π΄Π°ΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ для ΠΎΡΡ‚Π°Π²ΡˆΠ΅Π³ΠΎΡΡ Ρ„ΠΎΠ»Π΄Π° для ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² Π»ΡŽΠ±Ρ‹Ρ… Ρ„ΠΎΠ»Π΄Π°Ρ…. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° нашСго датасСта, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π°ΡˆΡƒ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ всСм этим ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°ΠΌ.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠ‘Ρ‚Π΅ΠΊΠΈΠ½Π³ состоит Π² ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ для получСния Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ², основанных Π½Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°Ρ…, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… нСсколькими слабыми ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°ΠΌΠΈ Π½ΠΈΠΆΠ½Π΅Π³ΠΎ уровня

ΠœΠ½ΠΎΠ³ΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹ΠΉ стСкинг

Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ΅ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΠ΅ стСкинга β€” ΠΌΠ½ΠΎΠ³ΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹ΠΉ стСкинг. Он Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠΈ стСкинга с нСсколькими слоями. Π’ качСствС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Π΄Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим стСкинг Π² 3 уровня. На ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ (слоС) ΠΌΡ‹ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΠΌ ΠΊ L слабым ΡƒΡ‡Π΅Π½ΠΈΠΊΠ°ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ Π²Ρ‹Π±Ρ€Π°Π½Ρ‹. Π—Π°Ρ‚Π΅ΠΌ Π½Π° Π²Ρ‚ΠΎΡ€ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ вмСсто обучСния ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°ΠΌ слабых ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (ΠΊΠ°ΠΊ это Π±Ρ‹Π»ΠΎ описано Π² ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ ΠΏΠΎΠ΄Ρ€Π°Π·Π΄Π΅Π»Π΅) ΠΌΡ‹ ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌ М Ρ‚Π°ΠΊΠΈΡ… ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. НаконСц, Π½Π° Ρ‚Ρ€Π΅Ρ‚ΡŒΠ΅ΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΌΡ‹ ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌ послСднюю ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΡŒ, которая ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π² качСствС Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅ΠΌΡ‹Π΅ М мСтамодСлями ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ уровня.

ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ ансамбли ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈΠœΠ½ΠΎΠ³ΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹ΠΉ стСкинг ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ нСсколько ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ стСкинга: Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠ΅Ρ‚Π°ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅ΠΌΡ‹Ρ… мСтамодСлями Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΎΠ³ΠΎ уровня, ΠΈ Ρ‚Π°ΠΊ Π΄Π°Π»Π΅Π΅. Π—Π΄Π΅ΡΡŒ ΠΌΡ‹ прСдставили 3-Ρ… ΡΠ»ΠΎΠΉΠ½ΡƒΡŽ модСль стСкинга.

Π˜Ρ‚ΠΎΠ³ΠΈ

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Π²Ρ‹Π²ΠΎΠ΄Ρ‹ этой ΡΡ‚Π°Ρ‚ΡŒΠΈ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅:

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ Π΄Π°Π»ΠΈ Π±Π°Π·ΠΎΠ²Ρ‹ΠΉ ΠΎΠ±Π·ΠΎΡ€ ансамблСвых ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΈ, Π² частности, Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… основных понятий Π² этой области: бутстрэп, бэггинг, случайный лСс, бустинг (adaboost, Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг) ΠΈ стСкинг. Π‘Ρ€Π΅Π΄ΠΈ оставлСнных Π² сторонС понятий ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚ΡŒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΡ†Π΅Π½ΠΊΠΈ Out-Of-Bag для бэггинга ΠΈΠ»ΠΈ Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‡Π΅Π½ΡŒ популярный Β«XGBoostΒ» (Ρ‡Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ eXtrem Gradient Boosting), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ являСтся Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΎΠΉ, Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΡŽΡ‰Π΅ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ бустинга вмСстС с мноТСством Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ‚Ρ€ΡŽΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π΅Π»Π°ΡŽΡ‚ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ Π±ΠΎΠ»Π΅Π΅ эффСктивным (ΠΈ ΠΏΡ€ΠΈΠ³ΠΎΠ΄Π½Ρ‹ΠΌ для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… датасСтов).

НаконСц, ΠΌΡ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ Π±Ρ‹ Π² Π·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ Π½Π°ΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ансамблСй β€” это объСдинСниС Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ для получСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ансамбля с Π»ΡƒΡ‡ΡˆΠΈΠΌΠΈ характСристиками. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π΄Π°ΠΆΠ΅ Ссли бэггинг, бустинг ΠΈ стСкинг ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ ансамблСвыми ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ для Π»ΡƒΡ‡ΡˆΠ΅ΠΉ Π°Π΄Π°ΠΏΡ‚Π°Ρ†ΠΈΠΈ ΠΊ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΌ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°ΠΌ. Π’ основном это Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π΄Π²ΡƒΡ… Π²Π΅Ρ‰Π΅ΠΉ: ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ сталкиваСмся и… ΠΏΡ€ΠΎΡΠ²ΠΈΡ‚ΡŒ творчСский ΠΏΠΎΠ΄Ρ…ΠΎΠ΄!

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *