Microsoft записала в ДНК пісню Deep Purple
30 Жовтня , 2017
Недорогий будинок-контейнер тепер можна придбати на Amazon
30 Жовтня , 2017

Потужніша версія програми AlphaGo самостійно досягла рівня досконалості лише за три дні

Нагадаємо нашим читачам, що протягом нинішнього і минулого року програма AlphaGo, побудована на принципах штучного інтелекту, здобула ряд визначних перемог над висококваліфікованими гравцями в древню китайську гру Го, включаючи і чемпіона світу Лі Седоля (Lee Sedol). І не так давно представники DeepMind, підрозділу компанії Google, що займається розробкою систем штучного інтелекту, представили новий і потужніший варіант програми – AlphaGo Zero. Під час тестових випробувань нова програма обіграла свій попередній варіант, той, який свого часу здобув перемогу над Лі Седолем, абсолютно “всуху”, з неймовірним рахунком 100:0.
Нагадаємо нашим читачам, що оригінальний варіант програми AlphaGo отримав початковий досвід, проаналізувавши близько 160 тисяч матчів, зіграних в онлайн-режимі живими людьми, членами всесвітньої асоціації гри Го. Після цього початкового навчання програма AlphaGo почала грати сама з собою і мільйони таких “внутрішніх” матчів дозволили їй підняти майстерність гри на недосяжний для людей рівень.
Нова система AlphaGo Zero вже не потребує навіть первісних людських знань, процес її навчання заснований тільки на механізмі гри самої з собою. На початку самонавчання програма робила перші кроки (ходи) абсолютно довільно і випадково, запам’ятовуючи ті комбінації, які ведуть до перемоги і поразки. І за 29 мільйонів таких ігор, зіграних самої з собою лише за три дні, система AlphaGo Zero стала найкращим гравцем на земній кулі.
График развития системы AlphaGo Zero
Система AlphaGo Zero простіша і “розумніша”, ніж система попереднього покоління. До складу оригінальної програми входили два незалежних навчальних і самонавчальних модуля, побудованих на базі штучних нейронних мереж. Один модуль відповідав за оцінку поточної ситуації на ігровій дошці, а другий – шукав всі доступні варіанти наступного ходу. І третій модуль обирали зі знайдених варіантів наступного ходу тільки ті, які відповідають обраній стратегії поточного матчу і ведуть до перемоги. Система AlphaGo Zero є ще кращим гравцем за рахунок того, що у цієї системи є єдина потужна нейронна мережа, яка одночасно аналізує становище на дошці і обирає наступний хід за допомогою простішого модуля пошуку за кількома критеріями.
І на закінчення слід зазначити, що деякі ідеї, втілені в життя фахівцями DeepMind при створенні системи AlphaGo, були використані компанією Google в практичних цілях. Завдяки роботі штучного інтелекту компанії вдалось істотно скоротити витрати на охолодження інформаційних центрів, а загальна сума прибутку, отриманого всіма відділами компанії Alphabet, склала вже близько 40 мільйонів фунтів стерлінгів. Більш того, алгоритми, що лежать в основі нової системи AlphaGo Zero, можуть бути досить легко адаптовані для вирішення безлічі проблем наукового і технічного плану, наприклад, для розробки нових лікарських препаратів, конструкційних матеріалів і всього іншого, де необхідно робити якісний вибір з “математичного океану” всіх можливих варіантів рішень.

Джерело

LEU
LEU
Головний редактор сайту uaengineer.com.ua

Залишити відповідь

Увійти за допомогою: