
Блог | Десять лет после AlphaGo: стратегия – сила будущего. Часть первая

Часть первая: Игра, изменившая мышление
Март 2016 года. Сеул. Компьютерная программа AlphaGo от DeepMind побеждает Ли Седоля – одного из величайших игроков в го за всю задокументированную историю игры – со счётом 4:1. Миллионы зрителей наблюдают за этим в прямом эфире. Но лишь те, кто по-настоящему понимает природу го, осознают: произошло нечто необратимое. Не просто технологический рекорд – сломана парадигма. Переосмыслена сама природа стратегического мышления.
Я хочу говорить не об архитектуре нейронных сетей и не о вычислительной мощности серверов DeepMind. Считаю необходимым сосредоточиться на выводах – для людей, государства и мира.
От Сунь-цзы до теории игр: стратегия как инвариант цивилизации
Более 2500 лет назад Сунь-цзы сформулировал принцип, не поддающийся забвению: настоящая победа достигается до начала сражения. Это не красивая метафора – это операционная логика стратегического мышления. Тот, кто уже проиграл в пространстве возможностей, проиграет и на поле боя. Физическая сила лишь исполняет приговор, вынесенный прежде – в умах.
В XX веке математики придали этой интуиции формальную строгость. Джон фон Нейман, а затем Джон Нэш – лауреат Нобелевской премии по экономике – показали: в любом конкурентном взаимодействии оптимальный результат определяется не размером ресурсов, а качеством стратегии. Равновесие Нэша – это не просто концепция из учебника. Это описание реальности, в которой живут люди, армии, государства и корпорации.
Старая максима – стадо овец под командованием льва победит стадо львов под командованием овцы – не является преувеличением. Это точная формула соотношения между качеством стратегии и количеством ресурсов. Военная история полна подтверждений: Фермопилы, Канны, Сталинград. Мощные ресурсы без стратегического интеллекта не просто расточаются, они становятся обузой.
Утверждение, что "стратегия – роскошь во времена, когда есть грубая сила", – это не ошибка, это манипуляция. Её продвигают те, кому выгодно, чтобы массы культивировали лишь исполнительские компетенции, не претендуя на мышление правителей. Стратегическое мышление всегда было дефицитным ресурсом – и именно поэтому оно всегда было ресурсом власти.
Го: знание, формирующее правителей
Игра го существует более четырёх тысяч лет. И на протяжении большей части этого времени она была инструментом воспитания элиты – в буквальном, а не переносном смысле. Есть древняя китайская легенда об императоре Яо, повелевшем создать эту игру для обучения своего сына. Будущий правитель должен был научиться видеть не отдельные ходы, а целостную картину. Не реагировать, а предвидеть, не выигрывать здесь и сейчас, а выстраивать позицию, дающую преимущество в долгой игре. Именно это делает го уникальным занятием.
Го формирует особый тип мышления – пространственный, многоходовой, системный. Это мышление, позволяющее работать с неопределённостью, управлять сложными процессами и принимать решения в условиях ограниченной информации. Не случайно на протяжении столетий го оставалась частью образования элиты в Китае, Японии и Корее.
Доступ к ней определялся не запретами, а значительно тоньше – через образование, среду и время. Го не было закрытым знанием, но оно никогда не было и массовым. Потому что подлинный барьер – не запрет, а способность мыслить на соответствующем уровне.
Го тренирует не конкретные навыки – оно формирует архитектуру мультимодального мышления. Способность одновременно удерживать в поле зрения глобальную картину и локальный конфликт. Умение сознательно уступить тактическую позицию ради стратегического выигрыша. Понимание того, что самый опасный момент не когда ты слаб, а когда ты чувствуешь себя победителем. Эти компетенции возникают лишь через систематическую практику, через тысячи партий, где каждая ошибка стоит результата.
Сегодня го открыто для всех. Это и опасность, и возможность. Опасность в том, что большинство не осознаёт ценности этого инструмента и воспринимает его как экзотическое хобби. Возможность, что любое государство, системно внедряющее го в образование, получает асимметричное преимущество: оно воспитывает поколение, мыслящее иначе – глубже, дальновиднее, устойчивее к манипуляциям.
Детальней о природе этого мышления и место го в эпоху ИИ – в моей статье "Игра Го: многомерность в эпоху искусственного интеллекта"".
Почему компьютер победил в шахматах в 1997-м, но не мог в го до 2016-го
Чтобы понять, почему победа AlphaGo стала событием иного порядка, чем победа шахматного компьютера, нужно остановиться на цифрах.
11 мая 1997 года специализированная шахматная машина IBM Deep Blue победила действующего чемпиона мира Гарри Каспарова со счётом 3½:2½ – впервые в матче с классическим контролем времени. Это была техническая сенсация, но шахматная машина решала задачу, поддающуюся вычислению: количество возможных шахматных партий оценивается приблизительно в 10 в 120-й степени. Грандиозное число, но конечное и обходимое для достаточно мощного процессора методом перебора и отсечения.
В го иная математика. Количество возможных позиций на доске 19×19 превышает 10 в 170-й степени. Это настолько больше, чем в шахматах, что ни один компьютер не способен решить го методом прямого перебора. Именно поэтому Deep Blue – мощнейшая шахматная машина своего времени – была принципиально непригодна для го: ее методы работали в шахматах, но в го сила памяти и скорость вычислений ничего не стоят.
За четыре тысячи лет существования игры не было сыграно ни одной партии, повторившей другую – ни по развитию, ни по финальной позиции. Каждая партия в го – уникальна. Это не преувеличение ради красоты: это математическая неизбежность. Поэтому шахматная логика "выучи библиотеку дебютов и просчитай эндшпиль" здесь не работает.
Именно поэтому го с древних времён притягивало перспективных людей – не только тех, кто хорошо запоминает, но тех, кто умеет творить. Шахматы вознаграждают глубокую память и точный расчёт. Го требует принципиально иного: способности в условиях бесконечной неопределённости формировать новые решения, видеть потенциальные точки роста силы там, где ещё нет ничего. Го – это игра не о воспроизведении, а о творении.
Ход 78: когда проигрыш становится оружием
В четвёртой партии матча, когда счёт уже был 3:0 в пользу AlphaGo, Ли Седоль сделал ход, навсегда вошедший в сокровищницу стратегического искусства. Ход 78 – камень, поставленный в место, которое с точки зрения стандартной теории го выглядело как грубая ошибка. Все системы оценки позиции показывали: этот ход ослабляет собственную позицию. Программа восприняла его как отступление, как проявление слабости – и ответила по логике "сильный продолжает давить".
Но именно это и было ловушкой. AlphaGo, обученная на миллионах "рациональных" партий, не имела в своей модели категории намеренной ошибки как стратегического инструмента. Ли Седоль играл не против программы – он играл против её представления о реальности. И выиграл четвёртую партию. Единственную в своей карьере против AlphaGo.
Здесь есть деталь, придающая этой истории почти литературную симметрию. Во второй партии того же матча AlphaGo сыграла ход 37 – настолько неожиданный, что компьютерные аналитики оценивали вероятность такого хода от любого человека в 1 к 10 000. Машина поразила человечество ходом, которого ни один человеческий разум не предвидел. Через две партии Ли Седоль ответил симметрично: его ход 78 имел ровно ту же вероятность – 1 к 10 000. AlphaGo не считала такой ход возможным со стороны человека. Машина учила людей мыслить иначе – и человек усвоил урок, обратив его против учителя. Это не просто красивая деталь. Это фундаментальный принцип: сильнейшее оружие против любой системы – выйти за пределы её представления о возможном.
Это и есть искусство 36 стратагем в действии. Десятая стратагема – "спрятать меч за улыбкой". Двадцать седьмая – "притвориться безумцем, не теряя рассудка". Оружием становится то, что противник не способен распознать как оружие. Победа материализуется не там, где противник строит оборону, – а именно там, куда он не смотрел, считая это место чужой слабостью.
Те, кто мыслит категориями грубой силы – кто захватывает активы, заливает бетоном крепости, концентрирует ресурсы там, где и без того сильно – принципиально не способны понять эту логику. Они видят лишь текущую позицию. Стратег видит позицию через двадцать ходов и знает: будущая сила растёт из мест, которые сейчас кажутся пустыми.
Поэтому настоящий стратег всегда более ценен как союзник, чем как противник. Он не разрушает чужую силу, он строит собственную. Он не отнимает – он создаёт пространство, где появляется новая ценность. С таким партнёром выгоднее дружить, чем воевать: он видит возможности там, где другие видят лишь угрозы, и превращает сложные ситуации в новые точки роста.
Окончание – во второй части.









