Покерная стратегия с Джонатаном Литтлом: когда отклоняться от GTO






когда отклоняться от GTO
Большинство людей, играющих в игры, могут интуитивно понять, как компьютеры могут решать игры, состоящие только из известной информации, такие как крестики-нолики, шашки и шахматы. Но они не могут понять, как можно решать игры с неизвестной информацией, такие как покер.

Правда в том, что при наличии достаточной вычислительной мощности и времени даже самые сложные игры можно решить с помощью математики и теории игр.

Игра считается «решенной», когда определена Оптимальная стратегия теории игр. Стратегия GTO довольно эффективна, потому что она либо безубыточна (когда противник использует ту же стратегию), либо выигрывает (когда противник использует любую другую стратегию).

Игры с меньшим количеством опций, чем в безлимитном холдеме, такие как лимитный холдем, были разгаданы несколько лет назад, и даже безлимитный холдем близок к разгадке. В 2017 году Libratus, покерный бот, разработанный в Университете Карнеги-Меллона, обыграл четырех лучших игроков один на один в безлимитный холдем, набрав более 14 больших блайндов за 100 раздач. При блайндах $1-$2 это будет $28 за 100 раздач, что является невероятно высоким процентом выигрыша.

Некоторые игроки могут не понимать, как бот может знать, как и когда разумно блефовать, но оказывается, что блеф — это обычная тактика, обсуждаемая на уроках теории игр. Например, на ривере вы будете регулярно сталкиваться с поляризованным диапазоном, состоящим из премиальных и мусорных рук, в то время как у вашего оппонента будет сжатый диапазон, состоящий в основном из маргинальных готовых рук, которые проигрывают вашим премиальным рукам и бьют ваши мусорные руки. . В этой ситуации поляризованный игрок может в среднем выиграть банк, просто поставив сумму, которая приведет к тому, что его противник выиграет количество времени, равное его шансам банка.

когда отклоняться от GTO
Все еще следите?

Если вы знаете, что ваш диапазон на 67% состоит из премиальных рук и на 33% из блефов (что возможно с помощью углубленного анализа диапазона, которому я обучаю на PokerCoaching.com), ставьте сумму, которая требует от вашего оппонента выигрыша в 33% случаев.

В этом случае ставка размером с банк даст вашему противнику шансы банка 2: 1, а это означает, что ему нужно выигрывать в 33% случаев, чтобы оставаться безубыточным. Таким образом, с поляризованным диапазоном ставка размером с банк в среднем принесет вам банк, независимо от того, что делает ваш оппонент!

Если бы вместо этого ваш диапазон состоял из 83% премиальных рук и 17% блефов, то ставка в размере одной четверти размера банка, дающая вашему оппоненту шансы банка 5:1, в среднем выиграет банк. Отсюда вытекает одна интересная концепция: чем больше в вашем диапазоне блефов, тем больше вы можете делать ставки. Если ваш диапазон идеально поляризован с 51% готовых рук премиум-класса и 49% блефов, вы могли бы фактически поставить в 24,5 раза больше размера банка, чего почти никто не делает.

Если вы изучите два основных решателя GTO, доступных сегодня (PioSolver и MonkerSolver), вы обнаружите шаблоны, которые повторяются снова и снова. Например, при определении того, с какими руками следует делать контбет на флопе против одного оппонента, вас больше всего беспокоит то, как ваш диапазон повлияет на диапазон оппонента. Если у вас есть преимущество в эквити (это означает, что ваше эквити со всем вашим диапазоном на флопе намного выше, чем эквити вашего оппонента со всем его диапазоном), вам часто следует ставить с большой частью вашего диапазона, используя небольшой размер ставки.

когда отклоняться от GTO
Если у вас нет преимущества по эквити, вам следует делать ставки нечасто, используя больший размер с поляризованным диапазоном, состоящим из ваших премиальных готовых рук и некоторых дро, при этом чекая ваши маргинальные готовые руки и мусор, а также несколько ловушек. Используя эти знания, вы можете разработать реализуемую систему для приблизительного определения идеальной стратегии ставок и чеков в любой ситуации.

Хотя стратегия GTO довольно мощная, обычно она является идеальной стратегией против лучших игроков в мире. Поскольку ваши оппоненты играют хуже, вы должны приспособиться, чтобы извлечь выгоду из того, что они делают неправильно. Если вы будете играть строго по стратегии GTO, вы оставите на столе кучу денег.

Пассивная эксплуатация — это когда вы играете в GTO, и все, что ваш оппонент делает неправильно, приносит вам деньги, в то время как активная эксплуатация — это когда вы отклоняетесь от стратегии GTO, чтобы еще больше воспользоваться ошибкой вашего оппонента. Максимально эксплуататорская стратегия — это когда вы отклоняетесь от стратегии GTO таким образом, чтобы максимизировать свою прибыль от оппонента.

Хотя иногда трудно понять, что именно ваш оппонент делает неправильно, во многих случаях это очевидно. Например, многие игроки на низких лимитах почти никогда не блефуют на ривере. Таким образом, если вы дойдете до ривера, а ваш оппонент с такой тенденцией сделает чек-рейз, вам следует сбрасывать все, кроме своих лучших готовых рук. Другие игроки слишком часто блефуют, что позволяет вам легко коллировать со всевозможными маргинальными готовыми руками. Это оба примера активной эксплуатации оппонента.

когда отклоняться от GTO
Основная проблема с использованием максимально эксплуатируемой стратегии заключается в том, что ваша оценка стратегии вашего оппонента может быть неверной. Если вы думаете, что ваш оппонент никогда не блефует, хотя на самом деле он блефует много, то если вы скинетесь на большинство его ставок, вы проиграете. Если вы думаете, что ваш оппонент много блефует, поэтому вы коллируете с большим количеством маргинальных готовых рук, но оказывается, что ваш оппонент практически никогда не блефует, вы также проиграете. Если ваш противник быстро и правильно контрадаптирует, чтобы бороться с вашей максимально эксплуатирующей стратегией, вы потеряете гораздо больше, чем потенциально могли бы выиграть, сделав первоначальную корректировку.

Использование стратегии GTO позволяет обойти эту дилемму, но также приведет к тому, что в долгосрочной перспективе вы выиграете меньше денег у своих противников, не являющихся игроками мирового уровня, при условии, что ваши оценки в целом верны. Таким образом, пока вы не будете достаточно уверены в том, что ваш конкретный оппонент делает неправильно против вас, будет разумно использовать фундаментально правильную стратегию, которая немного скорректирована с учетом того, что, как вы знаете, средний игрок в вашей игре делает неправильно ♠.
Ctrl
Enter
Заметили ошЫбку
Выделите текст и нажмите Ctrl+Enter



Высказать мнение про Покерная стратегия с Джонатаном Литтлом: когда отклоняться от GTO