• <small id='fw7ayjal'></small><noframes id='2cqnog6f'>

      <tbody id='300k331x'></tbody>

    什么棋牌真一点
    亿发棋牌-理論物理博士眼中的德州撲克 因布朗運動頓悟发布日期:2020-08-26 浏览次数:

      余小魯博士(右)接受專訪

      余小魯,理論物理博士,人工智能專家。在美國多年,熟悉各種西方流行的撲克游戲。從數學、邏輯學、心理學等多方面系統研究撲克游戲模型,對撲克人工智能有獨到見解。新浪撲克學院特邀講師。

      問:聽說最近有為一些金融圈的朋友講解德州撲克,他們最感興趣的是哪方面?

      答:哈哈,不能說是講解,應該說是切磋吧,大陸民間的德州撲克高手太多了,可謂臥虎藏龍。金融圈和德州撲克有一種天然的聯系,從華爾街的交易員轉行去打德州撲克的有很多,從德州撲克轉行去當交易員也有。最近有傳言說女子德州撲克第一人Vanessa Selbst也準備進軍華爾街(Vanessa Selbst,84年生,耶魯法學院畢業,職業生涯錦標賽總獎金超過一千萬美金)。

      著名女牌手 Vanessa Selbst

      簡單說,金融圈最感興趣的就是風險。德州撲克對玩家的一個大的考驗,就是要長期保持一種風險中性(risk neutral)的態度。舉個例子,你面前有兩種打法,一種是有20%的機會贏得五千個籌碼,一種是有百分之百的機會贏得八百個籌碼。大腦里面固有的風險偏好,讓我們很難選擇第一種打法。但恰恰在絕大多數的金融市場和德州牌桌上,要當長期的成功玩家,必須學會自然的選擇第一種打法。再舉個具體一點的例子,面對一個30bb的底池在河牌圈,你可以很自然的可以下注20bb做一個詐唬。但如果同樣的牌同樣的局面,底池有300bb,讓你all in200bb做一個詐唬,很多人打了十年牌,覺得很荒唐很冒險,自己也很少嘗試過,或者說嘗試過一兩次失敗了,刻骨銘心,然后就放棄了這種打法。本質上說,就是大腦里面覺得輸掉桌子上剩下的200bb籌碼的痛苦程度,遠遠超過贏得底池300bb的快樂程度。金融市場和德州撲克都是要培養面對風險客觀理性的態度。

    理論物理博士眼中的德州撲克

      問:冒昧的問一句,您覺得理論物理跟德州撲克有什么聯系么?

      答:沒啥聯系,哈哈,可能跟金融聯系反而大了一點,華爾街里面一堆物理學博士。 理論物理的價值觀是這樣的,追求從第一性原理開始的分析推理,不做過多的假設,對任意一個新的假設都抱著懷疑的態度,千方百計去證偽。牛頓在其劃時代巨著《自然哲學的數學原理》中說,我不做假設(Hypotheses non fingo)”,呵呵,其實牛頓三定律和萬有引力定律都是牛頓的假設,但這假設絕對的少,幾乎完美解釋了整個太陽系的運動。

      清代圍棋國手施襄夏

      您是圍棋高手,我用圍棋的例子吧。第一性原理對待圍棋,就是從圍棋的勝負規則和死活規則開始研究圍棋,不是從布局理論定式來開始研究。布局理論定式這些威力非常的大,但不是第一性的,是從圍棋的勝負規則和死活規則自然演繹出來的。圍棋的第一性原理,就是氣盡棋亡。直接的推論,就是氣要不會盡,大多時候需要有兩個眼。然后就開始研究如何容易有兩個眼,如何圍空效率高。中國古人的圍棋理論非常高明,清代施襄夏的總決開篇第一句,起手據邊隅,逸己攻人原在是。這個理論要解釋圍棋布局起手為什么是下在邊角上,是因為自己容易活(逸),容易活的地方被你占了對手就不容易活,叫逸己攻人”,過了三百年,現在巔峰造極的阿爾法圍棋,依然是起手據邊隅,這就是理論思考的力量。接下來第二句叫入腹爭正面,制孤克敵驗于斯。必須注意,這就不是第一性原理的直接推論了,所以開始模糊,理論開始變得危險”。因為人為定義了一個概念叫正面”,進入圍棋中腹的正面究竟是哪一面?但這個理論依然威力非常強大,頂尖高手心中都有正逆向背的概念。但入腹爭正面只能稱之為一個假設,也許是一個非常好的假設。

    理論物理博士眼中的德州撲克

      理論物理的思維模式,就是先承認并且透徹研究第一性原理,對其他任何假設都抱著批判的態度。德州撲克的第一性原理可以這么表述:你看不到對方的底牌,對方也看不到你的底牌。聽起來很白癡,但如果能透徹認識這一點,已經是德州撲克的高手了。因為這個第一性原理的直接推論,就是你必須承認對手的持牌是一個范圍(Range,德州撲克最重要的一個概念),同時承認你的持牌也是一個范圍(不只是你眼睛中看到的現在持有的兩張底牌)。在美國很多學生跟我這么說,對手這把牌這么打,肯定手上拿著是AK,最后翻出來也是AK,學生很高興。但這種思維方式非常危險,因為你不知不覺中做了一個很大膽的假設,就是你能讀死對手的持牌,不再是個范圍。理論物理的訓練,主要是讓我能克服種種關于德州撲克流行的假設,或者說種種偽理論”的迷思,這應該也是我到目前戰績還不錯的一個主要原因。當然,從純粹理論物理的觀點來講,不能排除另一個可能,就是我在牌桌上一直運氣都比較好。

    理論物理博士眼中的德州撲克

      問:余博士最近在研究德州撲克人工智能的事情,有什么特別的心得么?

      答:我對這方面的長期關注,跟你對圍棋人工智能的長期關注,可能心情上是差不多的。因為我自己是從事人工智能這個行業,可能關注得更多的人工智能的技術而不是德州撲克了,哈哈。這方面的內容,有興趣的讀者可以參考我在新浪最近的一個訪談。

      相關閱讀:德州撲克被AI攻破? 剛進行到圍棋九路盤而已

      問:從人工智能的角度,您覺得德撲AI想在類似MTT比賽中取得碾壓人類的成績,應該從哪方面入手?

      答:這是一個理論性的難題,不是愿意投入多少個CPU,多少個計算機專家,就能從現在的冷撲程序改良得到的。因為冷撲面對的是單挑一對一德州撲克,其納什均衡是可以求解,或者說平均每手牌距離博弈論最優解不到千分之一個大盲注,完美得嚇人。但必須注意,再多一個玩家,三個玩家的德州撲克,數學上已經無法保證epsilon收斂到納什均衡。對于多人多桌錦標賽,學術上要在冷撲這個思路上改良,做到能適合多種獎池結構多人游戲的博弈論分析,非常之困難。人類目前在多人多桌錦標賽上運用的數學理論本身就有很大問題,在目前階段最多稱之為模型,比如說流行ICM(Independent Chip Model)獨立籌碼模型,是非常粗糙的一級近似。但這恰恰是德州撲克錦標賽最有趣的地方。

    理論物理博士眼中的德州撲克

      多人比賽 是德州撲克人工智能的瓶頸

      問:好像不久前去參加了Tom Dwan的見面會,感受如何?

      答:非常感謝新浪撲克學院的邀請,這次見面會讓我很感動,哈哈。感動的不是tom的牌技,tom打牌看太多了,感動的是主辦方包括新浪撲克學院的一系列安排。撲克俱樂部邀請tom dwan,相當于高爾夫俱樂部邀請泰格伍茲,斯諾克俱樂部邀請奧薩利文,是非常麻煩的事情。考驗的是撲克學院運營的能力,這些遠遠比學德州撲克牌技難。活動的場地條件安排都非常優越,但我想這不是最重要的。重要的是來參加這次活動,喜歡德州撲克的玩家,很多都是來自各行各業里面的高手,這一次見面會讓我認識了很多有趣的新朋友,非常的難得。以新浪撲克學院的資源背景種種條件,在大陸德州這個方興未艾的階段,大有作為,值得期待。

      Dwan上海見面會

      問:圍棋的教學我很明白,但德州撲克究竟如何教?如何學?

      答:那我用圍棋的比喻來解釋吧。教的話,最重要的是資格什么情况棋牌开始杀分,或者說是對資格的信心。比如說你是新浪圍棋7段,我覺得你最多能教新浪圍棋6段的學生。假設說你的學生是新浪圍棋8段,有個微妙的局面下他走錯了,你看出來了跟他解釋,因為微妙的局面下理由往往也比較微妙,他即使愿意相信你,他對你本身的棋力沒有足夠的信心,很容易動搖。這時候柯潔跟你學生把同樣的理由用同樣的話再解釋了一遍,你學生就變得非常清晰。這就是教學的微妙之處。而且德州撲克的局面往往比圍棋更加模糊更加微妙,如果老師本身的水平不能給學生足夠的信心,很難起到教學的作用。所以我一向的宗旨就是,平常自己打報名費四百美金的比賽,最多就收打報名費兩百美金比賽的學生。

    理論物理博士眼中的德州撲克

      對于如何學習德州撲克,我只有一個要求,就是紀律性,不是智商不是年齡不是任何其它因素。舉個具體例子,比如我一直對學生有個硬性要求,就是永遠不要講自己被爆冷門(bad beat)的故事。但有些學生確實做不到這一點,閑聊的時候,聽我講課的時候,總會時不時說自己河牌被對手擊中兩個outers之類的事情。對于這些,我是零容忍的,當然每個老師都不一樣。在我對德州撲克理解的體系中,任何時候都不能講這些故事,因為這在潛意識里面對你牌技的長進有很大的負面影響。當然,要是你以后成為了非常成功的職業牌手,那時憶苦思甜,可以講講這些故事,關系不大,但在初學階段,萬萬不可。這就是我最看重學生的一個品質,紀律性。能控制住不跟任何人講述自己在德州撲克被爆冷門的故事,對我來說,這個學生就具備成為德州撲克高手的一切條件。

    理論物理博士眼中的德州撲克

      問:打撲克讓你印象最深的一件事是?

      答:可能每一個長期的德州撲克玩家,都各有各的頓悟”瞬間。我自己印象最深的頓悟”,不是在牌桌上悟到的,哈哈,而是在多年前學物理學的時候。大家可能都聽說過布朗運動,就是花粉顆粒在水溶液中不停的做無規則運動。記得當年我學習布朗運動在數學上的理論,叫馬爾可夫過程,簡單的說,這種過程必須具備無記憶”的性質:下一狀態的概率分布只能由當前狀態決定,在時間序列中與之前的歷史無關。學到這里,我突然嚇了一大跳,意識到德州撲克比賽就是一個馬爾可夫過程,狀態就是你桌子的籌碼量。比如我桌子上現在有一萬個籌碼,是剛剛由五千個籌碼翻倍贏來的,還是兩萬個籌碼被別人一個bad beat輸了一半剩下的,數學上是絕對無區別的,也就是說接下來我在這個比賽的成績,只跟我現在有一萬個籌碼這個事實相關,跟我如何擁有這一萬個籌碼的歷史無關。但對人來說,兩者的區別是天上地下。人性雖然是不可以完全克服,但從這個時候起,就盡量讓自己像水中的花粉,完全無記憶”的打牌。

    理論物理博士眼中的德州撲克

      無記憶”打牌

      (白夜

    德州 棋牌游戏怎样能赢 十大网络棋牌开户 亿发棋牌

      <tbody id='tnetv97m'></tbody>
  • <small id='bmie7x4w'></small><noframes id='mnlb7ere'>

  • <small id='hnj9d5tb'></small><noframes id='v6pp3bg4'>

      <tbody id='prxn4u20'></tbody>