個人隨筆 算法人生(1):從“強化學(xué)習(xí)”看如何“戰(zhàn)勝拖延” 強化學(xué)習(xí)是一種機器學(xué)習(xí)方法,是一個動態(tài)的、可迭代的過程,需要進行試錯,并找到正確的策略。本文從“強化學(xué)習(xí)”看如何“戰(zhàn)勝拖延”,一起來看看吧。 養(yǎng)心進行時 強化學(xué)習(xí)策略迭代算法