個人隨筆 【入門科普】必了解的 20 個 AI 術語解析(下) AI領域的基礎概念和相關技術有很多,這篇文章里,作者就深入淺出地介紹了相應的內容,感興趣的同學們,不妨來看一下。 李文杰 專業術語交叉驗證強化學習
個人隨筆 算法人生(14):從“探索平衡策略”看“生活工作的平衡之道” 在機器學習的早期階段,探索對于理解環境至關重要,但隨著智能體學習的深入,利用已知策略以獲取穩定回報變得更為重要。過多的探索可能導致錯失最優行動帶來的回報,而過多的利用則可能使智能體陷入局部最優,錯失更好的策略。因此,如何在探索和利用之間找到平衡,是強化學習中的關鍵問題。 養心進行時 強化學習推薦算法智能體
AI人工智能 人工智能中的機器學習核心領域、流程與分支(基礎入門篇) 人工智能作為當下新質生產力的代表,其技術更新已經歷過很多個版本,隨著ChatGPT的火熱,AI逐漸進入大眾視野,并在衣食住行方方面面影響著人們。AI 是讓計算機模擬人類智能的技術,它包括機器學習、自然語言處理、計算機視覺、語音識別等多個領域,通過使用大量的數據和算法,AI 可以讓計算機學會像人類一樣思考、學習和解決問題。機器學習作為人工智能領域的核心,是使計算機擁有智能的基石,本文對機器學習的核心領域、術語和深度學習與強化學習作簡單介紹,不涉及復雜的數學模型,通俗地講解AI底層知識原理。 AI產品薇薇 強化學習機器學習深度學習
個人隨筆 算法人生(1):從“強化學習”看如何“戰勝拖延” 強化學習是一種機器學習方法,是一個動態的、可迭代的過程,需要進行試錯,并找到正確的策略。本文從“強化學習”看如何“戰勝拖延”,一起來看看吧。 養心進行時 強化學習策略迭代算法
產品經理 策略產品經理必讀系列—第五講強化學習篇 編輯導語:強化學習是機器學習的一個分支,它能通過不斷與環境的交互、試錯,最終完成特定目的或者使得整體行動收益最大化。本文作者對強化學習進行了總結分析,一起來... 搜廣推策略James 2年初級強化學習
AI人工智能 當AI開始“踢臟球”,你還敢信任強化學習嗎? 以當下人類對大腦的了解,在認知過程、解決問題的過程以及思考的能力等機制還都不清楚。所以想要模擬人類的思考能力,強化學習乃至整個機器學習的升級,恐怕還依托于腦... 腦極體 3年中級強化學習
AI人工智能 機器學習 | 強化學習,解決決策問題的行家(上) 本文筆者將與大家講述:強化學習的基本原理、兩個基本類型,以及基于這兩個類型下的相關算法。 一般地,我們認為,機器學習領域最基本的三個方向就是“監督學習”“無監督... 小曹 2年初級強化學習
AI人工智能 從老虎機講起,從頭開始深度強化學習 本文筆者將對深度RL領域的各個核心部分做出一個任何人都可以讀懂的概述,對深度RL主要使用的許多算法的一個全面總結。 最近,我在北京的O’Reilly AI大會上做了一... 雷峰網 4年中級強化學習
AI人工智能 強化學習中,如何從稀疏和不明確的反饋中學習泛化? 強化學習(RL)為優化面向目標的行為提供了一個統一而靈活的框架,在解決諸如玩電子游戲、連續控制和機器人學習等具有挑戰性的任務方面取得了顯著的成功。在這些應用領... 雷峰網 2年中級強化學習
AI人工智能 強化學習的真正價值與現實難題 強化學習的框架之爭只是序曲,隨著各種難度超乎想象的實際問題被一一解決,很多有趣的事情將會發生。 假如你是應用開發者,不懂算法,又想開發一個帶AI功能的APP,你會... 腦極體 2年初級強化學習