Python強化學習的決策原理與應用
深入解析強化學習技術框架與智能體AI設計方法,協助學員突破傳統規則式系統的框架
課程總覽
課程代號:2326040048
數智化轉型二部曲-
智能體AI(Agent AI)基礎:
Python強化學習的決策原理與應用
1.技術解構:掌握強化學習核心機制(隨機過程、MDP框架、Q-Learning、策略梯度法)。
2.場景設計:學習將企業決策問題轉譯為RL可解的馬可夫決策過程(MDP)。
3.系統整合:思考智能體AI與既有IT架構(ERP、MES、CRM)的可能結合。
4.風險管理:說明探索與利用之間的權衡取捨(Exploration-Exploitation Tradeoff),以及決策黑箱化的風險。
課程型態/ 混成
上課地址/ 台北學習中心,實際地點依上課通知為準! 線上方案為Webex線上會議室
時 數/ 12 小時
起迄日期/ 2026/10/05 ~ 2026/10/08
聯絡資訊/ 謝芷欣 02-23701111#312
報名截止日期:2026/09/28
-----------------------------------------
隨著生成式AI進入商業化階段,企業數位智能化轉型的下一戰場已轉向「具備自主決策能力的智能體系統(Agent AI)」。強化學習技術能讓AI在動態與不確定的環境中持續學習最佳策略,從最後一哩路的物流配送、庫存管理、生產排程到金融交易決策,其應用場景正快速擴張。
本課程為「數智化轉型首部曲 - 從預測型AI到生成和決策型AI:圖神經網路與深度生成建模Python實作」的進階延伸,深入解析強化學習技術框架與智能體AI設計方法,協助學員突破傳統規則式系統的框架,打造具備環境感知、即時反饋與策略迭代能力的決策中樞,建立學員的數位化與智能化轉型進階技能,活用AI技術在工作領域上。
課程提供【數位同步學習】報名方案,歡迎學員報名參加。
課程目標
- 技術解構:掌握強化學習核心機制(隨機過程、MDP框架、Q-Learning、策略梯度法)。
- 場景設計:學習將企業決策問題轉譯為RL可解的馬可夫決策過程(MDP)。
- 系統整合:思考智能體AI與既有IT架構(ERP、MES、CRM)的可能結合。
- 風險管理:說明探索與利用之間的權衡取捨(Exploration-Exploitation Tradeoff),以及決策黑箱化的風險。
課程涵蓋Python實作案例,例如:庫存補貨、動態定價、金融交易、基於用戶反饋的強化學習等,建立學員活用資料分析技術並抓住AI發展趨勢。
- 先備知識:建議先完成「數智化轉型首部曲 - 從預測型AI到生成和決策型AI:圖神經網路與深度生成建模Python實作」課程或具備機器學習基礎概念。
- 建議學員具備基本的程式設計概念,例如C、Python、R、Java…等;學員不須非常熟悉撰寫電腦程式語言亦可,課堂中會提供案例程式碼,讓學員實際練習。
- 電機/電子/機械/資訊/生醫/工工/化工/土木/環工等相關工程師、資料分析師/科學家、程式設計師、資訊職類之公務機關人員。
|
單元 |
課程大綱 |
|
一、智能體AI時代的決策革命 |
|
|
二、強化學習背景知識 |
|
|
三、強化學習技術核心 |
|
備註:大綱與各單元時間均為預估規劃,講師有權視參訓學員狀況進行調整
- 舉辦地點:台北學習中心,實際地點依上課通知為準! 線上方案為Webex線上會議室
- 舉辦日期:115年10月5日(一)、10月8日(四),09:30am~16:30pm,共計12小時,中午午休時間12:30pm~ 13:30pm。
- 報名方式:線上報名
- 課程洽詢:02-2370-1111 分機312 謝小姐
- 現任:國立臺北商業大學資訊與決策科學研究所暨智能控制與決策研究室教授、中華R軟體學會理事長、臺灣資料科學與商業應用協會理事長、CSQ大數據品質應用委員會主任委員
- 經歷:香港科技大學(廣州)工業信息與智能研究所訪問教授、國立臺北商業大學校務永續發展中心主任兼推廣教育部主任、明志科技大學機械工程系特聘教授兼人工智慧暨資料科學研究中心主任、美國辛辛那提大學工程與應用科學學院訪問教授、新加坡國立大學解析與作業學系訪問教授、西交利物浦大學計算機科學與軟件工程學系暨大數據解析研究院訪問教授、南京理工大學管理科學與工程學系訪問教授、世新大學資訊管理學系副教授、中華大學企業管理學系副教授
|
報名方案 |
課程費用 |
|
課程原價(個人) |
10,800 |
|
早鳥優惠(21天前) |
9,800 |
|
3人以上團報優惠 |
9,200 |
- 繳費方式:報名時可選擇信用卡線上繳費或ATM轉帳,主辦單位將於確認開班後通知您相關匯款資訊。
- 退費標準:若欲取消報名,請於開課前三日以傳真或email告知主辦單位,並電話確認退費事宜,逾期將郵寄講義,恕不退費。若您未於期限內申請退費,則不得於任何因素要求退費,惟可轉讓與其他人參訓。
- 為確保您的上課權益,報名後若未收到任何回覆,請來電洽詢方完成報名。
- 為配合講師時間或臨時突發事件,主辦單位有調整日期或更換講師之權利。
- 報名時請註明欲開立發票完整抬頭,以利開立收據;未註明者,一律開立個人抬頭,恕不接受更換發票之要求,課程開始當天不得以任何因素要求退費。
- 為尊重講師之智慧財產權益,恕無法提供課程講義電子檔。
- 本課程需上機實作,請自備筆電上課。
開課日:2026/10/05結束日:2026/10/08
時數:12 (小時) 時段:09:30 ~ 16:30
地點:台北 | 工研院產業學院 台北學習中心 | 實際地點依上課通知為準! [看地圖]


