Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季 王琦 杨毅远
主页

最新上架

  • 会员
    本书分为4章,共20章。其中第1篇为基础算法篇,从第1章到第9章,讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法;第2篇为机器学习算法篇,从第10章到第14章,讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法;第3篇为强化学习算法篇,从第15章到第16章,讲述基于价值的强化学习算法和基于策略的强化学习算法;第4篇为深度学习算法篇,从第17章到第19章,讲述神经网络模型算法、
    唐宇迪 史卫亚 罗召勇 李琳 侯惠芳编著计算机0字
  • 《为机器立心》的主题是迈向通用人工智能的中国路线,让AI不再缺“心”,点亮人工智能的“中国时刻”。在书中,朱松纯教授解答了什么是通用人工智能、如何认清智能的本质、如何为人工智能找到统一理论与认知架构,进而为机器立“心”等重要问题。全书共分为两大部分。第一部分“厘清通用人工智能的3大关键迷思”:ChatGPT等大模型无异于缸中之脑;要寻找“乌鸦智能”而不是“鹦鹉智能”;理(U体系)与心(V体系)并非
    朱松纯计算机11.7万字
  • 如今,以DeepSeek为代表的AI工具迅速崛起,深刻地改变了人类获取与处理信息的方式。但在应用DeepSeek的过程中,很多人发现,向DeepSeek提出问题后,得到的回复往往不尽如人意,或是过于宽泛、缺乏针对性,或是未能切中要点、不能解决实际问题。导致这一问题的根本原因是,提问者缺乏有效的提问技巧,无法精准引导AI发挥强大的运算与分析能力。《DeepSeek高效提问指南》正是针对这一痛点,构建
    马超编著计算机11.4万字
  • 会员
    本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行
    陈根计算机11.6万字
  • 2022年末,ChatGPT在全球的风靡,让大模型随之出圈。大模型带来的机遇是人类突破能力边界最大的一次飞跃。未来基于人工智能或将实现“想象即现实,所想即所得”,这将是一次巨大的飞跃。中国、美国以及欧洲各国纷纷出台相关政策,将推动人工智能发展、大模型迭代作为重要的创新引擎。了解、应用大模型,既是时代的要求,也是产业发展的必需。但是在实践中也发现,大家对大模型的了解并不深刻,甚至时常被技术名词“劝退
    沈抖计算机16.8万字
  • 会员
    如今,随着智能创作时代的到来,AI文生内容成为不可忽视的趋势。DeepSeek作为AI文生领域内容领域的一个新热点和新风口,受到资本和各类企业的广泛关注。本书就聚焦于DeepSeek,对其进行详细讲述。本书分为三个部分,第一部分详细介绍DeepSeek的基础理论知识、技术架构、功能、背后的商业生态等,让读者对DeepSeek有一个全面的了解;第二部分讲述DeepSeek操作攻略,包括准备工作、指令
    李寅计算机10.8万字
  • 会员
    现在,AI与多模态技术快速发展,高效创作优质视觉内容已成为核心竞争力,OpenAI推出的GPT-4o为此提供了全新解决方案。本书系统整合一线实战经验,详细讲解GPT-4o从基础操作到多领域应用的108个实战案例、50种绘画风格及6大商业变现路径,并提供全面、详尽的提示词模板与示例,还讲解如何结合DeepSeek优化提示词,可帮助读者缩短创作周期,实现“懒人直出”。本书总计7章。第1章讲解GPT-4
    李艮基 肖灵煊 曹方咏崢计算机4.2万字
  • 会员
    我们在运用AI的时候,有时得不到自己想要的回答,于是责怪AI不够智能。我们容易忽略的是,AI的回答质量往往取决于提问的质量。《秒懂AI提问:让人工智能成为你的效率神器》系统地介绍了20种向AI提问的有效方法,用这些方法可以让AI给出高质量的回答。在介绍提问方法时,本书紧扣日常工作和生活,并通过对比让读者直观感受不同提问方法的效果,最后引出更多场景下的应用,让读者真正学以致用。《秒懂AI提问:让人工
    秋叶 刘进新 姜梅 定秋枫计算机5.4万字
  • 会员
    本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle
    刘润森计算机0字