ChatGPT原理与架构:大模型的预训练、迁移和中间件编程在线阅读
会员

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

程戈
开会员,本书免费读 >

计算机网络人工智能10.6万字

更新时间:2024-04-25 18:20:57 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

程戈
主页
  • 本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南,并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景,从理论到技术实现,全程详尽讲解了如何应对大模型在行业落地中的技术挑战,帮助读者逐步掌握大模型的迁移与微调核心技术。无论你是大模型开发者、人工智能研究人员,还是对垂直领域AI应用感兴趣的行业专家,本书都将带你深入大模型的核心领域,提供从构建、优化到部署的全流程指导,助你
    程戈人工智能13.7万字

最新上架

  • 会员
    本书参照产业界自动驾驶技术研发的基本流程,充分借鉴了产业界在自动驾驶技术领域中的实际研发经验,以高性能的智能小车和高度仿真的车道沙盘为实验教具和运行环境,深入浅出地讲解自动驾驶技术的原理与实际应用,为初学者打开一扇通往人工智能世界的大门。本书以帮助初学者如何从无到有地打造出具备自动驾驶功能的智能小车为主线,内容分为看车(了解自动驾驶)、造车(设计智能小车)、开车(收集训练数据)、写车(编写自动驾驶
    胡波主编计算机14.9万字
  • 会员
    2023年以来,OpenAI相继发布了聊天机器人模型ChatGPT、新一代多模态大模型GPT-4等产品,以强大的能力俘获了大量用户,颠覆了用户对于AI的认知。本书以ChatGPT为中心,对ChatGPT的相关知识进行详细的讲解。本书共12章,前5章从ChatGPT概述、技术底座、内容变革、产业格局、商业展望5个方面对ChatGPT进行了解读,帮助用户全面了解ChatGPT,对其形成完整的认知。第6
    施襄计算机12.8万字
  • 会员
    本书以工作场景和具体任务来驱动,包括53个场景展示、85项任务模拟、237次提问示范,让完全不懂技术的小白,也能成为ChatGPT工具使用方面的行家。本书通过详细讲解具体任务的提问与追问方法,让ChatGPT成为每个人的工作好帮手,帮助人们提升工作效能,打造超能个体与超能团队。
    唐振伟编著计算机13.8万字
  • 会员
    本书着重阐述了深度学习时代的计算机视觉算法的工作原理,首先对深度学习与计算机视觉基础进行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测算法、图像分割算法、人体姿态估计算法、行人重识别与目标跟踪算法、人脸识别算法以及图像超分辨率重建方法进行了介绍。本书系统讲解了在日常生活和工作中常见的几项计算机视觉任务,并着重介绍了在当今深度学习时代,这些计算机视觉任务是如何工作的,可使读者快
    徐从安 李健伟 董云龙 孙超等计算机9.9万字
  • 会员
    本书兼顾机器学习基础、经典方法和深度学习方法,对组成机器学习的基础知识和基本算法进行了比较细致的介绍,对广泛应用的经典算法如线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树和集成学习等算法都给出了深入的分析并讨论了无监督学习的基本方法,对深度学习和强化学习进行了全面的叙述,比较深入地讨论了反向传播算法、多层感知机、CNN、RNN和LSTM等深度神经网络的核心知识和结构;对于强化学习,不仅介绍了经
    张旭东编著计算机20.6万字
  • 会员
    本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大
    于俊 刘淇 程礼磊 程明月计算机12.3万字
  • 会员
    本书以人工智能技术在合成生物学领域的理论、方法及应用为主线,详细阐述人工智能在合成生物学不同层面设计中的应用进展,深入讨论人工智能在合成生物学实际应用中面临的挑战与困难。本书先概述合成生物学与人工智能基本概念以及发展简史,然后介绍人工智能技术在生物元件、生物模块、生物系统设计方面的应用,并通过案例展示了人工智能与合成生物学技术在生物医药领域的研究进展,最后分析了人工智能驱动合成生物技术的发展趋势,
    滕越主编计算机23万字
  • 会员
    本书是一部系统介绍AI数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实践等内容,全书共分3部分。在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了
    方进计算机26.2万字
  • 空间计算是一种不断发展的以三维世界为中心的计算形式和交互形式,是以计算机视觉为基础的高阶应用。其核心是使用AI、计算机视觉和扩展现实将虚拟体验融入物理世界,让用户摆脱屏幕的束缚,自然地与数字世界中的对象互动,就像与真实世界中的对象互动一样。随着生成式AI的爆发,空间计算平台将拥有更加丰富的内容,将在很大程度上改变我们的生活和工作,重新定义商业模式,并改变我们与技术和整个世界互动的方式,推动我们进入
    (美)凯西·哈克尔 伊雷娜·克罗宁计算机12.1万字