好书推荐 好书速递 排行榜 读书文摘

ChatGPT原理与应用开发

ChatGPT原理与应用开发
作者:郝少春 / 黄玉琳 / 易华挥
出版社:人民邮电出版社
出版年:2024-02
ISBN:9787115631572
行业:其它
浏览数:1

内容简介

Datawhale的开源大模型实战教程,透彻解读4类常见NLP任务的系统设计,3种方式书-课-代码仓库全方位学习,每个人都可以用大语言模型轻松做出自己的AI产品, 5位人工智能领域学者吴飞、周明、朱信忠、金耀辉、张俊林亲笔推荐!

◎编辑推荐:

适读人群 :适合所有对大语言模型感兴趣的开发者阅读

1. Di一本基于大语言模型进行商业应用开发的书;

2. 以任务(相似匹配、句词分类、文本生成、复杂推理)为中心,内容不仅可用于ChatGPT,也适用于其他大语言模型;

3. 侧重于任务的讲解与设计,思路可用于任何项目;

4. 有详细的示例代码,大部分的代码稍作修改后可用于生产环境,还有Datawhale的HuggingLLM开源教程、B站视频课程,书-课-代码仓库全方位助力学习与实践;

5. Datawhale开源社区又一力作,五位人工智能领域学者吴飞、周明、朱信忠、金耀辉、张俊林亲笔推荐!

◎内容简介:

随着ChatGPT 的出现,大语言模型的能力得到了业内外的认可,新的商业模式不断涌现,旧的设计和实现都将重构。本书主要介绍基于ChatGPT 开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,以及如何使用类似ChatGPT 的大语言模型服务来实现以前只有算法工程师才能完成的工作。

全书共8 章内容,第1 章介绍与ChatGPT 相关的基础知识,第2~5 章分别介绍相似匹配、句词分类、文本生成和复杂推理方面的任务,第6~8 章分别介绍ChatGPT 的工程实践、局限与不足,以及商业应用,以帮助读者更好地构建自己的应用。

本书以实践为主,尤其注重任务的讲解和设计,但同时也对自然语言处理相关算法的基本原理和基础知识进行科普性介绍,适合所有对大语言模型感兴趣的开发者阅读。

◎专业书评:

生成式人工智能所训练的大语言模型在内容合成等任务上取得了令人吃惊的进步,可产生新颖甚至是意料之外的结果——这与早期仅仅只会生硬地产生可预测结果的人工智能模型有很大不同,为探索通用人工智能的实现提供了一种方式,引起了各行业的广泛关注。因此我们所处的这个时期被誉为“人工智能的iPhone 时刻”。

这本书是由Datawhale 所推出的力作,秉承了Datawhale“为了学习者”的一贯理念,基于志愿者团队精彩的开源学习内容精心编纂而成,深入浅出地介绍大语言模型的原理和工程实践,对于初学者了解ChatGPT 非常有帮助!

——吴飞,浙江大学人工智能研究所所长

以ChatGPT 为代表的大语言模型技术推动了人工智能的发展,但如何应用大语言模型技术为用户赋能,产生更大的实用价值,仍然有很多现实问题需要去面对和解决。这本书是Datawhale 开源团队结合优质学习内容推出的又一力作,它帮助读者理解大语言模型背后的系统设计,进而能够利用大语言模型来研发自己的AI 产品。书中内容围绕自然语言处理任务展开,很多设计思路和细节其实可以应用到多个领域。期望读者多学多练,能够在实践中提升自我。

——周明,澜舟科技创始人兼CEO,创新工场首席科学家

这本书介绍了如何在大语言模型时代开发自然语言处理算法任务,让普通工程师借助大语言模型也能很快完成自然语言处理任务,在一定程度上降低了人工智能开发的门槛,让更多人有机会参与到人工智能行业的发展中。值得一提的是,这本书虽然以ChatGPT 作为示例,但绝大部分内容都可以无缝切换为其他大语言模型。这得益于本书基于以“自然语言处理算法任务”为核心的设计理念,因而这本书具有更长的生命周期。另外,书中提供的实践经验对自然语言处理算法工程师也具有实践指导意义。

——朱信忠,浙江师范大学人工智能研究院副院长,浙江省特级专家,Datawhale 首席科学家

随着ChatGPT 相关技术的快速发展,越来越多的人关心如何利用大语言模型的强大能力来解决具体问题。这是一本有关大语言模型应用和服务的实践指导书,详细介绍了如何开发基于大语言模型算法的应用和服务。这本书注重实际任务的设计及实现的思路讲解,并提供了对自然语言处理基础知识和算法原理的科普性介绍。相信无论是对大语言模型感兴趣的开发者还是算法工程师,都能从这本书中获益。

——张俊林,新浪微博新技术研发负责人

ChatGPT 已经成为公众关注的焦点,人工智能再次备受瞩目。虽然市面上已经有许多关于如何利用ChatGPT 提高工作效率的图书,但对于深入探讨ChatGPT 本质及其底层的大模型技术的作品却不多见。这本书以明晰而简洁的文字,阐述了大语言模型的工作原理,堪称杰作。更为可贵的是,书中还详细介绍了ChatGPT 的工程实施策略。对于那些渴望深入理解ChatGPT 和大模型技术的读者,我强烈推荐阅读这本书。

——金耀辉,上海交通大学人工智能研究院总工程师、教授

......(更多)

作者简介

郝少春

某AI大语言模型公司的算法工程师,开源组织Datawhale成员;拥有7 年算法和工程架构经验及丰富的项目和产品经历,涉及文本、音频、视频、图像等多种模态。

黄玉琳

上海财经大学硕士,京东算法工程师,开源组织Datawhale成员;从事智能供应链领域的算法研究及应用工作;主要研究方向为机器学习、自然语言处理、运筹优化。

易华挥

四川大学华西医院生物大数据中心的科研助理,开源组织Datawhale成员;主要研究方向为多模态表征学习及其在医学影像分析中的应用;发表顶会论文3篇。

......(更多)

目录

第1章 基础知识——大语言模型背后 1

1.1 自然语言背景 1

1.1.1 语言是智能的标志 1

1.1.2 从图灵测试到ChatGPT 2

1.2 语言模型基础 6

1.2.1 最小语义单位Token 与Embedding 6

1.2.2 语言模型是怎么回事 8

1.3 ChatGPT基础 14

1.3.1 最强表示架构Transformer设计与演变 14

1.3.2 生成语言模型GPT进化与逆袭 18

1.3.3 利器强化学习RLHF流程与思想 25

1.4 本章小结 30

第2章 相似匹配——万物皆可Embedding 31

2.1 相似匹配基础 31

2.1.1 更好的Embedding表示 31

2.1.2 如何度量Embedding相似度 36

2.2 ChatGPT接口使用 37

2.2.1 Embedding接口 37

2.2.2 ChatGPT+提示词 40

2.3 相关任务与应用 41

2.3.1 简单问答:以问题找问题 42

2.3.2 聚类任务:物以类聚也以群分 50

2.3.3 推荐应用:一切都是Embedding 55

2.4 本章小结 64

第3章 句词分类——句子Token都是类别 65

3.1 句词分类基础 65

3.1.1 如何对一句话进行分类 68

3.1.2 从句子分类到Token分类 71

3.2 ChatGPT接口使用 72

3.2.1 基础版GPT续写 72

3.2.2 进阶版ChatGPT指令 77

3.3 相关任务与应用 82

3.3.1 文档问答:给定文档问问题 82

3.3.2 模型微调:满足个性化需要 94

3.3.3 智能对话:大语言模型=自主控制的机器人 106

3.4 本章小结 117

第4章 文本生成——超越理解更智能 119

4.1 文本生成任务基础 119

4.2 文本摘要 121

4.2.1 什么是文本摘要 121

4.2.2 常见的文本摘要技术 121

4.2.3 基于OpenAI接口的文本摘要实验 123

4.3 文本纠错 131

4.3.1 什么是文本纠错 131

4.3.2 常见的文本纠错技术 132

4.3.3 基于OpenAI接口的文本纠错实验 135

4.4 机器翻译 136

4.4.1 什么是机器翻译 136

4.4.2 常见的机器翻译技术 137

4.4.3 基于OpenAI接口的机器翻译实验 138

4.5 本章小结 144

第5章 复杂推理——更加像人一样思考 145

5.1 什么是复杂推理 145

5.2 复杂推理能力的激活和改善 147

5.2.1 初步评估ChatGPT的推理能力 147

5.2.2 复杂推理能力的激活 150

5.2.3 大语言模型复杂推理能力的改善 156

5.3 大语言模型复杂推理能力的探讨 168

5.4 本章小结 170

第6章 工程实践——真实场景大不同 172

6.1 评测:决定是否上线的标准 172

6.1.1 为什么评测 172

6.1.2 NLU常用评测指标 173

6.1.3 NLG常用评测指标 175

6.2 安全:必须认真对待的话题 178

6.2.1 前/ 后处理 178

6.2.2 提示词 179

6.2.3 可控文本生成 179

6.3 网络:接口调用并不总是成功 180

6.3.1 失败 181

6.3.2 延迟 182

6.3.3 扩展 183

6.4 本章小结 185

第7章 局限与不足——工具不是万能的 186

7.1 事实性错误 186

7.1.1 错误示例 186

7.1.2 原因分析 188

7.1.3 解决方法 189

7.2 实时更新 190

7.2.1 问题示例 190

7.2.2 原因分析 191

7.2.3 解决方法 192

7.3 性能瓶颈 193

7.3.1 背景描述 193

7.3.2 原因分析 193

7.3.3 解决方法 194

7.4 本章小结 194

第8章 商业应用——LLM是星辰大海 196

8.1 相关背景 196

8.2 影响分析 197

8.3 商业赋能 198

8.4 本章小结 204

......(更多)

读书文摘

......(更多)

猜你喜欢

点击查看