《精通Transformer》ChatGPT:放弃战斗吧,向Transformer投降!
前言
在当今大数据与人工智能时代,自然语言处理(NLP)作为机器学习与深度学习的关键应用领域,正经历着前所未有的变革。在这场技术革新浪潮中,一个名为Transformer的架构成为了推动自然语言处理技术进步的核心力量。尽管ChatGPT因其卓越的表现而名声大噪,但其背后真正的英雄实际上是Transformer模型。
Transformer由Google于2017年提出,迅速以其优越的性能和高效的并行处理能力取代了传统的循环神经网络(RNN)和卷积神经网络(CNN),成为NLP研究的新范式。这一模型仅依靠编码器与解码器便能实现卓越的效果,并且极大地加速了训练过程中的计算效率。Hugging Face社区提供的丰富的预训练模型资源,更是为研究者们带来了极大的便利,使得基于Transformer的应用开发变得更加简单快捷。

本书旨在全面介绍Transformer框架下的自然语言处理技术,包括理论讲解与实际操作指南。书中不仅深入浅出地解析了相关理论知识,还通过一系列实例演示了如何使用Hugging Face的Transformer库来解决各类NLP问题。
读者将学会如何训练、调整以及部署基于Transformer的语言模型,掌握从实验环境到生产环境的全流程技术。
本书适合具备一定Python基础及机器学习背景的深度学习研究者、NLP从业者以及教育工作者和学生阅读。通过本书的学习,读者能够掌握最新的NLP技术动态,探索前沿的解决方案,并有能力将这些技术应用于实际项目中。
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇
目录
Transformer到底是什么,让ChatGPT如此迷恋?这只变形金刚,到底是只什么怪兽?——用于自然语言处理(NLP)的神经网络架构
第1 章 从词袋到Transformer。
本章简要介绍了自然语言处理的历史,并将传统方法、深度学习模型(如CNIN、RNN 和LSTM) 与Transformer模型进行了比较分析。

第2章 Transformer的实践操作入门。
本章深入探讨了如何使用Transformer模型,并通过实际例子阐述了分词器和模型,如BERT。

第3章 自编码语言模型。
本章讨论了如何从零开始在任何给定语言上训练自编码语言模型。训练过程将包括模型的预训练和特定任务的训练。

第4章 自回归和其他语言模型。
本章讨论了自回归语言模型的理论细节,并引导读者如何在自己的语料库中对模型进行预训练。读者将学习如何在自己的文本上预训练任何语言模型(如GPT- 2),并在各种任务(如语言生成)中使用该模型。

第5章 微调文本分类语言模型。
在本章中,读者将学习如何配置文本分类的预训练模型,以及如何微调文本分类下游任务的模型(如情感分析或多类别分类)。

第6章 微调标记分类语言模型。
本章讲述如何微调标记分类任务的语言模型[如命名实体识别 (NER)、词性标注 (POS)和问题回答 (QA)系统]。

第7章 文本表示。
在本章中,读者将学习文本表示技术以及如何有效地利用Transformer 体系结构,特别是对于无监督任务,如聚类、语义搜索和主题建模。

第8章 使用高效的Transformer。
本章展示了如何使用提炼、剪枝和量化方法,从预训练模型中 生成高效的模型。然后,读者将获得有关高效稀疏Transformer的知识,如Linformer 和 BigBird,以及如何使用这些模型。

第9章 跨语言和多语言建模。
在本章中,读者将学习多语言和跨语种语言模型预训练以及单语言和多语言预训练之间的差异。本章涉及的其他主题包括因果语言建模和翻译语言建模。

第10章 部署 Transformer 模型。
本章将详细介绍如何在 CPU/GPU环境中,为基于 Transformer的自然语言处理解决方案提供服务。本章还将描述如何使用 TensorFlow 扩展 (TFX) 部署机器学习系统。

第11 章 注意力可视化与实验跟踪。
本章涵盖两个不同的技术概念:注意力可视化与实验跟踪。 我们将使用诸如exBERT 和 BertViz之类的复杂工具进行实验练习。

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

