移动客户端

新浪科技> 滚动新闻 > 正文

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

2024年06月22日 12:55 机器之心Pro

新浪财经APP 缩小字体放大字体收藏微博微信

让我们训练一个 Storyteller。

今天外网又被 Andrej Karpathy 这一良心课程刷屏了！

项目是 11 小时前被 Karpathy 上传到 Github 的，目的是要构建一个能够创作、提炼和阐释小故事的大语言模型。如今已经被许多网友转发推荐。

项目地址：https://github.com/karpathy/LLM101n

有网友表示，这是 karpathy 老师的新冒险。它将带您从语言建模、机器学习的基础知识开始学习，然后到多模态、RLHF、模型部署。

也有网友称：看起来 karpathy 正在做一门完整的、类似 cs231n 的课程，《LLM101n》将讲授如何从头开始构建类似 ChatGPT 的模型，非常雄心勃勃！

以下是该课程的项目简介：

在本课程中，我们将构建一个 Storyteller AI 大型语言模型 (LLM)，旨在使用 AI 创建、完善和说明小故事，涵盖从基础到类似于 ChatGPT 的可运行 Web 应用程序，并使用 Python、C 和 CUDA 从头开始构建项目，并且只需要最少的计算机科学前提条件。这门课程将使学生对 AI、LLM 和深度学习有相对深入的了解。

教学大纲如下：

第 01 章 Bigram 语言模型（语言建模）
第 02 章 Micrograd（机器学习、反向传播）
第 03 章 N-gram 模型（多层感知器、matmul、gelu）
第 04 章 Attention（attention、softmax、位置编码器）
第 05 章 Transformer（transformer、residue、layernorm、GPT-2）
第 06 章 Tokenization（minBPE、字节对编码）
第 07 章优化（初始化、优化、AdamW）
第 08 章极品飞车 I：设备（设备，CPU，GPU，...）
第 09 章极品飞车 II：精度（混合精度训练，fp16，bf16，fp8，......）
第 10 章极品飞车 III：分布式（分布式优化、DDP、ZeRO）
第 11 章数据集（数据集、数据加载、合成数据生成）
第 12 章推理 I：kv-cache（kv-cache）
第 13 章推理 II：量化（quantization）
第 14 章微调 I：SFT（监督微调 SFT、PEFT、LoRA、聊天（chat））
第 15 章微调 II：RL（强化学习，RLHF，PPO，DPO）
第 16 章部署（API、Web 应用程序）
第 17 章多模态（VQVAE、扩散 transformer）

那还等什么，学起来吧！

© THE END

关键词 : AI

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技

新浪数码

新浪手机

科学探索

苹果汇

新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

新浪首页新浪众测

语音播报返回顶部