如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你

如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你
2023年07月26日 12:55 机器之心Pro

如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」,并给你列出一长串熊猫的名字。而 AI  圈内的人八成会回答「羊驼」。而且,他们也能给你列出一长串「羊驼」的名字:llama、vicuna、alpaca……

得益于 Meta Llama 模型的开源,AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍,每个单词都对应着一个(或一组)基于 Llama 的微调模型。这些模型各有所长,在 Llama 的基础上提升了对话、多模态生成等能力,而且更符合人类对话习惯。不过,由于存在开源协议问题,第一版 Llama 一直不可以商用,这让一些想基于该模型构建应用的从业者持谨慎态度。

就在前几天,Meta 又开源了 Llama 2,性能更加接近 ChatGPT,而且允许商用(日活超过 7 亿需要单独申请)。这意味着未来更多人会加入 Llama 阵营,基于这一模型进行微调,并构建商业应用。有人预言说,大模型的安卓时代就要来了!

在这样一个激动人心的时刻,不少从业者已经摩拳擦掌,准备做出一些成果。不过,在此之前,每个人都需要先把 Llama 2 背后的技术吃透,同时了解其潜在的应用场景。这会让大家在之后的模型、应用构建之路上走得更顺。

为此,机器之心专门设计了「Llama 2 大模型算法与应用实践」论坛。

论坛邀请到上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人刘鹏飞,老刘说 NLP 技术公众号作者、开源爱好者刘焕勇,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人史业民,前智源研究院技术总监苏洋等四位专家带来演讲及实战分享。

论坛为期 1 天,内容包括 Llama 2 算法解读、基于 Llama 2 开发中文大模型、Llama 2 案例解读和应用实践等。

通过本场系统分享,你将系统了解到 Llama 2 背后的技术以及潜在的应用场景,为即将到来的「大模型安卓时代」做好准备。

4 位资深主讲人,做过哪些相关工作?

主讲人:刘鹏飞,上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人

个人简介:专注于自然语言的预训、生成和评估等研究方向;在自然语言处理和人工智能领域发表学术论文 60 余篇。谷歌学术引用 7000 余次。ACL 会议史上首次实现连续两年获得 System & Demo Paper Award;提示工程(Prompt Engineering)概念最早提出者之一。代表作包括:ExplainaBoard,高考英语 AI,LIMA 等工作。

Google Scholar:https://scholar.google.com/citations?hl=en&user=oIz_CYEAAAAJ

GitHub 个人主页:https://github.com/pfliu-nlp

主讲人:刘焕勇,老刘说 NLP 技术公众号作者、开源爱好者

个人简介:曾就职于中国科学院软件研究所。主要研究方向为领域知识/事件图谱的构建与应用,大模型的数据工程、知识库增强与自动化评估,申请发明专利十余项、论文数篇。近年来在 OGB-Wikikg 2、CCKS 多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在 GitHub 开源项目 60+,收获 star 数超 2W+,创立「老刘说 NLP」技术公众号,具有广泛影响力。

GitHub 个人主页:https://liuhuanyong.github.io/

主讲人:史业民,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人

个人简介:本科及博士毕业于北京大学,入选斯坦福大学发布的 2022 年度「全球前 2% 顶尖科学家榜单」,在人工智能领域顶会和学术期刊上发表论文 20 余篇;作为智源研究院 Z-lab 联合负责人,从事大模型相关算法研究与应用探索,参与了智源悟道 3.0 研发,是最大可商用中文指令数据集 COIG、COIG-PC 的发起者、组织者之一,也是音乐预训练大模型 MERT 的作者之一,曾获 CAMEO 蛋白质结构预测年度、季度、月度第一名。

GitHub 项目地址:https://github.com/LinkSoul-AI/Chinese-Llama-2-7b

主讲人:苏洋,前智源研究院技术总监

个人简介:Llama 2 中文开源模型社区贡献者。GitHub 社区活跃用户,国内首个 Llama 2 中文版开源社区贡献者,GitHub 热榜八十行代码实现类似 Midjourney 官方 Describe 开源工具作者,双卡 Finetune Llama 一代 65B 模型,早期 ChatGPT 应用 「hacker」,实现了 ChatGPT 自由接入数据源等工具。

GitHub 个人主页:https://github.com/soulteary

现在报名可享「8折早鸟福利」

「Llama 2 大模型算法与应用实践」论坛致力于呈现高质量、高水准内容,正在根据 Llama 2 最新进展严格打磨选题及内容,欢迎通过机器之心公众号持续关注。

  • 专业的大模型技术解析和最佳实践案例分享

  • 与技术大牛面对面交流的珍贵机会

  • 加入大模型高质量社群,及时跟进行业前沿资讯

  • 活动现场视频会后无限回看权限

  • 机器之心旗下相关付费活动享购票八五折优惠

……

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片