当前位置

ca88手机登录地址AI在用 没错树莓派5也能飙上Llama 3了!
来源:ca88手机客户端登录 | 作者:ca88手机登录入平台 | 发布时间: 2024-09-19 05:58:07 | 43 次浏览 | 分享到:
  以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该

  以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。 因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。

  4 月 18 日,Meta 发布了 Llama 3,号称「迄今最强的开源大模型」。根据 Meta 的说法,Llama 3 在多个关键基准测试中超越了业界领先的同类模型,在代码生成等任务上实现了全面领先。该模型能够进行复杂的推理,更加遵循指令,能够可视化想法并解决许多微妙的问题。

  开源 Llama 3 系列模型包括 8B(80 亿参数)和 70B(700 亿参数)两种参数规模的版本。作为开源界的「全村希望」,Llama 3 一经发布就吸引不少网友参与「试驾」活动。 今天,我们介绍其中一个令人印象深刻的应用 —— 在不到 100 美元的树莓派 5 上跑 Llama 3 8B!

  树莓派系列是全球最为知名的袖珍型小巧却又性能强大的迷你电脑,5 代版本配置更强还有新定制的芯片。X 网友 @adamcohenhillel 发现, Llama3 8B 能在树莓派 5 以每秒 1.89 个 token 的速度运行,非常疯狂!支持 8K 上下文窗口。

  让 Llama3 向世界打个招呼,Llama3 很快响应:「HEY WORLD!How’s everyone doing today?」,仅用 11.6 秒。对于在树莓派这样的设备上运行大模型来说,这个响应速度已经很不错了,可以满足一些实时应用需求。

  值得注意的是,由于移动设备、嵌入式系统或边缘计算设备的硬件资源有限,4bit 量化可以显著减少模型的大小和计算需求,使得在这些设备上运行大型模型成为可能。这位用户也使用了 4bit 量化推理 Llama3 8B。

  首先请确保你有一台树莓派 5,配备至少 8GB 内存,准备一个 32GB 的 SD 卡。接下来,我们需要给硬件安装操作系统。从官网下载 Raspberry Pi OS,运行后你会看到如下画面:

  请选择设备 Raspberry Pi 5、选择最新操作系统镜像(推荐 64 位版本)、选择存储为插入的 SD 卡。点击「next」,系统问你是否要编辑设置,请点击「编辑设置」:

  配置设定上,启用主机名并设置为 raspberrypi.local;设置一个你将记住的用户名和密码,稍后会用到;启用 「配置无线局域网」并添加你的 Wi-Fi 名称和密码;保存设置并继续,等待操作系统写入 SD 卡:

  将 SD 卡插入树莓派,并连接电源。使用 SSH ( Secure Shell ) 协议远程连接并登录到树莓派设备:

  好了,在树莓派上构建出适合运行大语言模型的环境后,接下来就该将大语言模型装进来啦!怎么装?作者提供了两个办法。

  一个是用 Ollama 来运行大语言模型。Ollama 是一个开源工具,透过它提供简单的安装指令和命令行界面,在本地运行大语言模型会变得更加简单和快捷。

  第一步:安装必要的软件包。打开命令行工具,输入以下命令更新软件包列表并安装一些必需的编程工具和库:

  第二步:下载 llama.cpp。使用 Git 控制工具下载 llama.cpp 代码库,这个库是专门用来运行大型语言模型的。命令是:

  第五步:回到代码库根目录并运行模型,现在可以让它回答「What’s up?」等问题啦。搞定,结束。


ca88手机登录地址