当前位置: 首页 > news >正文

浅谈人工智能之基于阿里云使用vllm搭建Llama3

浅谈人工智能之基于阿里云使用vllm搭建Llama3

引言

随着人工智能技术的迅速发展,Llama3作为一个先进的语言模型,受到广泛关注。本文将介绍如何在阿里云上使用VLLM搭建Llama3,为用户提供一套完整的技术流程。

环境准备

阿里云账户

确保您拥有有效的阿里云账户,并已相关云服务,以我为例,开通的是交互式建模 PAI-DSW。

程序安装

conda安装

第一步:根据自己的操作系统下载对应的安装脚本

wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh

第二步:运行脚本

bash Anaconda3-2024.02-1-Linux-x86_64.sh

第三步:根据提示进行环境配置并安装完成,详情可见:
conda安装

vllm安装

conda安装完成以后,我们可以继续安装vllm
第一步:使用conda创建vllm环境

conda create -n vllm python=3.10

第二步:激活vllm

conda activate vllm

第三步:安装vllm相关包

pip install vllm

第四步:因为我们需要通过modelscope下载相关模型,所以我们需要下载modelscope相关依赖

pip install modelscope

Llama3安装

vllm安装完成以后,我们可以继续安装Llama3
第一步:创建路径

mkdir models
cd /mnt/workspace/models

第二步:安装Llama3

git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

服务启动和测试

当准备工作做完以后,我们就可以进行服务启动和测试
第一步:服务启动

python -m vllm.entrypoints.openai.api_server --model /mnt/workspace/models/Meta-Llama-3-8B-Instruct --dtype auto --api-key 654321

补全模式

我们编写一个补全模式下的测试代码,测试代码如下

from openai import OpenAIclient = OpenAI(base_url="http://localhost:8000/v1",api_key="654321",
)
print("服务已成功连接")
completion = client.completions.create(model="/mnt/workspace/models/Meta-Llama-3-8B-Instruct",prompt="北京是",max_tokens=128,
)
print("### 北京是: ")
print("Completion result: ", completion)

聊天模式

我们编写一个聊天模式下的测试代码,测试代码如下

from openai import OpenAIclient = OpenAI(base_url="http://localhost:8000/v1",api_key="654321",
)
print("服务已成功连接")completion = client.chat.completions.create(
model="/mnt/workspace/models/Meta-Llama-3-8B-Instruct",
messages=[{"role": "system", "content": "你是一位高级助手."},{"role": "user", "content": "中国的首都是哪里?"}],max_tokens = 128,
)
print(completion.choices[0].message)

分别运行上述脚本,得到的结果如下
在这里插入图片描述
至此基于阿里云使用vllm搭建Llama3完成。


http://www.mrgr.cn/news/56717.html

相关文章:

  • Acti数据集:首个全面手动标注的汽车网络安全威胁情报语料库,包含908份真实报告,涵盖3678个句子、8195个安全实体和4852个语义关系。
  • torch.nn.functional模块介绍
  • 推荐一款风扇控制软件:Fan Control
  • C++与现代开发实践第二课:C++标准库(STL)深入
  • 【C#】不需要连接数据库使用 ADO.NET 实现数据绑定
  • 人工智能--数学基础
  • AIGC文本生成3D模型
  • 模型的参数化和非参数化是什么?
  • 常见的css选择器汇总
  • 管家婆ERP集成用友好业财(管家婆主供应链)
  • 机器视觉运动控制一体机在DELTA并联机械手视觉上下料应用
  • HBuilderX离线打包Android
  • 会话管理——Cookie
  • vue常用的修饰符作用与使用场景总结
  • 云上大数据架构是什么?
  • 已集成工作流引擎的低代码平台(源码获取,JAVA,Vue)
  • WPF LiveChart控件基础属性介绍
  • 代码随想录算法训练营第五天| 哈希表理论基础 454.四数相加II 383.赎金信 15.三数之和 18.四数之和
  • 【C++】STL----map和set
  • RAD Studio 12.2 Athens Inline Patch 1 已可下载更新