当前位置: 首页 > news >正文

llama.cpp demo

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

修改Makefile使能mfma参数

    MK_CFLAGS   += -mfma -mf16c -mavx
    MK_CXXFLAGS += -mfma -mf16c -mavx

安装python3依赖

cat ./requirements/requirements-convert_legacy_llama.txt

numpy~=1.26.4
sentencepiece~=0.2.0
transformers>=4.40.1,<5.0.0
gguf>=0.1.0
protobuf>=4.21.0,<5.0.0

依次pip3 install numpy/pip3 install sentencepiece/pip3 install transformers/pip3 install gguf/pip3 install protobuf

下载https://huggingface.co/4bit/Llama-2-7b-chat-hf

转换出llama-2-7b-chat.gguf

python3 convert_hf_to_gguf.py ./models/Llama-2-7b-chat-hf --outfile llama-2-7b-chat.gguf

启动

./llama-cli -m ./llama-2-7b-chat.gguf  -co -cnv -p "You are a helpful assistant."  -fa -ngl 80 -n 512

即可开始对话

== Running in interactive mode. ==
 - Press Ctrl+C to interject at any time.
 - Press Return to return control to the AI.
 - To return control without starting a new line, end your input with '/'.
 - If you want to submit another line, end your input with '\'.

 <|im_start|>system
You are a helpful assistant.<|im_end|>

> hello
Hello! How can I help you today?
<|im_end|>

>
tell me about yourself
<|im_end|>

> can you speek Chinese ?
I apologize, but I don't speak Chinese. I'm just an AI trained to assist and provide helpful responses in English. Is there anything else I can help you with?
<|im_end|>

>


另外看看是不是可以直接下载 llama-2-7b-chat.gguf

https://huggingface.co/TheBloke/Llama-2-7B-Chat-GGUF/tree/main


http://www.mrgr.cn/news/21730.html

相关文章:

  • 复数随机变量(信号)的方差和协方差矩阵的计算
  • 【大模型开发】传统向量模型 vs 重排序模型:原理、实现与应用
  • echarts 实现签到记录日历组件
  • 推荐一款强大的OCR软件,请低调使用!
  • (备份) esp32 GPIO
  • 冒泡排序——基于Java的实现
  • 人工智能时代开启ai代写模式,让创作变得更加简单!
  • Python 中考虑 concurrent.futures 实现真正的并行计算
  • 解锁数据洞察:如何使用Python读取Excel文件
  • 自用NAS系列1-设备
  • 自动生成文案的神器,一键轻松生成爆款文案
  • 新手做短视频素材在哪里找?做短视频素材工具教程网站有哪些?
  • 【Oracle篇】全面理解优化器和SQL语句的解析步骤(含执行计划的详细分析和四种查看方式)(第二篇,总共七篇)
  • [数据结构] 哈希结构的哈希冲突解决哈希冲突
  • 【leetcode详解】考试的最大困扰度(滑动窗口典例)
  • Transformer从零详细解读
  • ​T​P​三​面​
  • 分布式架构下的秒杀优化实战:从高并发到数据一致性
  • Java Stream API
  • 模型训练套路(二)