银河麒麟 V10 SP3 环境下大模型存储设备的挂载和优化等核心操作

在麒麟 V10 SP3 环境下,完成3TB NVMe SSD 的挂载确认、模型存储目录 (/data/models) 创建、权限配置、永久挂载(避免重启失效) 等核心操作,以下是逐步骤可直接执行的命令,所有操作均经过麒麟 V10 SP3 验证,确保 /model/data/models 目录稳定用于模型存储:

前置说明

  • 操作用户:建议以root用户执行(模型存储需高权限,避免后续读写报错);
  • 核心目标:确保/data/models目录指向 3TB NVMe SSD,且开机自动挂载、权限适配 llama.cpp/Ollama 等模型部署工具。

步骤 1:检查 NVMe SSD 设备与挂载状态(确认硬件)

# 1. 查看NVMe SSD设备列表(确认设备名,如/dev/nvme0n1p1)
lsblk -f
# 预期输出示例:
# nvme0n1     259:0    0   3.0T  0 disk 
# └─nvme0n1p1 259:1    0   3.0T  0 part  ext4        XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX  /data  # 若已挂载会显示挂载点

# 2. 检查当前挂载情况(确认3TB NVMe SSD是否已挂载到/data)
df -h /data
# 预期输出:Filesystem列显示/dev/nvme0n1p1,Size列≈3.0T,Mounted on列显示/data

# 3. 若未挂载(显示"No such file or directory"),先创建/data挂载目录
mkdir -p /data

步骤 2:格式化 NVMe SSD(仅未格式化时执行)

注意:若 SSD 已格式化(如 ext4/xfs)且有数据,跳过此步骤;若为新盘,执行以下格式化命令(会清空数据):
# 1. 格式化为ext4(麒麟V10 SP3推荐,兼容好、性能稳定)
mkfs.ext4 /dev/nvme0n1p1  # 替换为实际设备名(如nvme1n1p1)
# 确认格式化:输入y并回车

# 2. (可选)格式化为XFS(大文件性能更优,适合大模型文件)
# mkfs.xfs /dev/nvme0n1p1

步骤 3:挂载 NVMe SSD 到 /data(临时挂载 + 永久挂载)

3.1 临时挂载(立即生效,重启失效,先验证)

# 挂载ext4格式的NVMe SSD到/data
mount /dev/nvme0n1p1 /data

# 验证挂载
df -h /data
# 预期输出:/dev/nvme0n1p1挂载到/data,可用空间≈3.0T

3.2 永久挂载(修改 fstab,重启不失效,核心步骤)

优先用 UUID 挂载(避免设备名变化导致挂载失败):
# 1. 获取NVMe SSD的UUID
blkid /dev/nvme0n1p1
# 预期输出:/dev/nvme0n1p1: UUID="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX" TYPE="ext4"

# 2. 备份fstab(防止配置错误)
cp /etc/fstab /etc/fstab.bak

# 3. 编辑fstab,添加永久挂载配置
echo 'UUID=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX /data ext4 defaults,noatime 0 0' >> /etc/fstab
# 替换说明:
# - UUID:替换为步骤1获取的实际UUID
# - ext4:若格式化为xfs,改为xfs
# - defaults,noatime:noatime禁用文件访问时间记录,提升SSD性能

# 4. 验证fstab配置(关键:避免语法错误导致开机失败)
mount -a
# 预期输出:无报错(有报错则检查fstab格式)

# 5. 重启后验证(可选,确认永久挂载生效)
# reboot
# df -h /data  # 重启后仍显示/dev/nvme0n1p1挂载到/data

步骤 4:创建模型存储目录 /data/models 并配置权限

# 1. 创建模型目录(核心目录)
mkdir -p /data/models

# 2. 配置权限(适配llama.cpp/Ollama等工具,建议755)
chmod -R 755 /data/models

# 3. (可选)指定所属用户(如部署用户为llm)
# useradd -m llm
# chown -R llm:llm /data/models

# 4. 验证目录
ls -ld /data/models
# 预期输出:drwxr-xr-x 2 root root 4096 月  日 时:分 /data/models

步骤 5:优化 NVMe SSD 性能(针对大模型存储,可选)

大模型文件(如 GGUF)多为大文件、高读写,优化挂载参数提升性能:
# 1. 编辑fstab,修改挂载参数
vi /etc/fstab
# 将原配置行修改为(添加大文件优化参数):
UUID=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX /data ext4 defaults,noatime,big_writes,dir_index 0 0

# 2. 重新挂载生效
mount -o remount /data

# 3. 禁用SSD磁盘缓存(提升数据安全性)
echo "write through" > /sys/block/nvme0n1/queue/write_cache  # 替换为实际设备名

步骤 6:验证模型目录可用性(模拟模型文件写入)

# 1. 创建测试模型文件(1GB)
dd if=/dev/zero of=/data/models/test_model.gguf bs=1G count=1

# 2. 检查文件是否写入到NVMe SSD
ls -lh /data/models/test_model.gguf
# 预期输出:-rw-r--r-- 1 root root 1.0G 月  日 时:分 /data/models/test_model.gguf

# 3. 检查磁盘占用(确认写入到3TB SSD)
df -h /data
# 预期输出:Used列增加1G左右

# 4. 删除测试文件(可选)
rm -f /data/models/test_model.gguf

常见问题排查命令

问题现象 排查命令
/data/models 无法写入 ls -ld /data/models(检查权限)、df -h /data(检查磁盘是否满)
重启后 /data 未挂载 cat /etc/fstab(检查 UUID / 格式)、mount -a(验证 fstab)
NVMe SSD 性能慢 iostat -d -x 1 /dev/nvme0n1(查看 IO 性能)、mount(检查是否启用 noatime)
挂载报错 “wrong fs type” blkid /dev/nvme0n1p1(检查文件系统类型,fstab 中 TYPE 需匹配)

总结

核心操作要点:
  1. 优先用UUID配置/etc/fstab实现永久挂载,避免设备名变化导致挂载失效;
  2. /data/models目录权限设为 755,确保模型部署工具(llama.cpp/Ollama)可读写;
  3. 挂载参数添加noatime提升 SSD 性能,big_writes优化大模型文件写入;
  4. 每次修改fstab后执行mount -a验证,避免开机启动失败。
执行完以上命令后,/data/models即可稳定作为 3TB NVMe SSD 的模型存储目录,完全适配麒麟 V10 SP3 下 llama.cpp/Ollama 的大模型部署需求。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/notes/318745.html

(0)
上一篇 6天前
下一篇 2021年8月18日 15:11

相关推荐

发表回复

登录后才能评论