云图网 | 整合优质网络资源,聚力优质资源共享平台

置顶 DeepSeek-V3.1-GGUF 1-bit～16-bit 对比和选择

核心定义与背景 DeepSeek-V3.1 基础模型总参数 685B、单 token 激活 37B 参数，上下文 128K，支持混合推理（思考 / 非思考模式），编程、长文本、工具调用能力突出。原生支持 FP16/BF16/FP8 等精度，GGUF 是社区…

人工智能 2025年12月21日
0
置顶 AI大模型量化方法及下载地址

1. 什么是模型量化模型量化是将高精度的模型（通常为 32 位浮点数 FP32 或 16 位浮点数 FP16 ）的权重和激活值转换为低精度模型（如 8 位整数 INT8）的过程。 FP32 的值范围为 -3.4*10^38 到 3.4*10^38，有 40 亿…

人工智能 2025年12月21日
0
置顶银河麒麟(KylinOS)下DeepSeek的四种使用场景

如何在银河麒麟使用DeepSeek？最近国内AI大模型DeepSeek爆火，相信使用银河麒麟操作系统的用户也非常急迫的想体验一把，接下来，一文给大家介绍在银河麒麟操作系统玩转DeepSeek的四种场景！四种使用场景一、网页…

人工智能 2025年12月18日
0
人工智能

置顶安装银河麒麟桌面系统V10【超详细图文教程】

1、下载安装镜像 1.1 申请试用银河麒麟官网提供免费试用下载，需要申请一下。打开 https://www.kylinos.cn/support/trial.html 填上相应信息后提交。 1.2 下载提交成功会转到下载页面，根据CPU架构选择要下载的安…

2025年12月18日
0
置顶 GitHub 镜像站点

国内访问 GitHub 有时会遇到速度慢或不稳定的情况，这时 GitHub 镜像站点就能帮上忙。它们通过代理或缓存机制，让你更顺畅地浏览仓库、下载资源甚至克隆代码。下面表格汇总了一些常见的镜像站及其主要用途镜像站…

研发管理 2025年12月1日
4
人工智能

置顶 2024年国内外AI领域开源常用大模型资料汇集及资源下载部署方法（持续更新中）

一、介绍目前，开源大小模型较多，在实际应用过程中遇到调试和问题点较多，本文是综合汇总集合，做测试使用可以，实际商业应用要慎重考虑！！！！！基座模型通常指的是一个通用的、预先训练好的语言模型，如GPT-3…

2024年6月13日
0
claude code 中文设置

Claude Code 可以通过对话指令、配置文件或中文化插件实现中文界面和中文对话，支持永久切换。 1. 对话中临时切换中文在 Claude Code 的消息接口或 CLI 中，你可以在对话开头明确要求使用中文。例如：我希望你之…

人工智能 29秒前
0
一个非程序员的AI产品开发全流程，从想法到上线——附完整提示词模板

阶段一：市场调研（1-3天）做什么这个阶段回答一个问题：这个方向值得做吗？很多人跳过这一步。觉得自己的点子天下第一，直接开干。我以前也这样。后来浪费了大量时间后，学到了一个教训：点子不值钱，值钱的是…

人工智能 2026年4月18日
0
AI Coding 长文分享：如何真正把工具用起来，从原理到实践

简介：本文从原理到实践系统地分享了如何高效使用AI编程工具。涵盖其底层机制（如Token计算、工具调用、Codebase索引与Merkle Tree）、提升对话质量的方法（如规则设置、渐进式开发）、实际应用场景（如代码检索、…

人工智能 2026年4月18日
0
AI 时代产品的创建流程：从想法到上线的一体化路径

一、为什么要重构产品流程？传统产品开发流程通常分为：市场调研 → 需求分析 → 原型设计 → 技术开发 → 上线运营然而，在 AI 时代，这一线性流程被打破 —— 许多环节正在被并行化、自动化、智能化。 AI 的角色不再是…

人工智能 2026年4月18日
0
告别Windows依赖锁死！.NET 10加持C#上位机，国产Linux系统性能翻倍与7*24h稳定性验证全实战

在智能制造信创国产化的深水区，工业自动化领域的上位机系统正面临前所未有的迁移压力：传统Windows+WPF架构的工控程序，被要求快速适配统信UOS/银河麒麟+鲲鹏/飞腾/龙芯的国产软硬件环境。但绝大多数开发团队在迁…

编程笔记 2026年4月7日
0
DeepSeek V4 弃用英伟达跑华为昇腾 × GPT-6“土豆“4.14发布——CUDA到CANN迁移踩坑和模型选型

一、DeepSeek V4：CUDA迁移到CANN，这次是认真的 1.1 基本情况 The Information 4月3号的独家报道，五个知情人士给出了一致说法：维度规格备注参数量 1.2万亿 Ultra-MoE稀疏激活芯片华为昇腾950PR 替代NVIDIA…

人工智能 2026年4月7日
0
GPUStack 在华为昇腾 800I A2 服务器上的保姆级部署指南

随着国产 AI 芯片生态的日益成熟，华为昇腾（Ascend）系列 NPU 已成为大模型私有化部署的重要选择。GPUStack 作为一个开源的、支持异构算力（包括 NVIDIA、AMD、Apple Silicon 以及华为昇腾等）的集群管理器，自 v0…

人工智能 2026年4月7日
0
人工智能

GPUStack 中集成基于 mis-tei 实现昇腾上的高性能 Embedding/Reranker 模型推理

在昇腾（Ascend）生态中，vLLM 等推理引擎在生成类任务中表现出色，已被广泛采用。而在 Embedding 与 Reranker 等检索相关场景下，mis-tei 作为专用推理组件，同样提供了高效且更贴合场景的能力。 mis-tei 专注于文…

2026年4月7日
0
制作并量化GGUF模型上传到HuggingFace和ModelScope

llama.cpp 是 Ollama、LMStudio 和其他很多热门项目的底层实现，也是 GPUStack 所支持的推理引擎之一，它提供了 GGUF 模型文件格式。GGUF (General Gaussian U-Net Format) 是一种用于存储模型以进行推理的文件格式…

人工智能 2026年4月7日
0
通过GPUStack在昇腾Ascend 910B上运行Qwen2.5推理

目前在国产 AI 芯片，例如昇腾 NPU 上运行大模型是一项广泛且迫切的需求，然而当前的生态还远未成熟。从底层芯片的算力性能、计算架构的算子优化，到上层推理框架对各种模型的支持及推理加速，仍有很多需要完善的地…

人工智能 2026年4月7日
0
人工智能

GPUStack 0.2：开箱即用的分布式推理、CPU推理和调度策略

GPUStack 0.2：开箱即用的分布式推理、CPU推理和调度策略 GPUStack 是一个专为运行大语言模型（LLM）设计的开源 GPU 集群管理器，旨在支持基于任何品牌的异构 GPU 构建统一管理的算力集群，无论这些 GPU 运行在 Ap…

2026年4月7日
0
人工智能

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

GPUStack正式发布: 为大模型而生的开源GPU集群管理器经过 Seal 研发团队几个月来持续的开发和测试，我们满怀期待及热情地发布新的产品 GPUStack，GPUStack 是一个用于运行 LLM（大型语言模型）的开源 GPU 集群管理…

2026年4月7日
0
人工智能

GPUStack 是一个开源的 GPU 集群管理器，专为高效的 AI 模型部署而设计

GPUStack 是一个开源的 GPU 集群管理器，专为高效的 AI 模型部署而设计。它配置和编排推理引擎（vLLM、SGLang、TensorRT-LLM 或您自定义的引擎），以优化跨 GPU 集群的性能。其核心功能包括：多集群 GPU 管理。跨…

2026年4月7日
0
谷歌DeepMind正式发布Gemma 4，一口气放出四款开源模型

凌晨，谷歌DeepMind正式发布Gemma 4，一口气放出四款开源模型。从能塞进手机的2B，到可以单卡跑满的31B，四个尺寸全覆盖，全部基于Gemini 3同源打造。时隔一年，Gemma 4终于来了，实力迎来史诗级跃迁。最炸的一…

人工智能 2026年4月5日
0

点击查看更多

下载专区

专题介绍 全部专题

友情链接

专题介绍全部专题