相关文章
DeepSeek大模型一键部署解决方案:全平台多机分布式推理与国产硬件优化异构计算私有部署
DeepSeek R1 走红后,私有部署需求也随之增长,各种私有部署教程层出不穷。大部分教程只是简单地使用 Ollama、LM Studio 单机运行量化蒸馏模型,无法满足复杂场景需求。一些操作配置也过于繁琐,有的需要手动下载并合并分片模型文件&…
建站知识
2025/3/31 21:15:41
Dockerfile 编写推荐
一、导读
本文主要介绍在编写 docker 镜像的时候一些需要注意的事项和推荐的做法。
虽然 Dockerfile 简化了镜像构建的过程,并且把这个过程可以进行版本控制,但是不正当的
Dockerfile 使用也会导致很多问题。 docker 镜像太大。如果你经常使用镜像或者…
建站知识
2025/3/28 1:58:51
深入理解 Rust 中的智能指针
一、什么是智能指针?
智能指针是具有指针行为的数据结构,但它们与传统指针相比,提供了更多的功能。智能指针不仅拥有指向数据的能力,还可以管理内存,控制数据的所有权,并在不再需要时自动清理数据。Rust 通…
建站知识
2025/3/28 20:53:36
GoFound 与 MySQL 集成优化方案
GoFound 与 MySQL 集成优化方案
1. 明确需求
文章信息存储在 MySQL 数据库中。使用 GoFound 实现全文搜索功能。搜索时,先从 GoFound 中获取匹配的文章 ID,然后从 MySQL 中查询完整的文章信息。
2. 优化思路
数据同步:将 MySQL 中的文章数…
建站知识
2025/3/30 4:33:46
【DeepSeek系列】04 DeepSeek-R1:带有冷启动的强化学习
文章目录 1、简介2、主要改进点3、两个重要观点4、四阶段后训练详细步骤4.1 冷启动4.2 推理导向的强化学习4.3 拒绝采样和有监督微调4.4 针对所有场景的强化学习 5、蒸馏与强化学习对比6、评估6.1 DeepSeek-R1 评估6.2 蒸馏模型评估 7、结论8、局限性与未来方向 1、简介
DeepS…
建站知识
2025/3/20 2:44:47
Linux arm64 IOMMU总结
一、DMA的引入
Non-DMA:CPU直接与设备进行数据交互,CPU的负载会随着数据的读写而增加; DMA:CPU不参与数据的直接传输,DMA Controller负责Device与Memory之间的数据搬运,并以中断信号的形式通知CPU…
建站知识
2025/3/25 15:02:04
PET-SQL:基于大模型的两阶段Text2SQL方法
一. 背景
论文: PET-SQL: A Prompt-Enhanced Two-Round Refinement of Text-to-SQL with Cross-consistency
二. 算法介绍
2.1 主要流程
PET-SQL这篇文章提出了一种创新的基于大型语言模型的Text2SQL方法,该方法将SQL生成过程分为两个不同的阶段。在第一阶段&am…
建站知识
2025/3/28 18:43:46