标签: 并行计算

2 个内容

笔记(1)

本文以Rust语言探讨括号生成问题,核心为回溯算法,通过剪枝优化搜索。对比了clone和可变引用两种实现,后者内存效率更高。分析了时间/空间复杂度,并提出预分配内存、迭代法等优化策略。强调Rust所有权管理,并展望了并行化、形式化验证等前沿方向。

Elliot Yang·
99 浏览

动态(1)

E
Elliot Yang
公开

Ollama 0.2已发布更新

  1. 并行请求,可同时请求多个服务,每个请求仅占用少量内存。可支持同时处理多个聊天会话、为团队托管代码完成LLMs、同时处理文档的不同部分和同时运行多个代理。
  2. 运行多个模型,并增强了RAG功能(嵌入模型和文本完成模型可以同时加载到内存中)。
  3. 根据请求和可用 GPU 内存量自动加载和停止运行模型。

Ollama

关注频道 @ZaiHuaPd 频道爆料 @ZaiHuabot

浏览:151点赞:0