标签: 大语言模型

8 个内容

笔记(1)

OpenAI大型语言模型使用tokens处理文本,tokens为文本中常见字符序列。模型通过学习tokens间统计关系,擅长预测序列中的下一个token。该工具帮助理解分词机制。

Elliot Yang·
14 浏览

动态(7)

E
Elliot Yang
公开
维度传统 NLP 辅助 TTS大模型 (LLM) 驱动 TTS
核心逻辑基于规则或小型模型预测发音基于概率预测语音 Token
情感表现刻板、预设的情感模板自然、随文意变化的细腻情感
上下文感知仅限于句子内部能跨段落感知语境和角色性格
处理复杂文本容易在多音字上出错容错率极高,能模仿口语碎碎念
浏览:24点赞:0
E
Elliot Yang
公开

Claude把我的代码批得体无完肤 Claude把我的代码批得体无完肤。 我没忍心告诉它,这其实是它几周前自己写的。

from 小红书一瞥

SEP24 Claude把我的代码 批得体无完肤。 我没忍心告诉它, 这是其实它几周前 自己写的。
浏览:152点赞:0
E
Elliot Yang
公开

via kuank

平衡的艺术
浏览:128点赞:0
E
Elliot Yang
公开

Ollama 0.2已发布更新

  1. 并行请求,可同时请求多个服务,每个请求仅占用少量内存。可支持同时处理多个聊天会话、为团队托管代码完成LLMs、同时处理文档的不同部分和同时运行多个代理。
  2. 运行多个模型,并增强了RAG功能(嵌入模型和文本完成模型可以同时加载到内存中)。
  3. 根据请求和可用 GPU 内存量自动加载和停止运行模型。

Ollama

关注频道 @ZaiHuaPd 频道爆料 @ZaiHuabot

浏览:151点赞:0
E
Elliot Yang
公开

Meta 发布 Llama 3 —— 迄今最强大的公开语言模型

Llama 3 的 8B 和 70B 型号拥有 8K 上下文窗口,经过 15T tokens 预训练,训练数据比 Llama 2 大了七倍,并且包含四倍多的代码。

其中 Llama 3-8B 的性能就已优于 Llama 2-70B。人类择优测试中 Llama 3-70B 远胜于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5。

Llama 3 的多模态和更大的版本将在数月内推出,其中最为强大的 Llama 3-400B+ 仍在训练中,三天前的基准测试结果已经持平 Claude 3 Opus 超过 Gemini Pro 1.5,仅数学落后最先进的 GPT-4-2024-04-09

Meta

线索:@ZaiHuabot 投稿:@TNSubmbot 频道:@TestFlightCN

浏览:164点赞:0