标签: 开源项目
9 个内容
动态(9)
🚨 今天看到个很能折腾的工具:Paseo
Paseo 是个「Claude Code/Codex/OpenCode 统一入口」的开源项目,支持桌面、移动端、CLI,核心是把本地/远端 agent 生态统一起来。
核心能力
• 跨端接入同一台 daemon(支持 Mac/PC/VPS) • 可以同时跑多个 agent、串并联任务(包括 CLI 编排) • 支持工作流里让 Claude 产计划、Codex 执行、再回填结果 • 有 Web + App + CLI,移动端也能追任务、看 diff、改跟进
我对它的看法
• 如果你经常在不同设备间切换:这东西真香,明显减少上下文断层。 • 如果你要做团队化 agent 工作流:CLI + worktree + 多 agent 协作这条线很值得盯。 • 坑位提醒:它不是替你省略模型调用成本,仍然受你后端/账号和网络质量影响;移动体验再爽,也别指望把本地重活全靠手机做完。
公开讨论/背景:GitHub + HN 都是从“自建 daemon + 多设备远控 agent”这个方向来的,方向对上了,不是单点“花哨 UI”。
适合人群:折腾 coding agent、喜欢 Serverless + 自主可控、又想把开发动作从终端拓到手机/平板的重度用户。
开源项目分享:AI思维导图生成器 (AiMarkmap)
这是一款AI在线思维导图单页html文件,能将文本智能转化为可视化导图,尤其适合快速梳理新闻报道、分析文章结构或消化长篇内容,助您在海量信息中迅速抓住核心脉络。
其核心亮点是“多版本生成”,AI可为同一内容提供多种结构方案供用户选择。工具支持用户配置自己的API和AI模型,此设计确保了您的输入内容与密钥仅在浏览器和指定服务商间传输,不经第三方服务器,充分保障数据安全与隐私。
此外,它还集成了实时预览、一键导出PNG、沉浸式全屏和中英双语等功能,旨在提供高效、安全且个性化的信息梳理与学习体验。
💡 本频道仅作项目分享,风险自控
开源项目分享:TextGAN-D 深度研究代理:Agent 设计新范式,探索LLM研究新路径
基于新的TextGAN-D 架构的深度研究代理 (Deep Research Agent) 已在 GitHub 开放源代码。该项目结合了传统深度学习方法与 Agent 设计,在低成本上实现了高质量的自动研究。
作为一个开源且免费的方案,它为社区提供了一个无需高昂成本即可探索高级 LLM 科研自动化的机会,与部分商业方案(如OpenAI的Deep Research)的高昂费用形成对比。
现在,您无需向 OpenAI 支付 200 USD 便可享受科研自动化的便利😋
💡 本频道仅作项目分享,风险自控
之前一直在 HTML ZONE 用 WASM 和 Web API 开发一些本地优先的 Web 工具。
今天刷到 @addyosmani 的网站,发现他也在做类似的事情,而且进度比我快得多!
这么多完全在浏览器内运行的工具,真的让人惊叹,尤其是屏幕录制功能。
更令人兴奋的是,这些工具全部开源!
🖼 图像处理
• Background Image Remover:AI 去背景,支持本地处理和自定义背景
• Squish - Image Optimizer:批量图片压缩,支持多格式和实时预览
• Filter - Image Editor:现代图像编辑器,内置滤镜和响应式设计
• Upscale and Fix Images:AI 图像增强与放大(2x–8x)
🎥 视频处理
• Compress - Video Optimizer:基于 FFMPEG 的视频压缩与格式转换
• Record:屏幕与摄像头录制,支持画中画和提词器
🧠 AI 工具
• Say - Voice Dictation:Whisper AI 语音转文字,支持摘要与笔记
• Chatty - AI Chat:本地运行的 AI 聊天助手,基于 WebGPU
📄 文档处理
• Scan - Document Scanner:网页端文档扫描,支持拍照、裁剪和 PDF 导出