35MM.COFFEEa site built for app makers
Profile
limboy

大约 3 小时前

Jina AI 推出的 Reader 是一款专为大语言模型(LLM)设计的开源工具,旨在解决网页内容抓取中常见的格式混乱、JavaScript 渲染障碍及多媒体信息缺失等问题。该工具的核心功能包括“读取(Read)”和“搜索(Search)”。通过简单的 URL 前缀(如 https://r.jina.ai/),Reader 能将任何网页、PDF 或单页应用(SPA)转换为 LLM 易于理解的 Markdown 格式,从而显著提升 RAG(检索增强生成)系统和 AI 智能体的输出质量。

此外,Reader 提供了强大的 Web 搜索接口(https://s.jina.ai/),可实时检索互联网并返回前 5 个深度解析的网页内容,而非仅提供标题和摘要。它支持图像自动描述(通过 VLM 模型为图片生成 alt 标签)、流式传输模式(解决动态加载不全的问题)以及 JSON 输出模式。用户可以通过自定义 HTTP 请求头(Headers)精细控制 Cookie 转发、代理设置、CSS 选择器定位及缓存策略。该项目在 GitHub 上完全开源,采用 Apache-2.0 协议,并提供稳定、免费且可扩展的 API 服务,是构建现代 AI 应用的重要基础设施工具。