AI 功能完整指南
PonyLab 的 AI 功能与实验室工作流深度集成:从实验数据智能对话,到自动报告生成、异常检测、协议解析、自然语言查询和库存预测。本页详细说明每项功能的工作原理、配置方法、示例用法和使用限制。
专业版功能
所有 AI 功能仅对专业版和企业版团队开放。AI 功能采用 BYOK(Bring Your Own Key)模式,你需要提供自己的 AI 服务商 API Key,token 费用由服务商直接向你收取。查看订阅计划
AI 架构概览
PonyLab 使用 BYOK 架构:你提供 AI 服务商的 API Key,PonyLab 使用该 Key 代表你发起 AI 请求,返回结果后在界面上展示。整个调用链路如下:
数据不存储
发送给 AI 服务商的数据仅用于生成当次响应,不被缓存或存储到 PonyLab 服务器以外的位置
端到端加密
所有 API 请求通过 HTTPS/TLS 1.3 加密传输
最小化原则
PonyLab 只将分析所需的相关数据片段发送给 AI,不发送整个数据库内容
配置 AI — 详细步骤
AI 功能需要 SUPER_ADMIN 在团队层级配置 AI 服务商的 API Key。配置一次,团队所有专业版 AI 功能立即可用。
第一步:获取 API Key
根据你选择的 AI 服务商,前往以下地址获取 API Key:
| 服务商 | 获取地址 | Key 格式 | 注册要求 |
|---|---|---|---|
| Anthropic | console.anthropic.com/keys | sk-ant-api03-... | 信用卡验证,有免费额度 |
| OpenAI | platform.openai.com/api-keys | sk-proj-... | 手机验证 + 信用卡充值 |
| OpenRouter | openrouter.ai/keys | sk-or-v1-... | 邮箱注册即可,有部分免费模型 |
提示
第二步:在 PonyLab 中配置 API Key
- 以 SUPER_ADMIN 身份登录,进入 设置 → AI 配置。
- 在「AI 提供商」下拉菜单中选择你的服务商(Anthropic / OpenAI / OpenRouter)。
- 在「API Key」输入框中粘贴你的 API Key。Key 经 AES-256 加密后存储,团队成员无法查看原始值,只能看到前 8 位和最后 4 位(如
sk-ant-a...3f2k)。 - (可选)在「默认模型」下拉菜单中选择默认使用的模型。不同 AI 功能也可以在各自设置中单独指定模型,此处设置仅为全局默认值。
- (可选)设置「月度用量上限」:以美元为单位,超出后 AI 功能自动暂停,直到下月重置或手动调高上限。建议首月设置 $20–50 测试用量。
- 点击「验证连接」:系统发送一个最小测试请求(约 10 tokens),验证 Key 有效且配额充足。验证通常在 3 秒内完成。
- 验证通过后,点击「保存设置」。团队所有专业版 AI 功能立即可用。
成功提示
注意
第三步:为各功能单独选择模型(可选)
不同 AI 功能对模型能力的要求不同,你可以为每个功能单独指定模型,以优化性价比:
| AI 功能 | 推荐模型 | 理由 |
|---|---|---|
| 实验数据对话 | claude-3-5-sonnet-20241022 | 需要深度科学推理,优先智能 |
| 报告生成 | claude-3-5-sonnet-20241022 | 需要高质量中英文写作能力 |
| 异常检测 | claude-3-haiku-20240307 | 结构化输出任务,速度优先 |
| 协议解析(文本) | claude-3-5-sonnet-20241022 | 需要理解复杂操作流程 |
| 协议解析(PDF) | gpt-4o(多模态) | 需要 PDF 图表识别能力 |
| 自然语言查询 | claude-3-haiku-20240307 | NL2SQL 任务,速度优先 |
| 库存预测 | claude-3-haiku-20240307 | 数值预测,轻量模型足够 |
AI 提供商对比
| 对比项 | Anthropic | OpenAI | OpenRouter |
|---|---|---|---|
| 推荐模型 | claude-3-5-sonnet | gpt-4o | 多模型聚合 |
| 中文理解能力 | ⭐⭐⭐⭐⭐(最强) | ⭐⭐⭐⭐ | 依所选模型 |
| 科研文本分析 | ⭐⭐⭐⭐⭐(首选) | ⭐⭐⭐⭐ | 依所选模型 |
| 多模态(图片/PDF) | 部分支持 | ✅ 完整支持 | 依所选模型 |
| 响应速度(标准模型) | ~2-4s | ~2-3s | ~3-6s(有路由延迟) |
| 定价(输入 per 1M tokens) | $3(Haiku)/ $3(Sonnet) | $2.5(GPT-4o mini)/ $5(GPT-4o) | 依所选模型,通常有加价 |
| 免费额度 | $5(新账号) | $5(新账号) | 部分模型永久免费 |
| 国内访问稳定性 | 需要科学上网 | 需要科学上网 | 部分路由更稳定 |
| 数据隐私政策 | API 数据不训练模型 | API 数据不训练模型 | 依所选模型提供商 |
| 企业合规支持 | ✅ SOC 2 Type II | ✅ SOC 2 Type II | 有限 |
对中文科研文本理解最佳,在实验报告生成和协议分析中表现优秀。如果你的团队主要用中文记录实验,Anthropic 是首选。
如果你需要 AI 分析含图表的 PDF(如仪器手册),GPT-4o 的图像理解能力是最佳选择。
通过统一接口访问多个模型,可以按需选择最便宜的可用模型。适合用量大但对模型无特定偏好的团队。
模型选择指南
不同模型在能力、速度和价格上有显著差异。以下是各 Anthropic 模型的选择建议(OpenAI 类似):
| 模型 | 特点 | 适合场景 | 相对费用 |
|---|---|---|---|
| claude-3-5-sonnet | 最智能,推理深度最强 | 实验分析对话、报告生成、复杂协议解析 | 高 |
| claude-3-opus | 能力最强,速度较慢 | 高价值、长文档分析(谨慎使用,费用高) | 极高 |
| claude-3-haiku | 速度最快,费用最低 | 异常检测、NL2SQL、库存预测等结构化任务 | 低 |
提示
claude-3-5-sonnet,其余功能设为 claude-3-haiku,在质量和费用之间取得平衡。实验数据对话
在任何实验详情页,打开右侧「AI 助手」面板,即可与 AI 对话,询问关于该实验的一切问题。
发送给 AI 的数据(上下文窗口内容)
AI 助手可访问当前实验的以下数据,PonyLab 在每次请求时自动构建上下文:
| 数据类型 | 发送内容 | 大小限制 |
|---|---|---|
| 实验全文 | 所有章节的富文本内容(转为纯文本) | 前 50,000 字符 |
| CSV 附件 | CSV 文件内容(表格数据完整发送) | 每个文件前 200 行 × 50 列 |
| 关联样品元数据 | 样品名称、类型、存储位置、关键字段 | 最多 20 个样品 |
| 实验状态历史 | 状态变更记录(草稿→进行中→完成等) | 完整 |
| 签名记录 | 签名者姓名、角色和时间戳(不含密码) | 完整 |
| 对话历史 | 当前会话的历史消息(支持多轮追问) | 最近 20 轮 |
10 个示例提示词(含预期输出)
获得更好结果的提示词技巧
- 指定格式:告诉 AI 你需要什么格式(如「以表格形式」「以 Markdown 列表形式」),AI 会严格遵循。
- 引用具体数据:如「CSV 第 3 列中的数据」比「数据」更精确,减少歧义。
- 分步骤提问:复杂分析分多个问题逐步问,比一次性问所有问题效果更好。
- 告知背景:如「这是一个 ELISA 实验,用于检测 IL-6 浓度」,提供上下文帮助 AI 给出更专业的解读。
- 要求引用数据:在提问末尾加「请引用具体数值支持你的结论」,减少 AI 泛泛而谈。
自动报告生成
AI 可以基于实验内容自动生成结构化的实验报告草稿,大幅减少撰写时间。
触发报告生成的步骤
- 在实验编辑器工具栏点击「AI 工具」→「生成报告摘要」,或在 AI 助手面板输入「请生成实验报告」。
- 选择报告语言(中文 / 英文 / 双语)。
- 选择报告风格:学术论文格式 / 内部报告格式 / 监管提交格式(GLP/GMP)。
- (可选)指定需要包含的特定章节或排除某些内容。
- 点击「生成」,等待 10–30 秒(视实验内容长度而定)。
- 报告草稿以新章节形式插入实验编辑器末尾,供审阅和编辑。
生成报告的标准章节
AI 报告草稿结构(学术格式示例)
自定义报告内容
在生成前可以通过自然语言指令自定义报告:
请生成一份实验报告,要求:
1. 使用英文撰写
2. 格式符合 Nature Methods 投稿要求(约 200 词摘要)
3. 重点突出与前期实验(EXP-2023-145)的对比
4. 数据结果部分列出具体数值(均值 ± SD)
5. 不需要包含「下一步建议」章节重要
异常检测
当你向实验附件上传 CSV 数据文件后,AI 异常检测功能在后台自动运行,帮助你发现潜在的数据问题。
检测算法和启发式规则
PonyLab 使用以下统计方法识别数值型数据中的异常:
| 方法 | 原理 | 适用场景 |
|---|---|---|
| Z-score | |z| > 3 标记为异常(距均值超过 3 个标准差) | 正态分布数据,样本量 > 30 |
| IQR(四分位数) | 数值超出 [Q1 - 1.5×IQR, Q3 + 1.5×IQR] 范围 | 小样本量,非正态分布(默认方法) |
| 序列异常 | 相邻数据点变化幅度超过历史变化率 3 倍 | 时间序列数据 |
| 空值和格式错误 | 检测非数值字符、混合格式、隐藏空格 | 数据录入质量检查 |
如何解读检测结果
检测完成后,AI 助手面板显示汇总报告,CSV 预览中异常单元格高亮显示(黄色 = 疑似异常,红色 = 严重异常):
疑似异常(黄色)
Z-score 2–3 或 IQR 边界附近。可能是正常变异,建议人工核查
严重异常(红色)
Z-score > 3 或明显超出 IQR 边界。很可能是数据录入错误或实验问题
格式问题(灰色)
非数值字符、空值等数据格式问题,需要检查数据录入规范
处理误报(False Positives)
并非所有被标记的数据点都是真正的错误。处理误报的方法:
- 在 CSV 预览中右键异常单元格,选择「标记为已确认(非异常)」,AI 将在本次会话中忽略该点。
- 调低敏感度:在 AI 助手面板选择「敏感度:低」,异常检测阈值更宽松(Z-score 阈值从 2.5 提高到 3.5)。
- 在实验笔记中注释说明:记录该数据点为预期的极端值(如正对照、特定处理组的预期高值)。
提示
IC50_uM 而非 column3),AI 可以给出更准确的生物学解读,减少误报。协议解析(文本输入)
AI 可以从非结构化文本中提取操作步骤,自动创建结构化 SOP 协议,避免手动录入每一个步骤。
支持的输入格式
- 论文 Methods 部分:直接粘贴论文中的实验方法描述(中英文均支持)
- 产品说明书文字:试剂盒、抗体说明书中的操作步骤
- 操作流程描述:任何以步骤形式编写的操作说明
- 手写记录的数字化文本:扫描 OCR 后的实验笔记文字
解析步骤
- 进入 协议 → 新建协议,点击「AI 解析文本」选项卡。
- 在文本框中粘贴源文本(无长度限制,但超过 8,000 字符时解析时间会增加)。
- (可选)指定协议类型(细胞培养 / 分子生物学 / 分析化学 / 其他),帮助 AI 正确理解领域术语。
- 点击「开始解析」,等待 5–15 秒。
- AI 生成结构化步骤列表,每个步骤包含:步骤编号、操作描述、试剂/仪器、注意事项(如有)、预期结果(如有)。
- 在编辑器中逐步审核,拖拽调整顺序,编辑或删除不适用的步骤。
- 确认无误后点击「创建协议草稿」,协议进入草稿状态,等待 PI 审核和发布。
示例:输入与解析输出
协议解析(PDF 上传)
支持的 PDF 类型
文字型 PDF(推荐)
由 Word/LaTeX 导出的 PDF,文字可被程序读取。解析准确率 >90%。
扫描型 PDF
印刷文件扫描而成。PonyLab 会先 OCR 识别文字,再解析。建议扫描分辨率 ≥300 DPI。
仪器手册(含图表)
含操作步骤图的 PDF。AI 会分析图表内容,但纯图片步骤可能缺失,需人工补全。
试剂盒说明书
通常格式规整,解析效果最好。建议选择最新版本的说明书 PDF。
PDF 上传与解析步骤
- 进入 协议 → 新建协议 → AI 解析 PDF。
- 点击「选择 PDF 文件」,上传 PDF(最大 20 MB,最多 100 页,超过 100 页的 PDF 只解析前 100 页)。
- (可选)在「页面范围」输入框中指定要解析的页码范围(如
5-25),适合只有部分页面包含操作步骤的情况。 - (可选)选择协议类型(帮助 AI 理解领域术语)。
- 点击「上传并解析」。上传和解析通常需要 15–60 秒(取决于文件大小)。
- AI 返回结构化步骤,同时列出从 PDF 中提取的试剂清单和仪器清单。
- 在编辑器中审核和修改,然后保存为协议草稿。
注意
自然语言数据查询(NL2SQL)
自然语言查询(NL2SQL)让你通过说话一样的方式跨全团队数据进行复杂检索,无需了解数据库结构或 SQL。
工作原理
PonyLab 的 NL2SQL 工作流程分三步:
- 解析自然语言:AI 理解你的查询意图,识别关键实体(实验、样品、时间范围等)和条件(过滤、分组、排序)。
- 生成安全 SQL:AI 构建只读 SQL 查询,自动附加
WHERE team_id = ?条件,确保数据隔离。生成的 SQL 在执行前会经过安全白名单验证,禁止 INSERT/UPDATE/DELETE。 - 返回结构化结果:查询结果以表格或图表形式显示,并提供可下载的 CSV 导出。
15 个示例查询
NL2SQL 的局限性
重要
以下类型的查询可能无法正确执行:
- 非常模糊的条件:如「找出好的实验」(「好」没有可量化的定义)
- 需要跨团队数据的查询:所有查询严格限制在当前团队,不支持跨团队比较
- 需要计算 CSV 内数值的查询:如「找出 IC50 低于 5 的实验」——CSV 内的数据列不被索引,NL2SQL 只能搜索实验元数据字段
- 预测型查询:如「下个月哪些试剂会缺货」——这类需求应使用 AI 库存预测功能
- 超出数据库字段的推断:如「找出质量最好的实验」——系统只能基于已录入的结构化字段查询
注意
库存需求预测
AI 分析过去 90 天的库存消耗历史,为每个库存条目生成前瞻性预测,帮助你在库存耗尽前及时补货。
分析的数据内容
- 历史消耗记录:过去 90 天所有 OUT 和 ADJUST 类型的库存调整记录
- 当前库存量:实时数量 vs. 安全库存阈值
- 消耗频率模式:工作日 vs. 周末、季节性波动(实验旺季)
- 采购提前期:你在库存条目上设置的 Lead Time(如 14 天),纳入预测补货触发点
如何解读预测结果
| 预测字段 | 含义 | 注意事项 |
|---|---|---|
| 预计耗尽日期 | 基于历史平均消耗速率,预测当前库存在哪天降为 0 | 高置信区间时可信;消耗极不规律时置信度低 |
| 建议补货触发日期 | = 预计耗尽日期 - 采购提前期(Lead Time) | 确保设置了准确的 Lead Time |
| 建议补货量 | 基于 30 天的预测消耗量 + 安全库存缓冲 | 参考建议,根据实际采购单位(如整盒/整箱)调整 |
| 消耗趋势 | 折线图:过去 90 天实际消耗量 vs. 预测线 | 若实际线波动很大,预测精度有限 |
| 置信度 | 高/中/低。基于历史数据的充足程度和规律性 | 置信度「低」时,以人工判断为主 |
准确性预期
库存预测的准确性取决于数据质量:
高准确率场景
消耗规律(每周固定用量)、历史数据充足(90天+)、Lead Time 已设置
中等准确率场景
消耗有一定波动、历史数据 30–90 天、季节性因素明显
低准确率场景
消耗极不规律(如按项目批量使用)、历史记录少于 30 天、新加入的库存条目
数据隐私与安全
PonyLab 对 AI 功能采取「数据最小化」原则,并遵循 Anthropic、OpenAI 的 API 数据处理承诺。
| 安全措施 | 具体实现 |
|---|---|
| 数据不用于训练 | 通过 Anthropic / OpenAI 的 API 发送的数据不用于训练其模型(这是企业 API 服务条款的明确条款) |
| 传输加密 | 所有 API 请求通过 HTTPS/TLS 1.3 加密传输 |
| API Key 加密存储 | API Key 以 AES-256-GCM 加密后存储在数据库中,解密密钥存储在独立的密钥管理服务中 |
| 最小化数据发送 | 只发送当前分析所需的数据片段,不发送整个团队数据库的内容 |
| 服务端代理 | 所有 AI 请求通过 PonyLab 服务端发起,API Key 从不暴露在前端或浏览器中 |
| AI 功能可关闭 | SUPER_ADMIN 不配置 API Key 时,所有 AI 功能入口自动隐藏,不发生任何 AI 调用 |
HIPAA / GDPR 注意事项
注意
- 处理患者数据(PHI)的机构:使用 AI 功能前,请确认你使用的 AI 服务商已与你签署 BAA(Business Associate Agreement)协议
- GDPR 数据主体在欧盟的机构:Anthropic 和 OpenAI 的 API 服务器位于美国,数据跨境传输需要依据 SCC(标准合同条款)
- 企业版私有化部署可以连接本地部署的 LLM(如通过 Ollama),完全消除数据出境问题
费用管理
各功能估算 Token 消耗
| 功能 | 输入 tokens(估算) | 输出 tokens(估算) | 单次费用(Sonnet) |
|---|---|---|---|
| 实验对话(单轮) | 2,000–8,000 | 300–800 | ~$0.03–0.12 |
| 报告生成 | 3,000–10,000 | 800–2,000 | ~$0.05–0.20 |
| 异常检测 | 500–3,000 | 200–500 | ~$0.01–0.05 |
| 协议解析(文本) | 1,000–5,000 | 500–1,500 | ~$0.02–0.10 |
| 协议解析(PDF 10页) | 5,000–15,000 | 500–1,500 | ~$0.07–0.20 |
| NL2SQL 查询 | 300–800 | 100–200 | ~$0.003–0.01 |
| 库存预测(单个条目) | 200–500 | 100–200 | ~$0.002–0.007 |
以上为估算值,实际费用因实验内容长度、模型版本和提供商定价变动而有所不同。
如何监控和控制用量
- PonyLab 月度上限:在「设置 → AI 配置」中设置月度美元上限,超出后 AI 功能暂停。
- AI 服务商后台限额:在 Anthropic/OpenAI 控制台中也设置每月限额,双重保险。
- 功能级别开关:可以选择性开启/关闭某些 AI 功能(如关闭 PDF 解析,仅保留对话功能),减少高费用功能的使用。
- 使用 Haiku 模型:将非核心功能(异常检测、NL2SQL)切换为 claude-3-haiku,费用降低约 10 倍。
提示
常见问题
PonyLab 会访问我的 AI 服务商账户的其他数据吗?
如果我的 API Key 到期或被撤销,会发生什么?
AI 对话历史记录是否保存?
多个成员同时使用 AI 功能会互相干扰吗?
AI 异常检测会自动修改我的实验数据吗?
NL2SQL 生成的 SQL 会修改数据库数据吗?
AI 功能是否支持多语言?
可以在离线环境中使用 AI 功能吗?
故障排查
问题:点击「验证连接」时提示 401 Invalid API Key
解决步骤
- 确认 API Key 完整复制(无空格或换行符),尝试重新复制粘贴
- 检查选择的服务商是否与 API Key 格式匹配(Anthropic Key 以 sk-ant- 开头,OpenAI Key 以 sk-proj- 开头)
- 在服务商控制台确认该 API Key 的状态为「Active」而非「Revoked」
- 确认你的服务商账户有足够的余额/配额(新账户需要充值后才能调用)
问题:AI 对话返回结果但内容质量很差或不相关
解决步骤
- 检查当前使用的模型(设置 → AI 配置 → 默认模型),建议换用更强的模型(如 claude-3-5-sonnet)
- 提示词添加更多上下文和具体要求(参考本页「提示词使用建议」章节)
- 如果实验内容很长,AI 可能只处理了前 50,000 字符,可以在对话中明确指引 AI 关注哪些部分
问题:异常检测没有运行(上传 CSV 后没有出现异常标注)
解决步骤
- 确认 CSV 文件有数值型列(纯文本或日期列不参与异常检测)
- 检查 CSV 文件大小,超过 10 MB 的文件可能需要更长时间处理
- 在 AI 助手面板手动点击「重新分析异常」按钮触发
- 确认 SUPER_ADMIN 已开启「自动异常检测」选项(设置 → AI 配置)
问题:协议 PDF 解析结果不完整或缺少很多步骤
解决步骤
- 检查 PDF 是否为扫描型(图片 PDF),扫描质量低于 300 DPI 会导致 OCR 识别率差
- 尝试通过「页面范围」只解析包含操作步骤的页面,减少干扰内容
- 如果操作步骤以图示形式展示(如箭头说明图),AI 可能无法完整提取,需手动补充
- 将 PDF 先用 Adobe 或在线工具转为 Word 格式,再复制文字用文本解析方式处理
问题:NL2SQL 查询返回错误结果或空结果
解决步骤
- 尝试更精确的描述,加入具体的字段名(如「状态为 COMPLETED 的实验」比「完成的实验」更精确)
- 检查时间范围描述,「上个月」的起止日期依赖系统时间,若有疑问改用具体日期(如「2026 年 2 月」)
- 某些复杂查询(如多层嵌套条件)建议拆分为多个简单查询
- 查看 AI 助手面板中「生成的查询条件」部分,确认 AI 理解的条件是否正确
问题:AI 功能已配置但团队成员看不到 AI 入口
解决步骤
- 确认团队已升级为专业版或企业版(AI 功能在免费版不可用)
- 成员角色为 TECHNICIAN 时,部分 AI 功能不可用(参见权限矩阵)
- 刷新页面后重试(首次配置 API Key 后,权限状态可能需要几秒钟同步到客户端)
问题:AI 报告生成中途报错「Context too long」
解决步骤
- 实验内容过长(超过 ~50,000 字符)超出了模型的上下文窗口
- 将实验拆分为多个子实验,或在生成报告前先精简不必要的附件和冗余内容
- 对于长实验,可以先让 AI 分章节总结,再汇总成报告
问题:库存预测显示「数据不足,无法生成预测」
解决步骤
- 该库存条目的历史调整记录少于 30 天,积累更多数据后自动可用
- 确保历史库存调整都已正确录入(OUT 类型记录),而不是直接修改库存数量
- 置信度「低」的预测仍会显示,但应以人工判断为主