AI 功能

AI 功能完整指南

PonyLab 的 AI 功能与实验室工作流深度集成:从实验数据智能对话,到自动报告生成、异常检测、协议解析、自然语言查询和库存预测。本页详细说明每项功能的工作原理、配置方法、示例用法和使用限制。

专业版功能

所有 AI 功能仅对专业版和企业版团队开放。AI 功能采用 BYOK(Bring Your Own Key)模式,你需要提供自己的 AI 服务商 API Key,token 费用由服务商直接向你收取。查看订阅计划

AI 架构概览

PonyLab 使用 BYOK 架构:你提供 AI 服务商的 API Key,PonyLab 使用该 Key 代表你发起 AI 请求,返回结果后在界面上展示。整个调用链路如下:

用户输入提示词或触发AI 功能HTTPSPonyLab 服务端1. 收集实验上下文数据2. 构建 AI 请求 prompt3. 使用加密的 API Key4. 返回处理后的结果HTTPS/TLSAI 服务商Anthropic ClaudeOpenAI GPTOpenRouterAI 响应JSON 格式API Key 以 AES-256 加密存储,从不明文传输

数据不存储

发送给 AI 服务商的数据仅用于生成当次响应,不被缓存或存储到 PonyLab 服务器以外的位置

端到端加密

所有 API 请求通过 HTTPS/TLS 1.3 加密传输

最小化原则

PonyLab 只将分析所需的相关数据片段发送给 AI,不发送整个数据库内容

配置 AI — 详细步骤

AI 功能需要 SUPER_ADMIN 在团队层级配置 AI 服务商的 API Key。配置一次,团队所有专业版 AI 功能立即可用。

第一步:获取 API Key

根据你选择的 AI 服务商,前往以下地址获取 API Key:

服务商获取地址Key 格式注册要求
Anthropicconsole.anthropic.com/keyssk-ant-api03-...信用卡验证,有免费额度
OpenAIplatform.openai.com/api-keyssk-proj-...手机验证 + 信用卡充值
OpenRouteropenrouter.ai/keyssk-or-v1-...邮箱注册即可,有部分免费模型

提示

首次使用建议选择 Anthropic,有 $5 免费额度,可以充分测试所有 AI 功能。OpenRouter 的部分模型完全免费,适合预算有限的团队。

第二步:在 PonyLab 中配置 API Key

  1. SUPER_ADMIN 身份登录,进入 设置 → AI 配置
  2. 在「AI 提供商」下拉菜单中选择你的服务商(Anthropic / OpenAI / OpenRouter)。
  3. 在「API Key」输入框中粘贴你的 API Key。Key 经 AES-256 加密后存储,团队成员无法查看原始值,只能看到前 8 位和最后 4 位(如 sk-ant-a...3f2k)。
  4. (可选)在「默认模型」下拉菜单中选择默认使用的模型。不同 AI 功能也可以在各自设置中单独指定模型,此处设置仅为全局默认值。
  5. (可选)设置「月度用量上限」:以美元为单位,超出后 AI 功能自动暂停,直到下月重置或手动调高上限。建议首月设置 $20–50 测试用量。
  6. 点击「验证连接」:系统发送一个最小测试请求(约 10 tokens),验证 Key 有效且配额充足。验证通常在 3 秒内完成。
  7. 验证通过后,点击「保存设置」。团队所有专业版 AI 功能立即可用。

成功提示

验证通过后,页面显示绿色「已连接」状态,并显示当前 Key 关联的账户信息(如 Anthropic 账户邮箱)。

注意

API Key 费用由团队自行承担,按所使用的模型 token 量计费。建议在提供商后台也设置用量限额,防止意外超支。两个位置的限额互相独立,PonyLab 中的限额更易实时查看。

第三步:为各功能单独选择模型(可选)

不同 AI 功能对模型能力的要求不同,你可以为每个功能单独指定模型,以优化性价比:

AI 功能推荐模型理由
实验数据对话claude-3-5-sonnet-20241022需要深度科学推理,优先智能
报告生成claude-3-5-sonnet-20241022需要高质量中英文写作能力
异常检测claude-3-haiku-20240307结构化输出任务,速度优先
协议解析(文本)claude-3-5-sonnet-20241022需要理解复杂操作流程
协议解析(PDF)gpt-4o(多模态)需要 PDF 图表识别能力
自然语言查询claude-3-haiku-20240307NL2SQL 任务,速度优先
库存预测claude-3-haiku-20240307数值预测,轻量模型足够

AI 提供商对比

对比项AnthropicOpenAIOpenRouter
推荐模型claude-3-5-sonnetgpt-4o多模型聚合
中文理解能力⭐⭐⭐⭐⭐(最强)⭐⭐⭐⭐依所选模型
科研文本分析⭐⭐⭐⭐⭐(首选)⭐⭐⭐⭐依所选模型
多模态(图片/PDF)部分支持✅ 完整支持依所选模型
响应速度(标准模型)~2-4s~2-3s~3-6s(有路由延迟)
定价(输入 per 1M tokens)$3(Haiku)/ $3(Sonnet)$2.5(GPT-4o mini)/ $5(GPT-4o)依所选模型,通常有加价
免费额度$5(新账号)$5(新账号)部分模型永久免费
国内访问稳定性需要科学上网需要科学上网部分路由更稳定
数据隐私政策API 数据不训练模型API 数据不训练模型依所选模型提供商
企业合规支持✅ SOC 2 Type II✅ SOC 2 Type II有限
首选推荐Anthropic

对中文科研文本理解最佳,在实验报告生成和协议分析中表现优秀。如果你的团队主要用中文记录实验,Anthropic 是首选。

多模态需求OpenAI

如果你需要 AI 分析含图表的 PDF(如仪器手册),GPT-4o 的图像理解能力是最佳选择。

预算优先OpenRouter

通过统一接口访问多个模型,可以按需选择最便宜的可用模型。适合用量大但对模型无特定偏好的团队。

模型选择指南

不同模型在能力、速度和价格上有显著差异。以下是各 Anthropic 模型的选择建议(OpenAI 类似):

模型特点适合场景相对费用
claude-3-5-sonnet最智能,推理深度最强实验分析对话、报告生成、复杂协议解析
claude-3-opus能力最强,速度较慢高价值、长文档分析(谨慎使用,费用高)极高
claude-3-haiku速度最快,费用最低异常检测、NL2SQL、库存预测等结构化任务

提示

对于大多数团队,建议将「实验对话」和「报告生成」设为 claude-3-5-sonnet,其余功能设为 claude-3-haiku,在质量和费用之间取得平衡。

实验数据对话

在任何实验详情页,打开右侧「AI 助手」面板,即可与 AI 对话,询问关于该实验的一切问题。

发送给 AI 的数据(上下文窗口内容)

AI 助手可访问当前实验的以下数据,PonyLab 在每次请求时自动构建上下文:

数据类型发送内容大小限制
实验全文所有章节的富文本内容(转为纯文本)前 50,000 字符
CSV 附件CSV 文件内容(表格数据完整发送)每个文件前 200 行 × 50 列
关联样品元数据样品名称、类型、存储位置、关键字段最多 20 个样品
实验状态历史状态变更记录(草稿→进行中→完成等)完整
签名记录签名者姓名、角色和时间戳(不含密码)完整
对话历史当前会话的历史消息(支持多轮追问)最近 20 轮

10 个示例提示词(含预期输出)

用户输入
这个实验的阳性对照和阴性对照的结果有统计学差异吗?
AI 返回(示例)
基于 CSV 数据,阳性对照组均值为 X(SD = Y),阴性对照组均值为 A(SD = B)。独立样本 T 检验结果:t = 3.42,df = 18,p = 0.003 < 0.05,差异具有统计学意义...
用户输入
数据中的第 3 组与第 1 组有什么不同?差异的可能生物学解释是什么?
AI 返回(示例)
第 3 组较第 1 组增加了处理变量 X,OD450 值平均高出 42%。可能的解释:...
用户输入
根据当前实验结果,建议下一步实验方向是什么?
AI 返回(示例)
基于当前结果,建议:(1) 验证浓度梯度效应,在 0.1–10 µM 范围设 6 个浓度点...
用户输入
请为这个实验写一段 150 字以内的英文摘要,格式符合 Nature Protocols 投稿要求
AI 返回(示例)
Here we describe a protocol for... [结构化摘要,包含目的、方法、主要结果]
用户输入
这个实验方法部分写得是否足够详细,能让他人重复?缺少哪些信息?
AI 返回(示例)
当前方法部分缺少以下信息:(1) 细胞培养传代次数未注明...
用户输入
CSV 中哪些数据点可能是离群值?用 IQR 方法计算
AI 返回(示例)
使用 IQR 方法(Q1-1.5×IQR 和 Q3+1.5×IQR 为边界),识别到以下潜在离群值:第 7 行 OD450 = 4.23(正常范围 0.12–2.87)...
用户输入
这个实验用到的样品是什么来源?存储在什么条件下?
AI 返回(示例)
根据关联的样品元数据:样品 S-2023-145 来源为 ATCC,细胞系 HEK293T,存储于 -80°C 冻存管...
用户输入
生成一份这个实验的 Summary,格式为 Markdown,包含目的、方法摘要、数据摘要和结论
AI 返回(示例)
# 实验摘要 ## 实验目的 ... ## 方法摘要 ...
用户输入
如果要把这个实验写成论文,数据分析部分应该怎么写?
AI 返回(示例)
基于当前数据,统计方法部分可以这样描述:数据以均值 ± 标准误(SEM)表示,使用 GraphPad Prism 进行单因素方差分析...
用户输入
这个实验设计有什么潜在缺陷或对照组不足的地方?
AI 返回(示例)
实验设计潜在问题:(1) 缺少溶剂对照组(处理组使用 DMSO,但未设 DMSO 单独对照)...

获得更好结果的提示词技巧

  • 指定格式:告诉 AI 你需要什么格式(如「以表格形式」「以 Markdown 列表形式」),AI 会严格遵循。
  • 引用具体数据:如「CSV 第 3 列中的数据」比「数据」更精确,减少歧义。
  • 分步骤提问:复杂分析分多个问题逐步问,比一次性问所有问题效果更好。
  • 告知背景:如「这是一个 ELISA 实验,用于检测 IL-6 浓度」,提供上下文帮助 AI 给出更专业的解读。
  • 要求引用数据:在提问末尾加「请引用具体数值支持你的结论」,减少 AI 泛泛而谈。

自动报告生成

AI 可以基于实验内容自动生成结构化的实验报告草稿,大幅减少撰写时间。

触发报告生成的步骤

  1. 在实验编辑器工具栏点击「AI 工具」→「生成报告摘要」,或在 AI 助手面板输入「请生成实验报告」。
  2. 选择报告语言(中文 / 英文 / 双语)。
  3. 选择报告风格:学术论文格式 / 内部报告格式 / 监管提交格式(GLP/GMP)。
  4. (可选)指定需要包含的特定章节或排除某些内容。
  5. 点击「生成」,等待 10–30 秒(视实验内容长度而定)。
  6. 报告草稿以新章节形式插入实验编辑器末尾,供审阅和编辑。

生成报告的标准章节

AI 报告草稿结构(学术格式示例)

1. 实验目的与背景提炼实验的科学问题、研究背景和本次实验的具体目标
2. 材料与方法摘要主要试剂、仪器、细胞系/生物材料,以及核心实验步骤概述
3. 主要结果与数据解读CSV 数据的定量分析、统计结果(如适用)、关键图表描述
4. 质控与注意事项实验中的质控措施、是否出现异常、对照组验证情况
5. 结论与意义实验结果的主要结论及其科学意义
6. 下一步建议基于当前结果,AI 建议的后续实验方向或需要验证的问题

自定义报告内容

在生成前可以通过自然语言指令自定义报告:

prompt
请生成一份实验报告,要求:
1. 使用英文撰写
2. 格式符合 Nature Methods 投稿要求(约 200 词摘要)
3. 重点突出与前期实验(EXP-2023-145)的对比
4. 数据结果部分列出具体数值(均值 ± SD)
5. 不需要包含「下一步建议」章节

重要

AI 生成的报告草稿需要研究人员仔细审阅,确认数据解读正确。禁止直接将未经审阅的 AI 摘要用于签署或合规报告中。AI 可能会基于不完整数据做出不准确的统计推断。

异常检测

当你向实验附件上传 CSV 数据文件后,AI 异常检测功能在后台自动运行,帮助你发现潜在的数据问题。

检测算法和启发式规则

PonyLab 使用以下统计方法识别数值型数据中的异常:

方法原理适用场景
Z-score|z| > 3 标记为异常(距均值超过 3 个标准差)正态分布数据,样本量 > 30
IQR(四分位数)数值超出 [Q1 - 1.5×IQR, Q3 + 1.5×IQR] 范围小样本量,非正态分布(默认方法)
序列异常相邻数据点变化幅度超过历史变化率 3 倍时间序列数据
空值和格式错误检测非数值字符、混合格式、隐藏空格数据录入质量检查

如何解读检测结果

检测完成后,AI 助手面板显示汇总报告,CSV 预览中异常单元格高亮显示(黄色 = 疑似异常,红色 = 严重异常):

疑似异常(黄色)

Z-score 2–3 或 IQR 边界附近。可能是正常变异,建议人工核查

严重异常(红色)

Z-score > 3 或明显超出 IQR 边界。很可能是数据录入错误或实验问题

格式问题(灰色)

非数值字符、空值等数据格式问题,需要检查数据录入规范

处理误报(False Positives)

并非所有被标记的数据点都是真正的错误。处理误报的方法:

  1. 在 CSV 预览中右键异常单元格,选择「标记为已确认(非异常)」,AI 将在本次会话中忽略该点。
  2. 调低敏感度:在 AI 助手面板选择「敏感度:低」,异常检测阈值更宽松(Z-score 阈值从 2.5 提高到 3.5)。
  3. 在实验笔记中注释说明:记录该数据点为预期的极端值(如正对照、特定处理组的预期高值)。

提示

在 CSV 列名中加入单位信息(如 IC50_uM 而非 column3),AI 可以给出更准确的生物学解读,减少误报。

协议解析(文本输入)

AI 可以从非结构化文本中提取操作步骤,自动创建结构化 SOP 协议,避免手动录入每一个步骤。

支持的输入格式

  • 论文 Methods 部分:直接粘贴论文中的实验方法描述(中英文均支持)
  • 产品说明书文字:试剂盒、抗体说明书中的操作步骤
  • 操作流程描述:任何以步骤形式编写的操作说明
  • 手写记录的数字化文本:扫描 OCR 后的实验笔记文字

解析步骤

  1. 进入 协议 → 新建协议,点击「AI 解析文本」选项卡。
  2. 在文本框中粘贴源文本(无长度限制,但超过 8,000 字符时解析时间会增加)。
  3. (可选)指定协议类型(细胞培养 / 分子生物学 / 分析化学 / 其他),帮助 AI 正确理解领域术语。
  4. 点击「开始解析」,等待 5–15 秒。
  5. AI 生成结构化步骤列表,每个步骤包含:步骤编号、操作描述、试剂/仪器、注意事项(如有)、预期结果(如有)。
  6. 在编辑器中逐步审核,拖拽调整顺序,编辑或删除不适用的步骤。
  7. 确认无误后点击「创建协议草稿」,协议进入草稿状态,等待 PI 审核和发布。

示例:输入与解析输出

输入文本(来自论文方法部分)
“Cells were seeded at 5×10⁴/well in 96-well plates and incubated overnight at 37°C with 5% CO₂. Compounds were diluted to the desired concentrations in DMSO (final concentration ≤0.1%) and added to cells. After 72 hours of treatment, cell viability was measured using the MTT assay: 10 µL of 5 mg/mL MTT solution was added to each well, incubated for 4 hours, followed by aspiration of the medium and addition of 100 µL DMSO to dissolve the formazan crystals. Absorbance was measured at 570 nm using a microplate reader.”
AI 解析输出(结构化步骤)
步骤 1将细胞以 5×10⁴/孔的密度接种到 96 孔板中
步骤 2在 37°C、5% CO₂ 条件下培养过夜(约 16–18 小时)
步骤 3将化合物用 DMSO 稀释至目标浓度(DMSO 终浓度 ≤0.1%)
步骤 4向孔中加入化合物,处理 72 小时
步骤 5向每孔加入 10 µL MTT 溶液(5 mg/mL),继续孵育 4 小时
步骤 6吸去培养基,向每孔加入 100 µL DMSO 溶解甲瓒晶体
步骤 7用酶标仪在 570 nm 处测量吸光度

协议解析(PDF 上传)

支持的 PDF 类型

文字型 PDF(推荐)

由 Word/LaTeX 导出的 PDF,文字可被程序读取。解析准确率 >90%。

扫描型 PDF

印刷文件扫描而成。PonyLab 会先 OCR 识别文字,再解析。建议扫描分辨率 ≥300 DPI。

仪器手册(含图表)

含操作步骤图的 PDF。AI 会分析图表内容,但纯图片步骤可能缺失,需人工补全。

试剂盒说明书

通常格式规整,解析效果最好。建议选择最新版本的说明书 PDF。

PDF 上传与解析步骤

  1. 进入 协议 → 新建协议 → AI 解析 PDF
  2. 点击「选择 PDF 文件」,上传 PDF(最大 20 MB,最多 100 页,超过 100 页的 PDF 只解析前 100 页)。
  3. (可选)在「页面范围」输入框中指定要解析的页码范围(如 5-25),适合只有部分页面包含操作步骤的情况。
  4. (可选)选择协议类型(帮助 AI 理解领域术语)。
  5. 点击「上传并解析」。上传和解析通常需要 15–60 秒(取决于文件大小)。
  6. AI 返回结构化步骤,同时列出从 PDF 中提取的试剂清单和仪器清单。
  7. 在编辑器中审核和修改,然后保存为协议草稿。

注意

PDF 内的图片中嵌入的操作步骤(如带箭头的操作示意图)可能无法完整提取。建议上传后仔细检查提取结果,对照原 PDF 补充缺失的步骤。

自然语言数据查询(NL2SQL)

自然语言查询(NL2SQL)让你通过说话一样的方式跨全团队数据进行复杂检索,无需了解数据库结构或 SQL。

工作原理

PonyLab 的 NL2SQL 工作流程分三步:

  1. 解析自然语言:AI 理解你的查询意图,识别关键实体(实验、样品、时间范围等)和条件(过滤、分组、排序)。
  2. 生成安全 SQL:AI 构建只读 SQL 查询,自动附加 WHERE team_id = ? 条件,确保数据隔离。生成的 SQL 在执行前会经过安全白名单验证,禁止 INSERT/UPDATE/DELETE。
  3. 返回结构化结果:查询结果以表格或图表形式显示,并提供可下载的 CSV 导出。

15 个示例查询

1上个月所有使用 HEK293T 细胞且 IC50 低于 10 µM 的实验
2找出所有还没签名的已完成实验,按研究方向分组
3库存中哪些试剂 3 个月内没有使用记录?
4本季度每位研究员各完成了多少个实验?
5所有已过期或 7 天内即将过期的试剂
6张三负责的所有未完成任务,按截止日期升序排列
7上周新建的样品列表,包括存储位置
82025 年全年每月实验完成数量的趋势
9所有与「BRCA1」相关的实验(搜索实验标题和内容)
10哪些实验使用了仪器 HPLC-001 并且有数据附件
11本月创建但超过 14 天仍处于草稿状态的实验
12库存量低于安全库存阈值的所有条目,按剩余量升序
13最近 6 个月签名数量最多的 5 位研究员
14有偏差记录的实验执行(来自协议执行),按偏差严重程度排列
15所有 CAPA 中,状态为「进行中」且已超过截止日期的

NL2SQL 的局限性

重要

以下类型的查询可能无法正确执行:

  • 非常模糊的条件:如「找出好的实验」(「好」没有可量化的定义)
  • 需要跨团队数据的查询:所有查询严格限制在当前团队,不支持跨团队比较
  • 需要计算 CSV 内数值的查询:如「找出 IC50 低于 5 的实验」——CSV 内的数据列不被索引,NL2SQL 只能搜索实验元数据字段
  • 预测型查询:如「下个月哪些试剂会缺货」——这类需求应使用 AI 库存预测功能
  • 超出数据库字段的推断:如「找出质量最好的实验」——系统只能基于已录入的结构化字段查询

注意

自然语言查询的准确率取决于实验数据的录入质量(字段完整性、命名规范性)。建议团队制定数据录入规范,以提升 AI 查询效果。

库存需求预测

AI 分析过去 90 天的库存消耗历史,为每个库存条目生成前瞻性预测,帮助你在库存耗尽前及时补货。

分析的数据内容

  • 历史消耗记录:过去 90 天所有 OUT 和 ADJUST 类型的库存调整记录
  • 当前库存量:实时数量 vs. 安全库存阈值
  • 消耗频率模式:工作日 vs. 周末、季节性波动(实验旺季)
  • 采购提前期:你在库存条目上设置的 Lead Time(如 14 天),纳入预测补货触发点

如何解读预测结果

预测字段含义注意事项
预计耗尽日期基于历史平均消耗速率,预测当前库存在哪天降为 0高置信区间时可信;消耗极不规律时置信度低
建议补货触发日期= 预计耗尽日期 - 采购提前期(Lead Time)确保设置了准确的 Lead Time
建议补货量基于 30 天的预测消耗量 + 安全库存缓冲参考建议,根据实际采购单位(如整盒/整箱)调整
消耗趋势折线图:过去 90 天实际消耗量 vs. 预测线若实际线波动很大,预测精度有限
置信度高/中/低。基于历史数据的充足程度和规律性置信度「低」时,以人工判断为主

准确性预期

库存预测的准确性取决于数据质量:

高准确率场景

消耗规律(每周固定用量)、历史数据充足(90天+)、Lead Time 已设置

中等准确率场景

消耗有一定波动、历史数据 30–90 天、季节性因素明显

低准确率场景

消耗极不规律(如按项目批量使用)、历史记录少于 30 天、新加入的库存条目

数据隐私与安全

PonyLab 对 AI 功能采取「数据最小化」原则,并遵循 Anthropic、OpenAI 的 API 数据处理承诺。

安全措施具体实现
数据不用于训练通过 Anthropic / OpenAI 的 API 发送的数据不用于训练其模型(这是企业 API 服务条款的明确条款)
传输加密所有 API 请求通过 HTTPS/TLS 1.3 加密传输
API Key 加密存储API Key 以 AES-256-GCM 加密后存储在数据库中,解密密钥存储在独立的密钥管理服务中
最小化数据发送只发送当前分析所需的数据片段,不发送整个团队数据库的内容
服务端代理所有 AI 请求通过 PonyLab 服务端发起,API Key 从不暴露在前端或浏览器中
AI 功能可关闭SUPER_ADMIN 不配置 API Key 时,所有 AI 功能入口自动隐藏,不发生任何 AI 调用

HIPAA / GDPR 注意事项

注意

PonyLab 本身符合 GDPR 基本要求,但将数据发送给第三方 AI 服务商可能涉及数据处理协议(DPA)问题:
  • 处理患者数据(PHI)的机构:使用 AI 功能前,请确认你使用的 AI 服务商已与你签署 BAA(Business Associate Agreement)协议
  • GDPR 数据主体在欧盟的机构:Anthropic 和 OpenAI 的 API 服务器位于美国,数据跨境传输需要依据 SCC(标准合同条款)
  • 企业版私有化部署可以连接本地部署的 LLM(如通过 Ollama),完全消除数据出境问题

费用管理

各功能估算 Token 消耗

功能输入 tokens(估算)输出 tokens(估算)单次费用(Sonnet)
实验对话(单轮)2,000–8,000300–800~$0.03–0.12
报告生成3,000–10,000800–2,000~$0.05–0.20
异常检测500–3,000200–500~$0.01–0.05
协议解析(文本)1,000–5,000500–1,500~$0.02–0.10
协议解析(PDF 10页)5,000–15,000500–1,500~$0.07–0.20
NL2SQL 查询300–800100–200~$0.003–0.01
库存预测(单个条目)200–500100–200~$0.002–0.007

以上为估算值,实际费用因实验内容长度、模型版本和提供商定价变动而有所不同。

如何监控和控制用量

  • PonyLab 月度上限:在「设置 → AI 配置」中设置月度美元上限,超出后 AI 功能暂停。
  • AI 服务商后台限额:在 Anthropic/OpenAI 控制台中也设置每月限额,双重保险。
  • 功能级别开关:可以选择性开启/关闭某些 AI 功能(如关闭 PDF 解析,仅保留对话功能),减少高费用功能的使用。
  • 使用 Haiku 模型:将非核心功能(异常检测、NL2SQL)切换为 claude-3-haiku,费用降低约 10 倍。

提示

一个 10 人团队,每天平均 5 次 AI 对话 + 2 次报告生成,月费用约 $20–50(使用 Sonnet 模型)。将辅助功能切换为 Haiku 后可降低到 $10–20。

常见问题

PonyLab 会访问我的 AI 服务商账户的其他数据吗?
不会。PonyLab 只使用你提供的 API Key 发起 AI 请求,不会访问你的 AI 服务商账户设置、账单信息或其他项目/组织的数据。API Key 只有调用模型的权限,没有账户管理权限。
如果我的 API Key 到期或被撤销,会发生什么?
AI 功能调用会立即失败,你会在 AI 助手面板看到「API 连接错误」提示。其他非 AI 功能(实验记录、样品管理等)不受影响,正常使用。更新 API Key 后 AI 功能立即恢复。
AI 对话历史记录是否保存?
当前会话的对话历史在会话期间保存(用于多轮对话上下文),但关闭 AI 面板或刷新页面后默认清除。不同实验之间的 AI 对话相互独立。Enterprise 版本可以选择开启「对话历史持久化」,保存过去 30 天的对话记录。
多个成员同时使用 AI 功能会互相干扰吗?
不会。每个 AI 请求独立处理,成员之间的 AI 对话完全隔离,不共享对话上下文。但所有 AI 请求使用同一个 API Key 计费,高并发使用时费用会相应增加。
AI 异常检测会自动修改我的实验数据吗?
不会。AI 异常检测是纯只读操作,只添加内联注释(黄色高亮和说明文字),不会修改原始数据。你可以随时隐藏或清除这些注释,对原始数据没有任何影响。
NL2SQL 生成的 SQL 会修改数据库数据吗?
不会。NL2SQL 生成的所有 SQL 查询都是 SELECT 语句,经过安全白名单验证(禁止 INSERT/UPDATE/DELETE/DROP 等写操作)。即使 AI 生成了错误的查询语法,也不会修改任何数据。
AI 功能是否支持多语言?
是的。PonyLab 的 AI 功能支持中英文混合输入,输出语言跟随你的输入语言。如果你用中文提问,AI 用中文回答;如果你要求生成英文摘要,AI 会生成英文内容。Anthropic Claude 在中文理解和输出方面表现最好。
可以在离线环境中使用 AI 功能吗?
标准版不支持离线 AI,因为每次 AI 请求都需要连接到外部 API。企业版私有化部署可以接入本地部署的 LLM(如通过 Ollama 运行 Qwen 或其他开源模型),在隔离网络环境中使用 AI 功能,但需要额外的 GPU 硬件资源。

故障排查

问题:点击「验证连接」时提示 401 Invalid API Key

解决步骤

  1. 确认 API Key 完整复制(无空格或换行符),尝试重新复制粘贴
  2. 检查选择的服务商是否与 API Key 格式匹配(Anthropic Key 以 sk-ant- 开头,OpenAI Key 以 sk-proj- 开头)
  3. 在服务商控制台确认该 API Key 的状态为「Active」而非「Revoked」
  4. 确认你的服务商账户有足够的余额/配额(新账户需要充值后才能调用)

问题:AI 对话返回结果但内容质量很差或不相关

解决步骤

  1. 检查当前使用的模型(设置 → AI 配置 → 默认模型),建议换用更强的模型(如 claude-3-5-sonnet)
  2. 提示词添加更多上下文和具体要求(参考本页「提示词使用建议」章节)
  3. 如果实验内容很长,AI 可能只处理了前 50,000 字符,可以在对话中明确指引 AI 关注哪些部分

问题:异常检测没有运行(上传 CSV 后没有出现异常标注)

解决步骤

  1. 确认 CSV 文件有数值型列(纯文本或日期列不参与异常检测)
  2. 检查 CSV 文件大小,超过 10 MB 的文件可能需要更长时间处理
  3. 在 AI 助手面板手动点击「重新分析异常」按钮触发
  4. 确认 SUPER_ADMIN 已开启「自动异常检测」选项(设置 → AI 配置)

问题:协议 PDF 解析结果不完整或缺少很多步骤

解决步骤

  1. 检查 PDF 是否为扫描型(图片 PDF),扫描质量低于 300 DPI 会导致 OCR 识别率差
  2. 尝试通过「页面范围」只解析包含操作步骤的页面,减少干扰内容
  3. 如果操作步骤以图示形式展示(如箭头说明图),AI 可能无法完整提取,需手动补充
  4. 将 PDF 先用 Adobe 或在线工具转为 Word 格式,再复制文字用文本解析方式处理

问题:NL2SQL 查询返回错误结果或空结果

解决步骤

  1. 尝试更精确的描述,加入具体的字段名(如「状态为 COMPLETED 的实验」比「完成的实验」更精确)
  2. 检查时间范围描述,「上个月」的起止日期依赖系统时间,若有疑问改用具体日期(如「2026 年 2 月」)
  3. 某些复杂查询(如多层嵌套条件)建议拆分为多个简单查询
  4. 查看 AI 助手面板中「生成的查询条件」部分,确认 AI 理解的条件是否正确

问题:AI 功能已配置但团队成员看不到 AI 入口

解决步骤

  1. 确认团队已升级为专业版或企业版(AI 功能在免费版不可用)
  2. 成员角色为 TECHNICIAN 时,部分 AI 功能不可用(参见权限矩阵)
  3. 刷新页面后重试(首次配置 API Key 后,权限状态可能需要几秒钟同步到客户端)

问题:AI 报告生成中途报错「Context too long」

解决步骤

  1. 实验内容过长(超过 ~50,000 字符)超出了模型的上下文窗口
  2. 将实验拆分为多个子实验,或在生成报告前先精简不必要的附件和冗余内容
  3. 对于长实验,可以先让 AI 分章节总结,再汇总成报告

问题:库存预测显示「数据不足,无法生成预测」

解决步骤

  1. 该库存条目的历史调整记录少于 30 天,积累更多数据后自动可用
  2. 确保历史库存调整都已正确录入(OUT 类型记录),而不是直接修改库存数量
  3. 置信度「低」的预测仍会显示,但应以人工判断为主