单细胞大模型应该进入流程,而不是停在演示里

单细胞大模型的价值不只是给一个 embedding,或者在示例数据上展示分类效果。它应该进入真实流程,参与细胞状态解释、扰动预测、跨数据集迁移和证据排序。

模型一旦离开数据语境,就很容易变成孤立判断。OmicOS 要做的是把模型放回任务链路里:它知道输入数据是什么,知道前面的质控和整合发生了什么,也知道后面的证据需要交付给谁。

模型需要上下文

一个模型判断是否可信,取决于它看到的上下文是否完整。

  • 样本来源与组织背景
  • 数据质量与批次结构
  • 使用过的工具和参数
  • 预测任务与限制条件
  • 后续验证和审阅方式

从预测到证据

在虚拟扰动和药物筛选里,模型输出只是中间层。真正需要交付的是为什么这个候选值得继续看、哪些细胞状态支持这个判断、哪些限制条件必须保留。

OmicOS 把模型输出组织成可复查的证据,而不是让它停在一个不可追踪的分数里。