2025年版中国药典四部9097 分析数据的解释与处理指导原则(新增)

关键词:2025年版中国药典在线查询、四部、指导原则

· 中国药典四部指导原则

本文就2025年版中国药典四部新增的9097 分析数据的解释与处理指导原则展开说明。

制定说明

一、目的和意义

分析数据的科学解释和/或评价直接关系到产品质量的最终决策是否科学可靠。无论是对检测产品的方法评估,还是科学地使用所建方法去评价产品,都需要对所获得数据进行解释和处理,以便做出科学的决策。因此,分析数据的解释与处理对药品研发、生产和检验检测,都是不可或缺的一环,是对药品全生命周期中质量保障的基础或支柱内容。

目前《中国药典》各论中已经引入了较多的统计术语和统计计算方法/原理,需要制定一个专门涵盖药典中所需统计分析方法的通用性指导原则以供规范应用。建立分析数据的解释与处理指导原则,可以指导药品领域选择科学可靠的统计方法,给出如何利用统计分析方法对药品生产工艺和产品进行规范地决策;也为使用数据评估药品质量提供一个科学、可接受的监管方向。

二、主要内容

本指导原则参考国内外相关标准进行构建,为药典中使用的统计提供基本原理、数据分析和处理方法。主要内容包括前言、描述性统计、推断性统计、基本统计原理、常用统计方法等。

药品质量保证的实践活动,包括严格的工艺和处方设计、研发、验证以及执行稳健的控制策略,这些活动都依赖于可靠的检测数据及统计学分析方法。

前言

统计方法的选择应根据研究目的、实验设计和数据特点进行具体的选择。可靠的检测数据依赖于规范的实验室活动,而恰当地将统计分析方法应用在产品全生命周期的控制策略中,可以进一步确保评价产品质量的结论可靠性。

本指导原则提供了对分析数据进行决策时的基本统计规范,包括对分析数据的描述性统计、推断性统计、基本统计原理及常用统计分析方法等,有助于科学规范地对分析数据进行处理、解释和科学呈现。

需要注意的是,除本指导原则所述的统计学方法外,其他合理的统计学方法也可由使用者根据自己的判断去使用;本指导原则所提供数据/表格没有规定单位,其量纲仅用于说明计算方法的通用性,不直接与具体产品或检测方法相关;本指导原则所提供的计算方式得到的结果不与产品的安全性和有效性直接相关,还需要结合具体产品的药理毒理及临床监测信息一同做出判定。

描述性统计主要用于对数据集进行概括和描述,它包括对总体数据和样本数据的描述。在药品领域,描述性统计主要关注样本数据,涉及统计量、统计表和统计图。统计量进一步分为集中趋势和离散程度统计量。集中趋势统计量包括算术均值(M)、几何均值(GM)和中位数或第50百分位数;而离散程度统计量包括极差(R)、方差(S²)、标准差(S 或 SD)、标准误差(Se)和变异系数(CV)。此外,Z-分数(Z)用于识别数据中的异常值。

统计表涵盖描述连续性数据的频数统计表、描述离散性数据的列联表和汇总统计表。统计图则包括直方图、箱线图、Q-Q图等,这些图形工具有助于直观地描述和解释数据集。直方图用于展示数据集的频率或相对频率分布,箱线图用于描述数据的分布状态和识别潜在的异常值,残差图则用于模型构建后评估模型拟合优度的诊断。

描述性统计的这些工具和方法为科学规范地处理、解释和呈现分析数据提供了基础统计规范。

推断性统计

推断性统计是通过随机样本获取的信息来推断总体特征的过程。它主要包括三种方法:频率推断法贝叶斯推断法可信推断法。主要介绍频率推断法,而贝叶斯推断法将在其他部分进行专门介绍,并与频率推断法进行比较。可信推断法目前已很少使用。

推断性统计的基本问题可以分为两大类:一类是对总体的未知参数进行估计;另一类是关于参数的假设检验。

总体参数估计

点估计值、区间估计值和分布估计值是数值型估计值的三种类型。

  • 置信区间是未知总体参数的区间估计,提供了参数估计的不确定性信息。
  • 预测区间是根据样本结果预测未来样本结果所处的范围。
  • 容忍区间是正态分布下,至少有指定比例的样本数据所处的区间。
  • 假设检验

假设检验是用于决定是否拒绝原假设的过程,包含原假设和备择假设。

  • 检验统计量是在原假设下概率分布已知的样本观测值计算得到的量值。
  • 显著性水平是否定原假设的概率,常用的有α = 0.05、0.01和0.001。
  • 假设检验中可能出现两类错误:I型错误(拒绝真实的原假设)和II型错误(未能拒绝错误的原假设)。
  • 差异显著性假设检验步骤包括制定统计假设、建立检验统计量的分布,以及比较其与其他相同或类似假设的检验性能。
  • 基本统计原理

正态分布:正态分布的概率密度函数曲线呈钟型,左右对称,也称为高斯分布或钟形曲线。正态分布在很多连续型数据的分析中是基础,如t检验、方差分析等,这些分析通常要求数据服从或近似正态分布。正态分布的检验方法包括图示法和非参数检验方法等。

自由度:统计学中的自由度是指在估计总体参数时,样本中独立或能自由变化的变量的个数。例如,在计算样本方差时,由于要计算样本均值以替代总体参数,故会损失一个自由度。

抽样与样本量:抽样的有效性至关重要,以减小偏倚的影响。随机抽样被认为是最合适的抽样方法,其中简单随机抽样是最直接的类型。样本量的确定是研究计划中的重要考虑因素,以获得稳健的估计值。

测量不确定度:测量不确定度表征被测量值的离散性,考虑并结合了与测量过程相关的系统误差和随机误差。评定测量不确定度的目的是增加对测量过程的理解,并找出减小测量不确定度的策略。

统计学分析基本假设:大多数统计量和假设检验基于以下假设,测量结果所属总体符合正态分布、结果独立、并且没有异常值。如果这些假设不成立,可能需要改用其他方式进行数据评估。

常用统计方法

控制图:用于监控生产过程和分析方法的性能,包括单值-移动极差图(I-MR)、均值-极差图(X-R)、均值-标准差图(X-S)和指数加权移动平均图(EWMA)等类型。

过程能力分析:用于评估过程满足产品质量属性限度标准要求的能力,包括过程能力指数(PCI),如Cp、Cpk、Cpu、Cpl和Cpm等短期能力指数,以及Pp、Ppk等长期能力指数。

等效性与非劣效检验:等效性检验用于证明两个方法的均值等效,非劣效检验用于证明新方法的变异度不劣于原方法。

模型和数据考量:包括模型的选择、有效数字的处理、数据转换(如对数转换和其他转换)、评估模型充分性(包括图形方法和定量方法)以及异常值的处理。

贝叶斯推断统计:与频率论统计方法相对比,贝叶斯统计提供了一种量化参数不确定性并支持基于风险决策的方法。包括参数不确定性与抽样变异性、先验分布和后验分布以及频率论和贝叶斯方法的比较。