主成分可以用已有的一个或多个变量表示。 比如,可以使用生素C这个变量来区分不同的食物。因为蔬菜含维生素C而肉类普遍缺乏,所以可以通过维生素C这个变量区分蔬菜和肉类,但是无法进步区分不同的肉类。

为了进一步区分不同的肉类,可以选择把脂肪含量作为第2个变量,因为肉类含有脂肪,而大部分蔬菜则不然。由于脂肪和维生素C的计量单位不同,因此在组合之前,必须先对它们进行标准化。

标准化类似于使用百分位数表示每个变量,以此将所有变量统到个标准尺度上。这样一来,就可以产生一个新变量:维生素C-脂肪。

主成分分析算法总是生成正交主成分,即成分之间存在正交关系。然而,这个假设可能不正确,因为信息维度之间可能不存在正交关系。为了解决这个问题,可以使用另一项技术,即独立成分分析。独立成分分析不需要其成分之间存在正交关系,但是禁止它们所包含的信息发生重叠。这使得每个独立成分所揭示的与数据集有关的信息都是唯一的。除了不需要假设正交关系,独立成分分析在确定成分时还无须考虑数据的散度。