前言

有朋友问我,福勒和柯罗斯的手表支持通过手腕收集跑步功率数据,那收集原理是什么?(威廉莎士比亚,Northern Exposure,)那个数据可靠吗?通过与Polar和Stryd的技术人员交流和查阅公开文献和测试报告,我收集了一些理解和想法,供大家参考。(大卫亚设)。

跑步功率的概念

从基础概念来说,功率代表观测对象能量变化的快慢程度。变化越快,功率越高。延伸到跑步领域,简单来说跑步功率代表跑者身体的机械能变化的速度趋势,包含身体在空间中的动能和势能的变化。但凡跑过步的朋友,都能理解跑步这个过程其实是身体向前运动,同时也在因为步幅而不断离地着地的过程。

从水平方向来看,身体的做功促使人体质心在行进方向上的动能维持;从垂直方向来看,身体的做功推动人体质心在垂直方向上周期性的升高与降低。前者代表传递给有效动能的做功,而后者则是克服重力势能的周期做功。

但这只是一个最基本的模型。在实际的跑步过程中,你的身体还需要为保持身体的平衡进行摆臂而做功,为降低身躯的摆幅而通过核心肌群做功,为克服前进方向的空气阻力而对抗风阻做功等等。因此对于不同做功类型的考量与统计,实际上导致了不同厂牌跑步功率产品对于跑步功率数据的计算差异。

跑步功率的测量基准

假设你发明了一款相机APP,可以通过拍照就测算出拍摄对象的体脂率,那么你首先要做的就是证明这个测算结果的靠谱程度。而靠谱与否,需要与对应指标的测量基准进行比较。你可以选择通过核磁共振的结果来验证,也可以选择DXA扫描来验证。同理,厂家如果宣称自己的设备可以准确测量跑步功率,那么就要和跑步功率测量基准进行比较。令人纠结的是,因为跑步功率真正进入应用层面的时间尚短,并没有一个毫无争议的测量基准。最为常见的是测力板和代谢车这两种方式,而这代表了两种路线,因此也导致不同厂家因为对于测量基准选择的差异而令设备采集的跑步功率数据出现明显的分歧。

测力板

可测量三轴轴力和力矩的测力板单元 (via: AMTI)

测力板及高速摄像机系统 (via: KISTLER)

测力板可以测量测试对象在行走或者奔跑时足部与测力板接触时的三轴轴力和力矩。结合高速摄像机,测试系统可以瞬时生成三轴受力情况,追溯身体质心(center of mass)位置和动态,计算运动周期内的机械能改变情况,同时测算出瞬时功率。

Polar 和 Stryd 有关跑步功率测量的技术白皮书 均证实采用测力板系统进行数据采集和建模,同时他们的理论起源均指向意大利生理学家Giovanni Cavagna 。Stryd 的研究方式更激进一些,用上了 AMTI 的测力跑步机。

AMTI FORCE-SENSING SIDE-BY-SIDE TREADMILL

代谢车

如果说测力板是通过对质心以及肢体空间运动的测量来计算输出的机械能功率的话,代谢车就是通过对代谢产物的监测来评估人体在训练区间内化学能输出功率。

Stryd 试验室中的代谢车 (via: Luis Orta)

测试者通过一根呼气管或者面罩与代谢监测系统连接,通过分析呼出气体中氧气、二氧化碳、水汽等指标计算测试者能量代谢情况,进而给出基于代谢的功率指标。在 Stryd 的技术白皮书中就提到使用 Parvo Medics True One 2400 代谢测量系统作为代谢能量指标的测量依据。

代谢能量或者说代谢功率,包含了跑步所消耗的机械能,也包含身体维持基本状态的必要代谢能量,包括因运动带来的体温升高和热量逸散。这个指标主要用于修正测力板系统得出的机械能数据。因为代谢功率涵盖了训练时间段内的全部能量消耗,但是机械功率可能并不能反映身体为跑步而作出的所有做功。因此以代谢功率减去基础代谢功率和散发的热功率,理论上可以得到更准确的跑步功率。

比较两者的话,测力板测算的功率更像汽车的马力测试台,通过对传动系统的功率监测获得对外界做功所产生的机械能;而代谢车测试则更像给汽车装个尾气分析设备,分析尾气中的燃料燃烧残留物,推算消耗的燃料,对应多少能量输出以及功率。

常见跑步功率设备类型

主流品牌的数据采集方式包括以下类型:

  • 步频器型:以 Stryd(单足) 和 RunScribe (双足)为代表;
  • 胸带型:以 Garmin HRM-PRO/TRI/RUN 为代表;
  • 腰夹型:以 Garmin RDP 为代表;
  • 手表型:以 Polar Vantage 系列手表以及 Coros 目前手表为代表。

步频器型

Stryd 的基本测量逻辑在上一节已有阐述。Stryd 本身并不依赖GPS数据,而是通过内置的高精度动作感应器来测量和记录跑步的空间动态,估算速度和功率。已知它的局限性在于其单足测量,相当于它默认双足具有良好的动态对称。

RunScribe 与 Stryd 一样,都是基于高精度动作感应器来进行惯性测量。区别在于,RS采用了双足测量的模式。而在2020年推出的新产品中,RS的测量布局由双足延伸到双足+骶骨,三个感应器进行整体测量的模式。我并没有找到RS关于其基准测量的明确说明,按照其官博上的文章,推测RS的测量基准应该基于高速摄像机。也就是说RS的量测,更多的偏向步态监测和跑步动力学。

胸带型

胸带型的功率测量以 Garmin 为主,将动作感应器与心率感应器进行了整合。按照 Garmin 的愿景,胸带的动作感应器可以测量左右平衡、触地时间、垂直振幅等。有了动作感应器采集的身体动态信息,就可以结合GPS速度来进行跑步功率计算。Garmin 的跑步功率会考虑风阻因素,但是这个风力因素除了根据身高体重推测迎风面积之外,对于自然风的影响居然是基于天气预报来给风力参数,令人惊诧。

腰夹型

腰夹型的功率测量以 Garmin RDP 为代表,Coros 先前也有一款 POD 具有类似功能。腰夹型的测量逻辑和胸带型差不多,也是测量身体的空间动态运动。只不过相较于胸带,腰夹型的设备更接近身体的质心,如果以质心作为身体运动能量的估算对象,那么腰夹型理论上更有优势。

手表型

手表型的功率测量以 Polar Vantage V 开始提出。按照技术白皮书的说法,Polar 认为其找到了腕部动态测量与跑步功率之间的强联系,因此可以通过腕部的数据采集,结合自有算法计算出高度可信的跑步功率值。但是如果 Polar 真的仅依靠腕部的采集就能计算准确的功率值,那么理论上不需要GPS数据也应该能计算数据。实际上 Polar 的跑步功率只能在室外使用,必须有GPS数据的支撑。灾难性的问题是,初次提出跑步功率的 Polar Vantage V 本身的GPS精度可以说一塌糊涂,因此它的功率数据我个人认为……

Coros 在运营一段时间 POD 之后也宣布开放手表测量跑步功率,POD的数据不再成为必要条件。坦率说我个人不是很看好手表测量跑步功率,腕部测量很难准确评估下肢的出力和身体质心的空间运动。我不确定 Polar 或者 Coros 找到了怎样的算法,但如果仅依靠腕部的摆臂数据,很难推算出整体功率。我个人猜测这两家的腕部功率方案应该参考了心率数据以及用户的最大摄氧历史数据,或者通过试验室模型的结果,强行修改了算法去拟合。

不过无论哪家的跑步功率设备,都要求用户提供身高和体重数据。通过体重可以确立质心的起算基准,而身高和体重的关系用于推测迎风面的面积,估算跑步时的空气阻力。从这个角度来说,消费级的跑步功率测量,都会通过算法对感应器的数据进行修正。

常见跑步功率设备的数据表现

由于测量方式和测量逻辑的差异,我们可以预见不同厂家的设备对于跑步功率的测量结果必然存在差异。我们首先把它们的数据摆到一起,观察一下差异。这里我引用一下 the5krunner 网站对于 Garmin 945+HRM-PRO、Coros Pace2、Polar Vantage V Titan、Stryd 这四种功率测量组合的测试记录 ,测试在一个有风的丘陵环境进行。

Coros(蓝)Garmin(紫)Stryd(棕)Polar(绿)

从四组设备的功率数据叠合图上,可以看到的一个趋势是 Garmin 与 Polar 的数据较为接近,而 Coros 与 Stryd 的数据较为接近。

Garmin (蓝)与 Polar(紫)

Garmin 的数据虽然和 Polar 趋势较为一致,不过局部的数据两者存在偏离。Polar 的数据在下坡段的功率估算似乎低于 Garmin 的数据。

Pace2 (蓝)与 Stryd(紫)以及风阻(棕)

Coros 与 Stryd 在数据趋势上保持的高度的一致性,但是遇到风阻因素时就开始出现偏离。t5k特别标注了基础风阻因素较高的节点。Coros 在有风环境与 Stryd 非常接近,但是在无风环境反而偏离幅度要更大一些。由于 Coros 并不能测算实时风力,因此我个人推测 Coros 很可能只是对 Stryd 数据进行算法拟合,而算法构建时参考的基准选择了带风阻因素的 Stryd 数据。直白一点说,Coros 可能压根没有进行测力板或者代谢车测试,而是参考 Stryd 的算法进行了套壳。

在t5k的另一篇文章中 ,则可以看到 RunScribe Plus 与Polar、Garmin、Stryd的对比数据:

Polar(蓝) RunScribe(红) Garmin(绿) Stryd(橙)

从趋势上来看,RunScribe 的数据与 Stryd 高度相关,但净值略高于后者。Polar 的表现则有较大的波动,且从数据趋势的角度来说会比 Stryd 和 RunScribe 有一些延迟。图表中后半部分 Polar 数据跳水触底是因为测试者穿过一条隧道,过程中没有GPS信号,因而 Polar 无法提供功率数值。这组数据稍有不足的地方是采集时间为2018年,不确定厂家在当下是否进行了算法方面的调整,因此可能不能代表各方产品目前的表现。

简单来说,Garmin 和 Polar 可能采用了相近的数据模型,它们的数据趋势较为相似。不过可以确认 Polar 将GPS提供的速度数据作为最高权重,而 Garmin 还能根据动作感应器提供的步频推算速度。Stryd 和 RunScribe 均采用自己基于足部量测的数据模型,数据表现至少在趋势上非常同步。RunScribe 增加骶骨位置传感器之后的功率数据我还未找到,其表现尚不明确。Coros 在放弃POD体系之后选择了一个与 Stryd 相近的模型,但其可靠性和可重现性还有待进一步的观察。

功率数据的差异

为什么 Stryd 的功率数据会显著低于 Polar 和 Garmin 的数据?有一个理论似乎可以解释这个问题。荷兰工程师 Hans van Dijk 和 Ron van Megen 撰写了一篇文章试图解释 Polar 和 Stryd 在跑步功率数值上的差异 。值得注意的是这两位工程师是《The Secret of Running》的作者,他们提出了一个通用跑步模型,而 Stryd 的数据体系与这个跑步模型高度相关。

代谢效率

在这篇文章中,作者一方面认为 Polar 的功率体系较多考虑了身体总体代谢效率GME(Gross Metabolic Efficiency)。GME因运动方式和个体差异,在入门跑者和精英跑者之间存在较大差异。假设为了数据模型的普适性 Polar 选择了一个中位数的GME对代谢车计算的总代谢功率进行修正,其结果可能会影响功率测量的结论。Polar 认为跑步时GME可能会超过25%,但文章作者不是很认同。

弹性能量回收

作者另一方面认为肌肉和肌腱的弹性能量回收可能是两种体系对于跑步功率计算结果差异的主要原因。在跑步的着地过程中,小腿的肌肉和跟腱会被压缩。如果将这些组织视作弹性体,则它们会进入一个受压储能的形态。在继续向前奔跑,进入蹬腿离地过程时,被压缩的肌肉和跟腱会将先前受压储存的能量释放出来。你可以理解为着地时弹簧被压缩,离地时弹簧释放,为离地这个动作贡献能量。腿部组织的储能和释放已经有一些研究进行了证实,部分文献甚至认为在单个跑步循环中,受压——释放循环在推动身体前进的机械能输出占比可达到50%。然而测力板或者高速摄像系统很可能无法观测到这种内力或者能级的变化。如果将腿部视为刚体,则测量系统只会通过测力板的三轴受力情况以及摄像系统采集的力臂变化进行总体统计。Stryd 在自身的数据模型中,考虑了这个能量循环,并将回收能量部分从总体输出中剔除,因此这很可能是造成两个体系对于功率数据计算差值的一个重要原因。这个观点我曾向 Stryd 的技术人员求证,得到了肯定的答复。

基于这篇文章,可以在一定程度上解释 Polar 或者 Garmin 与 Stryd 的功率数据差异问题。但是这只是一个理论,尚需大量的试验室数据去证明。而因为 Stryd 与作者的紧密关系以及理论体系的相关性,其结论应该更有利于 Stryd。简单一点来说,我们可以把 Polar 或者 Garmin 的功率数据视为跑步运动所产生的总体性代谢功率,而把 Stryd 的功率数据视为身体为维持跑步而产生的净机械功率。

作为用户,可能很多人并不会去纠结到底哪个体系更科学全面,更重要的是谁更加靠谱。

功率测量体系的可靠性

假设有两把尺子,其中一把的刻度从0cm开始,另一把的刻度从10cm开始,那么进行测量时,只要剩下的刻度都准确,则两把尺子都可以量出正确的结果。同理,跑步功率本质上并不是要求一个绝对值,而是要建立跑步强度和真实功率的数据关系。数据体系的可靠性,最简单的检验方式就是进行可重复性试验。

西班牙穆尔西亚大学的 Jesús G. Pallarés 教授带领团队对目前主流的跑步功率设备进行了对比测试,研究成果发布于欧洲运动科学杂志2020年4月刊 。

测试选择 Stryd+手机、Stryd+Garmin FR235、RunScribe Plus、Garmin FR935 + HRM-Tri、Polar Vantage V 五种组合进行。与手机的组合相当于 Stryd 独立工作,而与手表配对的组合则可能有手表对于数据的一些修正干扰。测试方式为五组测试,三组室内,两组室外。室内部分利用跑台分别测试不同速度、不同坡度下的功率数据的可重复性,同时通过配重背心改变测试者体重,进行重复性测试。室外部分则利用跑道进行,每25米设置一处锥形桶,根据定时播放的蜂鸣器来控制速度。测试的组间设置了足够的休息时间来避免身体疲劳积累带来的功率变化。测试结论如下:

Repeatability analyses in indoor environments (Indoor1and Indoor2) found the Stryd(App) and Stryd(Watch) as the most repeatable technologies both in speed, body weight and slope conditions(SEM≤7.4 W, CV≤2.8%, ICC≥0.980), followed by RunScribe (SEM≥30.1 W, CV≥7.4%, ICC≤0.709) and GarminRP (SEM≥47.0 W, CV≥9.4%,ICC≤0.495). In outdoor sessions, the Stryd(App) and Stryd(Watch) showed again the best repeatability values(SEM≤12.5 W, CV≤4.3%, ICC≥0.989), followedby GarminRP(SEM≥24.5 W, CV≥7.7%, ICC =0.823). In contrast, Polar V(SEM≥40.6 W, CV≥14.5%, ICC = 0.487) and RunScribe (SEM≥59.3 W, CV≥14.8%, ICC = 0.563) showed the greatest errors and the lowest repeatability (Tables I and II)

从测试结果来说,室内测试 Stryd 的可重复性表现最佳,无论是搭配手机使用还是搭配手表。RunScribe 与 Garmin 分列二三。Polar 因为必须依赖 GPS,所以无法参与室内测试。室外测试 Stryd 依旧遥遥领先,Garmin 上升至第二,RunScribe 和 Polar 垫底。

这篇文章采用的测试方式很大程度上参考了 Hans van Dijk 和 Ron van Megen 的测试模型,而这两位正是前文提到的荷兰工程师,同时也是 Stryd 数据模型的参考对象之一。因此 Stryd 在研发过程中肯定也采用过类似测试进行数据考核,似乎有一点不公平。测试本身比较严谨,只是户外部分只在跑道进行,缺少丘陵地貌的上下坡测试。不过由于 GPS 对于坡度探测的滞后性,我觉得 Polar 的成绩只会更糟。值得说明的是,Stryd 在数据变异性上稳健性,跟其他竞争者存在数量级上的差异,因此如果以此测试为参考标准的话,Stryd 就数据可重复性而言真的是一骑绝尘。

结论

引用这么多观点,事实上超出了我的预期。本来我只打算简单分析一下腕部采集功率和足部采集功率的数据差异,一时没有刹住车。我试着把观点进行一下归拢。

  1. 即便是现在,对于跑步功率的测量方式,仍然存在理论路线的分歧。遵循不同理论路线的厂家显然不可能推出共识性的跑步功率产品。
  2. 跑步功率测量的意义同样存在争议。厂家自然鼓吹功率跑法对于强度控制的精确,然而对跑步功率的测量本身就存在争议,因此诸如 Jonathan Savage(Fellrnr 的主笔)对于跑步功率测量充满负面看法 ,虽然他高度认同 Stryd。
  3. Stryd 的产品在精英跑者中具有较高的认同度,同时相关测试对其测量体系的可重复性评价正面。
  4. Garmin 的跑步功率产品依赖动作感应胸带或者RDP,其数据可重复性尚可,具备趋势参考的价值。
  5. RunScribe 的跑步功率在室内表现较好,室外测试表现一般。但相关测试基本基于 RunScribe Plus,不代表增加了骶骨测量点的新品或者 RunScribe Red。
  6. Polar 的腕部功率表现高度依赖 GPS 精度。在GPS糟糕的 Vantage V1 上,我认为其表现真的不能令人满意。Grit X 系列和 Vantage V2 对于GPS有较大的优化,可能可以改善 Polar 腕部功率的可信度。
  7. Coros 的实际测试结果与 Stryd 高度接近,但是数据趋势有违常理。且脱离额外的动作感应器去测量功率,只可能是 Polar 式的速度基准功率算法,或者通过最大摄氧量反向拟合输出功率,这已经约等于纯算法生成。
  8. 如果你是进阶跑者,认同功率跑法理论,希望购买一个靠谱的跑步功率计,那么现阶段我认为 Stryd 是最佳选择。

相关推荐